抓取WordPress文章可以使用抓取外掛程式來完成,例如使用WP-AutoPost外掛程式。
啟用WP-AutoPost外掛程式然後建立新的任務,然後對外掛程式進行設定即可。
文章抓取設定
在該選項卡下, 我們需要設定文章標題和文章內容的匹配規則,提供兩種方式進行設置,建議使用CSS選擇器方式,使用該方式更為簡單,精確。
我們只需要設定文章標題CSS選擇器與文章內容CSS選擇器,即可準確抓取文章標題與文章內容。
在文章來源設定裡,我們以收集」新浪互聯網新聞「為例,這裡還是以此範例講解,透過查看列表網址http://roll.tech.sina.com.cn/internet_worldlist/ index.shtml下某一篇文章的源代碼即可輕鬆設置,例如,我們通過查看某篇具體文章http://tech.sina.com.cn/i/2013-10-18/22298831229.shtml的源程式碼,如下所示:
可以看到,文章標題在id為「artibodyTitle」的標籤內部,因此文章標題CSS選擇器只需要設定為 #artibodyTitle 即可;
一樣的,找到文章內容的相關程式碼:
可以看到,文章內容在id為「artibody」的標籤內部,因此文章內容CSS選擇器只需設定為 #artibody 即可;如下所示:
設定完成之後,可點選測試按鈕,輸入測試位址,若設定正確,將顯示出文章標題和文章內容,方便檢查設定是否正確。
更多wordpress相關技術文章,請造訪wordpress教學欄位進行學習!
以上是如何抓取WordPress文章的詳細內容。更多資訊請關注PHP中文網其他相關文章!