Das Crawlen von WordPress-Artikeln kann mit einem Crawling-Plugin erfolgen, beispielsweise mit dem WP-AutoPost-Plugin.
Aktivieren Sie das WP-AutoPost-Plug-in, erstellen Sie eine neue Aufgabe und richten Sie dann das Plug-in ein.
Artikel-Crawling-Einstellungen
Auf dieser Registerkarte müssen wir die passenden Regeln für den Artikeltitel und den Artikelinhalt festlegen Es wird empfohlen, die CSS-Selector-Methode zu verwenden. Die Verwendung dieser Methode ist einfacher und präziser.
Wir müssen nur den CSS-Selektor für den Artikeltitel und den CSS-Selektor für den Artikelinhalt festlegen, um den Artikeltitel und den Artikelinhalt genau zu erfassen.
In den Artikelquelleneinstellungen nehmen wir die Sammlung von „Sina Internet News“ als Beispiel. Hier werden wir dieses Beispiel noch zur Erläuterung verwenden, indem wir die Listen-URL http://roll.tech.sina anzeigen .com.cn/internet_worldlist/ Der Quellcode eines bestimmten Artikels kann unter index.shtml einfach festgelegt werden. Beispielsweise können wir den Quellcode eines bestimmten Artikels http://tech.sina.com.cn/i/ überprüfen. 2013-10-18/22298831229.shtml Der Code lautet wie folgt:
Wie Sie sehen können, befindet sich der Artikeltitel innerhalb des Tags mit der ID „artibodyTitle“, also Der CSS-Selektor für den Artikeltitel muss nur auf #artibodyTitle gesetzt werden Sie können sehen, dass sich der Artikelinhalt im Tag mit der ID „artibody“ befindet. Der CSS-Selektor für den Artikelinhalt muss daher nur auf #artibody gesetzt werden, wie unten gezeigt:
Nachdem die Einstellung abgeschlossen ist, können Sie auf die Testschaltfläche klicken und die Testadresse eingeben. Wenn die Einstellung korrekt ist, werden der Artikeltitel und der Artikelinhalt angezeigt, um die Überprüfung zu erleichtern, ob die Einstellungen korrekt sind.
Weitere technische Artikel zum Thema WordPress finden Sie in der Spalte
WordPress-Tutorials, um mehr darüber zu erfahren!
Das obige ist der detaillierte Inhalt vonSo scrapen Sie WordPress-Artikel. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!