python – Die Webseite kann nach der Aktualisierung der Daten nicht erneut gecrawlt werden-Fragen und Antworten zum chinesischen PHP-Netzwerk

Artikel Thema Lernen Herunterladen Fragen und Antworten Programmierwörterbuch Spiel kürzliche Updates

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

python – Die Webseite kann nach der Aktualisierung der Daten nicht erneut gecrawlt werden

给我你的怀抱

给我你的怀抱 2017-05-18 10:58:50

0

2

539

Die Webseite, die ich gecrawlt habe, hat heute eine Information aktualisiert, und dann wurde der Crawler ausgeführt, aber er hat sie nicht gecrawlt.

from pyspider.libs.base_handler import * from pyspider.database.mysql.mysqldb import SQL class Handler(BaseHandler): crawl_config = { } @every(minutes=24 * 60) def on_start(self): self.crawl('http://www.yxztb.net/yxweb/zypd/012001/012001001/', callback=self.index_page) @config(age=10 * 24 * 60 * 60) def index_page(self, response): for each in response.doc('.tdmoreinfosub a').items(): self.crawl(each.attr.href, callback=self.detail_page) @config(priority=2) def detail_page(self, response): return { "address":"宜兴市", "url":response.url, "title":response.doc('font span').text(), "date" :response.doc('#tdTitle > .webfont').text()[8:17], } def on_result(self, result): print result if not result or not result['title']: return sql = SQL() sql.replace('zhaobiao',**result)

Ich hoffe, dass die Chefs konkreter werden und sich mehr austauschen können

给我你的怀抱

给我你的怀抱

Antworte allen (2)

我想大声告诉你

我想大声告诉你2017-05-18 11:00:50 2 Etage

@config （age）参数设定直接忽略了index.page的执行

Wie+0

Antwort hinzufügen

迷茫2017-05-18 11:00:50 1 Etage

既然 on_start 的 @every 是一天，那么self.crawl 中设置age=12 * 60 * 60半天是比较合适的，保证每次 every 肯定不会被 age 所限制。另外@config(age=10 * 24 * 60 * 60)，这是10天内不要再爬的意思啊。

Wie+0

Antwort hinzufügen

Beliebte Themen

Mehr>

Populäre Artikel

Beliebte Tutorials

Mehr>

Verwandte Tutorials

Beliebte Empfehlungen

Aktuelle Kurse

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1396404
php入门教程之一周学会PHP

4208931
JAVA 初级入门视频教程

2361238

Neueste Downloads

Mehr>

Web-Effekte

Quellcode der Website

Website-Materialien

Frontend-Vorlage

Über uns Haftungsausschluss Sitemap: Chinesische PHP-Website：Online-PHP-Schulung für das Gemeinwohl，Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln！