python – Verwenden Sie das Scrapy-Framework, um Baidu-Bilder zu crawlen und blockiert zu werden
给我你的怀抱
给我你的怀抱 2017-05-24 11:34:48
0
3
677

Die URL der Anforderungsadresse ist die über Firefox erhaltene JSON-Adresse. Sie kann mit einem Browser geöffnet werden, wurde jedoch beim Crawlen mit Scrapy gesperrt.

https://image.baidu.com/searc...

给我你的怀抱
给我你的怀抱

Antworte allen(3)
黄舟

settings.pyROBOTSTXT_OBEY = False 试试。

某草草

不要加hearders试试

为情所困

赞成楼上,如果还会被墙。可采用scrapy+selenium+phantomjs的方式。

Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage