python – Verwenden Sie das Scrapy-Framework, um Baidu-Bilder zu crawlen und blockiert zu werden

Question

Die Anforderungsadressen-URL ist die über Firefox erhaltene JSON-Adresse. Sie kann mit einem Browser geöffnet werden, wurde jedoch beim Crawlen mit Scrapy gesperrt. https://image.baidu.com/searc...

黄舟 · Answer

在 settings.py 将 ROBOTSTXT_OBEY = False 试试。

某草草 · Answer

不要加hearders试试

为情所困 · Answer

赞成楼上，如果还会被墙。可采用scrapy+selenium+phantomjs的方式。