Liebe Python-Crawler-Experten, werfen Sie einen Blick darauf, wie Sie mit dem Anti-Crawling dieser Website umgehen können.
曾经蜡笔没有小新
曾经蜡笔没有小新 2017-05-18 11:01:00
0
4
782

https://www.every saving.co.uk
Die Daten dieser Website werden über Python gecrawlt, die Daten können jedoch nicht zurückgegeben werden! Ich habe den Header und die Proxy-IP zum Crawlen hinzugefügt, aber es hat nicht funktioniert. Ich hoffe, ihr könnt es versuchen. . .

曾经蜡笔没有小新
曾经蜡笔没有小新

Antworte allen(4)
迷茫

代理访问网站可见下图:

通过https://www.17ce.com/,发现大陆几乎都被屏蔽了,Http状态返回403。
此网站的安全策略级别比较高,建议使用欧美地区的高匿代理 VPN或者服务器,降低抓取频次。

为情所困

fiddler抓包,浏览器发什么你就发什么

迷茫

你这个地址直接通过浏览器也访问不了呀,被墙了吧?

过去多啦不再A梦

我直接点开是不能访问的,测试用了新加坡的代理可以打开

Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage