需要爬取的网页需要登陆才可以获取,但是又对爬取ip有限制,所以我想要使用代理ip进行爬取;但是我在request的session中使用proxy后无法爬取到有信息的网页,所以猜想可能是代理地址没有进行头部转发,这里想请教一下大家!
如果是从某个代理ip网站上抓取的ip,绝大部分是不可用的,可用的也因为超时等原因影响程序的稳定性,requests会自动帮你对HTTP头部的处理了,不存在你猜想的问题,应该是你代理ip的问题,看看我的使用代理ip
如果是从某个代理ip网站上抓取的ip,绝大部分是不可用的,可用的也因为超时等原因影响程序的稳定性,requests会自动帮你对HTTP头部的处理了,不存在你猜想的问题,应该是你代理ip的问题,看看我的使用代理ip