python – Beim Crawlen der CSDN-Hintergrundartikelliste sind Probleme aufgetreten, nachdem der Crawler die Anmeldung simuliert hat

Question

Der Crawler hat sich tatsächlich angemeldet, da ich persönliche Informationen crawlen und erfassen kann, aber die URL im Bild unten kann nicht erfasst werden: Die URL lautet: http://write.blog.csdn.net/postlist, was Ihre ist csdn Backstage. Lassen Sie mich den Code veröffentlichen. Der obige Code gibt Folgendes aus:

高洛峰 · Answer

因为这个地址返回的是一个302跳转，你要根据返回header的Location继续请求，再分析返回的内容继续处理，浏览器帮你做了这些302跳转和执行返回的js等内容，手工抓取就需要自己处理．

迷茫 · Answer

直接用cookie即可