Cookie bezieht sich auf die Daten (normalerweise verschlüsselt), die von einigen Websites auf dem lokalen Terminal des Benutzers gespeichert werden, um die Identität des Benutzers zu identifizieren und eine Sitzungsverfolgung durchzuführen. Bei einigen Websites ist beispielsweise eine Anmeldung erforderlich, bevor Sie auf eine bestimmte Seite zugreifen können. Vor dem Anmelden ist es unterschiedlich oder nicht zulässig, den Inhalt einer bestimmten Seite zu crawlen.
In Python stellt es uns das Cookiejar-Modul zur Verfügung, das sich zur Cookie-Unterstützung im http-Paket befindet. Dadurch können wir das Cookie erfassen und es bei nachfolgenden Verbindungsanfragen erneut senden, beispielsweise können wir die simulierte Anmeldefunktion implementieren. Die Hauptobjekte dieses Moduls sind CookieJar, FileCookieJar, MozillaCookieJar und LWPCookieJar.
So erhalten Sie Cookies
## cookie的获取 # -*- coding: UTF-8 -*- from urllib import request from http import cookiejar if __name__ == '__main__': #声明一个CookieJar对象实例来保存cookie cookie = cookiejar.CookieJar() #利用urllib.request库的HTTPCookieProcessor对象来创建cookie处理器,也就CookieHandler handler=request.HTTPCookieProcessor(cookie) #通过CookieHandler创建opener opener = request.build_opener(handler) #此处的open方法打开网页 response = opener.open('http://www.baidu.com') #打印cookie信息 for item in cookie: print('Name = %s' % item.name) print('Value = %s' % item.value)
Weitere technische Artikel zum Thema Python finden Sie in der Spalte Python-Tutorial, um mehr darüber zu erfahren!
Das obige ist der detaillierte Inhalt vonWie erhält der Python-Crawler Cookies?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!