Le robot Python3 apporte des cookies-Tutoriel Python-php.cn

Le robot Python3 apporte des cookies

Guanhui

Libérer： 2020-07-28 18:34:11

original

3040 Les gens l'ont consulté

Le robot Python3 apporte des cookies

La signification originale du cookie en anglais est "snack". Il s'agit des informations stockées par le serveur sur le disque dur du client lorsque celui-ci accède au serveur Web. "snack" envoyé par le serveur au client". Le serveur peut suivre le statut des clients sur la base de cookies, ce qui est particulièrement utile dans les cas où les clients doivent être distingués (comme dans le cas du commerce électronique).

Lorsque le client demande l'accès au serveur pour la première fois, le serveur stocke d'abord un cookie contenant les informations pertinentes du client sur le client. Chaque fois que le client demandera l'accès au serveur à l'avenir, le cookie le fera. être inclus dans les données de la requête HTTP En analysant le cookie dans la requête HTTP, vous pouvez obtenir des informations pertinentes sur le client.

Voyons comment les robots python3 apportent des cookies :

1 Écrivez le cookie directement dans l'en-tête

# coding:utf-8
import requests
from bs4 import BeautifulSoup
cookie = &#39;&#39;&#39;cisession=19dfd70a27ec0eecf1fe3fc2e48b7f91c7c83c60;CNZZDATA1000201968=181584
6425-1478580135-https%253A%252F%252Fwww.baidu.com%252F%7C1483922031;Hm_lvt_f805f7762a9a2
37a0deac37015e9f6d9=1482722012,1483926313;Hm_lpvt_f805f7762a9a237a0deac37015e9f6d9=14839
26368&#39;&#39;&#39;
header = {
&#39;User-Agent&#39;: &#39;Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Geck
o) Chrome/53.0.2785.143 Safari/537.36&#39;,
&#39;Connection&#39;: &#39;keep-alive&#39;,
&#39;accept&#39;: &#39;text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8&#39;,
&#39;Cookie&#39;: cookie}
url = &#39;https://www.jb51.net/article/191947.htm&#39;
wbdata = requests.get(url,headers=header).text
soup = BeautifulSoup(wbdata,&#39;lxml&#39;)
print(soup)

Copier après la connexion

2. >

# coding:utf-8
import requests
from bs4 import BeautifulSoup
cookie = {
"cisession":"19dfd70a27ec0eecf1fe3fc2e48b7f91c7c83c60",
"CNZZDATA100020196":"1815846425-1478580135-https%253A%252F%252Fwww.baidu.com%252F%7C1483
922031",
"Hm_lvt_f805f7762a9a237a0deac37015e9f6d9":"1482722012,1483926313",
"Hm_lpvt_f805f7762a9a237a0deac37015e9f6d9":"1483926368"
}
url = &#39;https://www.jb51.net/article/191947.htm&#39;
wbdata = requests.get(url,cookies=cookie).text
soup = BeautifulSoup(wbdata,&#39;lxml&#39;)
print(soup)

Copier après la connexion

Extension d'instance :

Utilisez des cookies pour vous connecter au site ACM du Harbin Institute of Technology

Obtenez l'adresse de connexion au site

http://acm.hit.edu.cn/hoj/system/login

Afficher les données de publication à transmettre

utilisateur et mot de passe

Code :

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
__author__ = &#39;pi&#39;
__email__ = &#39;pipisorry@126.com&#39;

"""
import urllib.request, urllib.parse, urllib.error
import http.cookiejar

LOGIN_URL = &#39;http://acm.hit.edu.cn/hoj/system/login&#39;
values = {&#39;user&#39;: &#39;******&#39;, &#39;password&#39;: &#39;******&#39;} # , &#39;submit&#39; : &#39;Login&#39;
postdata = urllib.parse.urlencode(values).encode()
user_agent = r&#39;Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36&#39;
headers = {&#39;User-Agent&#39;: user_agent, &#39;Connection&#39;: &#39;keep-alive&#39;}

cookie_filename = &#39;cookie.txt&#39;
cookie = http.cookiejar.MozillaCookieJar(cookie_filename)
handler = urllib.request.HTTPCookieProcessor(cookie)
opener = urllib.request.build_opener(handler)

request = urllib.request.Request(LOGIN_URL, postdata, headers)
try:
  response = opener.open(request)
  page = response.read().decode()
  # print(page)
except urllib.error.URLError as e:
  print(e.code, &#39;:&#39;, e.reason)

cookie.save(ignore_discard=True, ignore_expires=True) # 保存cookie到cookie.txt中
print(cookie)
for item in cookie:
  print(&#39;Name = &#39; + item.name)
  print(&#39;Value = &#39; + item.value)

get_url = &#39;http://acm.hit.edu.cn/hoj/problem/solution/?problem=1&#39; # 利用cookie请求訪问还有一个网址
get_request = urllib.request.Request(get_url, headers=headers)
get_response = opener.open(get_request)
print(get_response.read().decode())
# print(&#39;You have not solved this problem&#39; in get_response.read().decode())

Copier après la connexion

Tutoriel recommandé : "

Tutoriel Python》

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!