Plusieurs méthodes de connexion simulée Python-Tutoriel Python-php.cn

Cet article présente principalement diverses méthodes de connexion simulée par Python. Il vous propose environ quatre méthodes. Chaque méthode vous est présentée en détail. Les amis intéressés devraient y jeter un œil

Texte

Méthode 1 : Utiliser directement les cookies connus pour accéder aux

Fonctionnalités :

Simple , mais vous devez d'abord vous connecter dans le navigateur

Principe :

En termes simples, les cookies sont stockés dans le client qui initie la demande et le serveur utilise des cookies pour distinguer les différents clients. Étant donné que HTTP est une connexion sans état, lorsque le serveur reçoit plusieurs requêtes à la fois, il ne peut pas déterminer quelles requêtes ont été initiées par le même client. Le comportement « d'accès aux pages qui ne peuvent être vues qu'après la connexion » nécessite que le client prouve au serveur : « Je suis le client qui vient de se connecter ». Un cookie est donc nécessaire pour identifier le client et stocker ses informations (telles que le statut de connexion).

Bien sûr, cela signifie aussi que tant que nous obtenons le cookie d'un autre client, nous pouvons prétendre l'être pour parler au serveur. Cela donne une opportunité à notre programme.

Nous nous connectons d'abord avec un navigateur, puis utilisons des outils de développement pour afficher les cookies. Ensuite, en transportant le cookie dans le programme et en envoyant une demande au site Web, votre programme peut prétendre être le navigateur auquel vous venez de vous connecter et obtenir la page qui ne peut être vue qu'après la connexion.

Étapes spécifiques :

1. Connectez-vous avec un navigateur et obtenez la chaîne de cookie dans le navigateur

Utilisez d'abord. Connexion au navigateur. Ouvrez à nouveau les outils de développement et accédez à l'onglet Réseau. Recherchez l'URL actuelle dans la colonne Nom à gauche, sélectionnez l'onglet En-têtes à droite et affichez les en-têtes de demande, qui contiennent les cookies émis vers le navigateur par le site Web. Oui, c'est la corde derrière. Copiez-le, nous l'utiliserons dans le code plus tard.

Notez qu'il est préférable de vous connecter avant d'exécuter votre programme. Si vous vous connectez trop tôt ou fermez le navigateur, il est probable que le cookie copié expire.

2. Écrire du code

Version de la bibliothèque urllib :

import sys
import io
from urllib import request
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding=&#39;utf8&#39;) #改变标准输出的默认编码
#登录后才能访问的网站
url = &#39;http://ssfw.xmu.edu.cn/cmstar/index.portal&#39;
#浏览器登录后得到的cookie，也就是刚才复制的字符串
cookie_str = r&#39;JSESSIONID=xxxxxxxxxxxxxxxxxxxxxx; iPlanetDirectoryPro=xxxxxxxxxxxxxxxxxx&#39;
#登录后才能访问的网页
url = &#39;http://ssfw.xmu.edu.cn/cmstar/index.portal&#39;
req = request.Request(url)
#设置cookie
req.add_header(&#39;cookie&#39;, raw_cookies)
#设置请求头
req.add_header(&#39;User-Agent&#39;, &#39;Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36&#39;)
resp = request.urlopen(req)
print(resp.read().decode(&#39;utf-8&#39;))

Copier après la connexion

Version de la bibliothèque de requêtes :

import requests
import sys
import io
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding=&#39;utf8&#39;) #改变标准输出的默认编码
#登录后才能访问的网页
url = &#39;http://ssfw.xmu.edu.cn/cmstar/index.portal&#39;
#浏览器登录后得到的cookie，也就是刚才复制的字符串
cookie_str = r&#39;JSESSIONID=xxxxxxxxxxxxxxxxxxxxxx; iPlanetDirectoryPro=xxxxxxxxxxxxxxxxxx&#39;
#把cookie字符串处理成字典，以便接下来使用
cookies = {}
for line in cookie_str.split(&#39;;&#39;):
 key, value = line.split(&#39;=&#39;, 1)
 cookies[key] = value

Copier après la connexion

Méthode 2 : Simuler la connexion puis apporter le cookie obtenu pour accéder à

Principe :

Nous envoyons d'abord une demande de connexion au site Web du programme, c'est-à-dire que nous soumettons un formulaire contenant les informations de connexion (nom d'utilisateur, mot de passe, etc.). Obtenez le cookie de la réponse et emportez ce cookie avec vous lorsque vous visiterez d'autres pages à l'avenir, afin que vous puissiez obtenir la page qui ne peut être vue qu'après vous être connecté.

Étapes spécifiques :

1. Découvrez la page à laquelle le formulaire est soumis

Vous devez encore utiliser l'outil de développement du navigateur. Accédez à l'onglet Réseau et cochez Conserver le journal (important !). Connectez-vous au site Web dans votre navigateur. Recherchez ensuite la page à laquelle le formulaire a été soumis dans la colonne Nom à gauche. Comment le trouver ? Regardez à droite et accédez à l'onglet En-têtes. Tout d'abord, dans la section Général, la méthode de requête doit être POST. Deuxièmement, il devrait y avoir une section appelée Données du formulaire en bas, où vous pouvez voir le nom d'utilisateur et le mot de passe que vous venez de saisir. Vous pouvez également regarder le Nom sur la gauche. S'il contient le mot login, il peut s'agir de la page sur laquelle le formulaire est soumis (pas nécessairement !).

Il convient de souligner ici que la "page à laquelle le formulaire est soumis" n'est généralement pas la page où vous remplissez votre nom d'utilisateur et votre mot de passe ! Utilisez donc les outils pour le trouver.

2. Découvrez les données à soumettre

Bien que vous n'ayez renseigné votre nom d'utilisateur et votre mot de passe que lors de la connexion dans le navigateur, le formulaire contient plus de données que cela. Vous pouvez voir toutes les données qui doivent être soumises à partir des données du formulaire.

3. Écrire du code

Version de la bibliothèque urllib :

import sys
import io
import urllib.request
import http.cookiejar
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding=&#39;utf8&#39;) #改变标准输出的默认编码
#登录时需要POST的数据
data = {&#39;Login.Token1&#39;:&#39;学号&#39;, 
 &#39;Login.Token2&#39;:&#39;密码&#39;, 
 &#39;goto:http&#39;:&#39;//ssfw.xmu.edu.cn/cmstar/loginSuccess.portal&#39;, 
 &#39;gotoOnFail:http&#39;:&#39;//ssfw.xmu.edu.cn/cmstar/loginFailure.portal&#39;}
post_data = urllib.parse.urlencode(data).encode(&#39;utf-8&#39;)
#设置请求头
headers = {&#39;User-agent&#39;:&#39;Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36&#39;}
#登录时表单提交到的地址（用开发者工具可以看到）
login_url = &#39; http://ssfw.xmu.edu.cn/cmstar/userPasswordValidate.portal
#构造登录请求
req = urllib.request.Request(login_url, headers = headers, data = post_data)
#构造cookie
cookie = http.cookiejar.CookieJar()
#由cookie构造opener
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))
#发送登录请求，此后这个opener就携带了cookie，以证明自己登录过
resp = opener.open(req)
#登录后才能访问的网页
url = &#39;http://ssfw.xmu.edu.cn/cmstar/index.portal&#39;
#构造访问请求
req = urllib.request.Request(url, headers = headers)
resp = opener.open(req)
print(resp.read().decode(&#39;utf-8&#39;))

Copier après la connexion

Version de la bibliothèque de requêtes :

import requests
import sys
import io
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding=&#39;utf8&#39;) #改变标准输出的默认编码
#登录后才能访问的网页
url = &#39;http://ssfw.xmu.edu.cn/cmstar/index.portal&#39;
#浏览器登录后得到的cookie，也就是刚才复制的字符串
cookie_str = r&#39;JSESSIONID=xxxxxxxxxxxxxxxxxxxxxx; iPlanetDirectoryPro=xxxxxxxxxxxxxxxxxx&#39;
#把cookie字符串处理成字典，以便接下来使用
cookies = {}
for line in cookie_str.split(&#39;;&#39;):
 key, value = line.split(&#39;=&#39;, 1)
 cookies[key] = value
#设置请求头
headers = {'User-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36'}
#在发送get请求时带上请求头和cookies
resp = requests.get(url, headers = headers, cookies = cookies)
print(resp.content.decode('utf-8'))

Copier après la connexion

Il est évident que la bibliothèque de requêtes est plus pratique à utiliser~~~

Méthode 3 : Utilisez la session pour rester connecté après avoir simulé la connexion

Principe :

Session signifie session. Semblable aux cookies, il permet également au serveur de « reconnaître » le client. La compréhension simple consiste à traiter chaque interaction entre le client et le serveur comme une « session ». Puisqu'ils sont dans la même "session", le serveur saura naturellement si le client s'est connecté.

Étapes spécifiques :

1. Découvrez la page à laquelle le formulaire est soumis

2. Découvrez les données à soumettre

　　这两步和方法二的前两步是一样的

3.写代码

　　requests库的版本

import requests
import sys
import io
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding=&#39;utf8&#39;) #改变标准输出的默认编码
#登录时需要POST的数据
data = {&#39;Login.Token1&#39;:&#39;学号&#39;, 
 &#39;Login.Token2&#39;:&#39;密码&#39;, 
 &#39;goto:http&#39;:&#39;//ssfw.xmu.edu.cn/cmstar/loginSuccess.portal&#39;, 
 &#39;gotoOnFail:http&#39;:&#39;//ssfw.xmu.edu.cn/cmstar/loginFailure.portal&#39;}
#设置请求头
headers = {&#39;User-agent&#39;:&#39;Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36&#39;}
#登录时表单提交到的地址（用开发者工具可以看到）
login_url = &#39;http://ssfw.xmu.edu.cn/cmstar/userPasswordValidate.portal&#39;
#构造Session
session = requests.Session()
#在session中发送登录请求，此后这个session里就存储了cookie
#可以用print(session.cookies.get_dict())查看
resp = session.post(login_url, data)
#登录后才能访问的网页
url = &#39;http://ssfw.xmu.edu.cn/cmstar/index.portal&#39;
#发送访问请求
resp = session.get(url)
print(resp.content.decode(&#39;utf-8&#39;))

Copier après la connexion

方法四：使用无头浏览器访问

特点：

　　功能强大，几乎可以对付任何网页，但会导致代码效率低

原理：

　　如果能在程序里调用一个浏览器来访问网站，那么像登录这样的操作就轻而易举了。在Python中可以使用Selenium库来调用浏览器，写在代码里的操作（打开网页、点击……）会变成浏览器忠实地执行。这个被控制的浏览器可以是Firefox，Chrome等，但最常用的还是PhantomJS这个无头（没有界面）浏览器。也就是说，只要把填写用户名密码、点击“登录”按钮、打开另一个网页等操作写到程序中，PhamtomJS就能确确实实地让你登录上去，并把响应返回给你。

具体步骤：

1.安装selenium库、PhantomJS浏览器

2.在源代码中找到登录时的输入文本框、按钮这些元素

　　因为要在无头浏览器中进行操作，所以就要先找到输入框，才能输入信息。找到登录按钮，才能点击它。

　　在浏览器中打开填写用户名密码的页面，将光标移动到输入用户名的文本框，右键，选择“审查元素”，就可以在右边的网页源代码中看到文本框是哪个元素。同理，可以在源代码中找到输入密码的文本框、登录按钮。

3.考虑如何在程序中找到上述元素

　　Selenium库提供了find_element(s)_by_xxx的方法来找到网页中的输入框、按钮等元素。其中xxx可以是id、name、tag_name（标签名）、class_name（class），也可以是xpath（xpath表达式）等等。当然还是要具体分析网页源代码。

4.写代码

import requests
import sys
import io
from selenium import webdriver
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding=&#39;utf8&#39;) #改变标准输出的默认编码
#建立Phantomjs浏览器对象，括号里是phantomjs.exe在你的电脑上的路径
browser = webdriver.PhantomJS(&#39;d:/tool/07-net/phantomjs-windows/phantomjs-2.1.1-windows/bin/phantomjs.exe&#39;)
#登录页面
url = r&#39;http://ssfw.xmu.edu.cn/cmstar/index.portal&#39;
# 访问登录页面
browser.get(url)
# 等待一定时间，让js脚本加载完毕
browser.implicitly_wait(3)
#输入用户名
username = browser.find_element_by_name(&#39;user&#39;)
username.send_keys(&#39;学号&#39;)
#输入密码
password = browser.find_element_by_name(&#39;pwd&#39;)
password.send_keys(&#39;密码&#39;)
#选择“学生”单选按钮
student = browser.find_element_by_xpath(&#39;//input[@value="student"]&#39;)
student.click()
#点击“登录”按钮
login_button = browser.find_element_by_name(&#39;btn&#39;)
login_button.submit()
#网页截图
browser.save_screenshot(&#39;picture1.png&#39;)
#打印网页源代码
print(browser.page_source.encode(&#39;utf-8&#39;).decode())
browser.quit()

Copier après la connexion