Robot d'exploration Web - L'adresse IP du proxy définie par le robot Python request.get n'a pas changé
typecho
typecho 2017-06-12 09:24:11
0
1
1214

Mon travail nécessite d'explorer des informations sur Amazon, mais l'anti-crawler d'Amazon est trop puissant et la même adresse IP sera bloquée.
Version Python : 3.6, IDE : Pycharm 2017.1
J'ai vérifié beaucoup d'informations sur Internet et lu le manuel de la bibliothèque de requêtes, mais ce sont toutes la même méthode. Le code est le suivant :

import requests
'''代理IP地址(高匿)'''
proxy = {'HTTPS': '117.85.105.170:808'}
'''head 信息'''
head = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36', 
    'Connection': 'keep-alive'}
'''http://icanhazip.com会返回当前的IP地址'''
p = requests.get('http://icanhazip.com', headers=head, proxies=proxy)
print(p.text)

Selon la théorie de nombreux tutoriels que j'ai lus, si le proxy est configuré avec succès, la dernière IP affichée devrait être l'adresse IP du proxy, mais au final c'est toujours ma véritable adresse IP. que le proxy n'est pas défini ?

typecho
typecho

Following the voice in heart.

répondre à tous(1)
阿神

Les proxys utilisent les paramètres http lorsque vous accédez à http et les paramètres https lorsque vous accédez à https
Votre proxy doit donc contenir à la fois les configurations http et https pour qu'il prenne effet

proxy = {
    'http': 'http://117.85.105.170:808',
    'https': 'https://117.85.105.170:808'
}
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal