python - 爬取人大经济论坛问题
PHP中文网
PHP中文网 2017-04-18 09:45:44
0
3
375

这是搜索页
http://s.pinggu.org/search.ph...

这是请求时候看到的内容

这里有两个问题,
在form data里面有两个数据不知怎么获取。
一个是srchtxt,这个应该是搜索的那个字段,要怎么处理拼接进来。
另外一个是:formhash,这个可以在元素页面可以看到

但是这个也是在post搜索之后才有的,所以就是不知要怎么处理这两个字段。

PHP中文网
PHP中文网

认证0级讲师

répondre à tous(3)
Ty80

Pour obtenir le premier formhash, avant de rechercher, visitez au préalable la connexion http://s.pinggu.org/search.php A ce moment, le champ formhash sera généré. Un autre champ contient des caractères tronqués. Je suppose que la raison est que cette page Web utilise le codage gbk, donc lorsque vous transmettez la valeur, vous pouvez également modifier le codage.

Peter_Zhu

Visitez simplement formhash deux fois comme mentionné ci-dessus
srchtxt. . . Lorsque vous explorez vous-même, vous devez écrire les mots-clés vous-même. . . Pourquoi ne pas grimper ?

Peter_Zhu

srchtxt Comme son nom l'indique, vous pouvez deviner pourquoi le mot-clé de recherche search_text apparaît "incapable de décoder" sur Chrome. C'est probablement parce que l'url ne peut pas être affichée après avoir été traduite en chinois. vous affectent lors de la soumission du formulaire. Soumettez-le simplement en fonction de votre texte, et l'URL sera automatiquement convertie

formhash Lorsque vous obtenez cette page, vous avez déjà la valeur d'entrée. Obtenez d'abord cette valeur, puis construisez l'URL de soumission du formulaire

.

Pour résumer :

1. srchtxt = 需要搜索的内容
2. formhash = 页面字段 (在提交时先去get页面这个字段value,构造完整的表单)

   
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal