python - 爬取人大经济论坛问题
PHP中文网
PHP中文网 2017-04-18 09:45:44
0
3
377

这是搜索页
http://s.pinggu.org/search.ph...

这是请求时候看到的内容

这里有两个问题,
在form data里面有两个数据不知怎么获取。
一个是srchtxt,这个应该是搜索的那个字段,要怎么处理拼接进来。
另外一个是:formhash,这个可以在元素页面可以看到

但是这个也是在post搜索之后才有的,所以就是不知要怎么处理这两个字段。

PHP中文网
PHP中文网

认证0级讲师

membalas semua(3)
Ty80

Untuk mendapatkan formhash yang pertama, sebelum mencari, lawati sambungan http://s.pinggu.org/search.php terlebih dahulu Pada masa ini, medan formhash akan dijana. Satu lagi medan mempunyai aksara yang kacau, saya rasa sebabnya ialah halaman web ini menggunakan pengekodan gbk, jadi apabila anda lulus nilai, anda juga boleh menukar pengekodan.

Peter_Zhu

Hanya lawati formhash dua kali seperti yang dinyatakan di atas. . . Apabila merangkak sendiri, anda mesti menulis kata kunci sendiri. . . Mengapa tidak memanjat?

Peter_Zhu

srchtxt Seperti namanya, anda boleh meneka mengapa kata kunci carian teks_search muncul "tidak dapat dinyahkodkan" pada chrome Ini mungkin kerana url tidak boleh dipaparkan selepas diterjemahkan ke dalam bahasa Cina memberi kesan kepada anda semasa menghantar borang. Hanya serahkan mengikut teks anda, dan url akan ditukar secara automatik

formhash Apabila anda mendapat halaman ini, anda sudah mempunyai nilai input dahulu, dan kemudian bina url penyerahan borang

Untuk meringkaskan:

1. srchtxt = 需要搜索的内容
2. formhash = 页面字段 (在提交时先去get页面这个字段value,构造完整的表单)

   
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan