python - 爬取人大经济论坛问题
PHP中文网
PHP中文网 2017-04-18 09:45:44
0
3
378

这是搜索页
http://s.pinggu.org/search.ph...

这是请求时候看到的内容

这里有两个问题,
在form data里面有两个数据不知怎么获取。
一个是srchtxt,这个应该是搜索的那个字段,要怎么处理拼接进来。
另外一个是:formhash,这个可以在元素页面可以看到

但是这个也是在post搜索之后才有的,所以就是不知要怎么处理这两个字段。

PHP中文网
PHP中文网

认证0级讲师

全員に返信(3)
Ty80

最初の formhash を取得するには、検索する前に、事前に http://s.pinggu.org/search.php 接続にアクセスします。このとき、フォームハッシュ フィールドが生成されます。別のフィールドが文字化けしているのは、この Web ページが gbk エンコーディングを使用しているためだと思います。値を渡すときにエンコーディングも変更できます。

いいねを押す +0
Peter_Zhu

上記のように、formhash に 2 回アクセスするだけです。
srchtxt。 。 。自分でクロールする場合は、キーワードを自分で書く必要があります。 。 。登ってみませんか?

いいねを押す +0
Peter_Zhu

srchtxt 名前が示すように、Chrome で search_text の検索キーワードが「デコードできません」と表示されるのは、おそらく URL が中国語に翻訳された後に表示できないためであると推測できます。フォームを送信するときにテキストに従って送信するだけで、URL が自動的に変換されます

formhash このページを取得すると、最初にこの値を取得してから、フォーム送信 URL

を構築します。

要約すると:

リーリー
いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート