ホームページ > バックエンド開発 > PHPチュートリアル > phpカールを使用してタオバオの商品ページをクロールするにはどうすればよいですか?神に答えを求めてください。 。超難しい感じがします。

phpカールを使用してタオバオの商品ページをクロールするにはどうすればよいですか?神に答えを求めてください。 。超難しい感じがします。

WBOY
リリース: 2016-06-23 14:28:19
オリジナル
1741 人が閲覧しました

これは私が書いたカール取得コードです。Tmall 製品を取得するのにも役立ちます。ただし、タオバオの商品ページはキャプチャできません。

<?php$url = "http://item.taobao.com/item.htm?id=16396503658";$ch = curl_init();curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_HEADER, false);curl_setopt($ch, CURLOPT_TIMEOUT, 20);curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);$ret = curl_exec($ch);curl_close($ch);echo $ret;?>
ログイン後にコピー

CURLOPT_FOLLOWLOCATION を追加しても無駄です。 。マスターに指導を求める


ディスカッション(解決策)に返信

タオバオ記述の動的読み込みを分析し、そのアドレスを取得する

分析方法。 。 CURLOPT_FOLLOWLOCATION は自動的に最後までジャンプしませんか?

ジャンプがある必要があるだけでなく、Cookie も渡す必要があります
Curl は対象ページの HTML コードを取得することしかできず、その中の JS プログラムを実行することはできません
そしてページのキーデータも js Produced

を介して渡されます。 。 。 。 。今はページを取得することさえできません
Cookie を保存する方法

Cookie を保存するための特別な属性があります
CURLOPT_COOKIEJAR

http://item.taobao.com/item.htm?id=16396503658 を試してみましたが、空白でした開けたとき、どうやって手に入れたいですか?
プロダクト ID に問題があります...

http://item.taobao.com/item.htm?id=16396503658 を試してみましたが、開いてみると空白でした。どうやって取得しますか。 ?
プロダクト ID に問題があります...
開けますか?
ヘッダーがうまくシミュレートされていません

この投稿は、2014-02-07 09:05 に PhpNewnew によって最終編集されました。 23


私 http://item.taobao.com/item.htm?id=16396503658 を試してみましたが、開いたら空白でした。どうやって取得しますか?
プロダクト ID に問題があります...
開けますか?
ヘッダーがうまくシミュレートされていません。
開けますか?ここで開くことはできますが、開いた後は空白になります。確かにブラウザ IE を変更することは可能です...Chrome が動作しません。 http://item.taabao.com/item.htm を試してみました。 ?id=16396503658 開くと空白です。どのようにアクセスしますか?
プロダクト ID に問題があります... 開いてもらえますか?

問題はヘッダーが適切にシミュレートされていないことです

HEADER をシミュレートする方法を教えてください。



http://item.taovao.com/item.htm?id=16396503658 を試してみましたが、開いてみると空白でした。どうやって取得しますか?

プロダクト ID に問題があります...

開いてもらえますか?
問題はヘッダーが適切にシミュレートされていないことです

HEADER をシミュレートする方法を教えてください。
同じリクエスト

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート