コレクションで奇妙な問題が発生しました
ターゲット アドレス www.zhibo8.com
ローカル環境: Windows XP + xmapp 1.7.7
file_get_contents またはcurl に問題はありません。最初のページは完全に取得されています。
外部サーバー、Linux、Apache 2.0 に配置します
file_get_contents は空です
カールはブラウザーのアクセス開始と一致しません。コンテンツははるかに少なくなりますが、
そして、curl を使用してシミュレートされたブラウザーのすべてのヘッダーを送信すると、それらも不完全になります。
考えられる理由とその解決方法の分析にご協力ください。ありがとうございます。
-----解決策--------------------------------おそらく Linux 環境の問題です。
以前 www.fblife.com を取得したときは、Windows でのcurl テストにも合格しましたが、Linux では同じコードを完全には取得できませんでした。
この Web サイトの Ubuntu 9.10 で CURL テストに合格し、完全にクロールできましたが、Linux 構成に問題があるかどうかわかりますか?
------解決策------------------まだ利用できません。 。 。非常に混乱しています
奇妙なことに、プログラムは Web サイトのディレクトリに配置されており、ブラウザからプログラム ファイルにアクセスすることで取得される情報は非常に充実しています。ただし、Linux でのバックグラウンド キャプチャは次のとおりです。不可能であり、何をしてもすべての情報をキャプチャすることはできません。Linux の設定に問題があるのかもしれません。 wgetコマンドを試すことができます
------解決策------------------サーバーのネットワークにアクセスできません。 . これはおそらく国内ホストでは問題ないと思います。
------解決策---------エンコードの問題を見てください
$string = iconv('gb2312', 'utf-8//無視', $string);
------解決策---------外部サーバーに移動します
file_get_contents が空です
アクセス許可が開かないか、タイムアウトになる可能性があります
カールはブラウザのアクセス開始と一致せず、コンテンツは大幅に少なくなります
これは純粋に中国の Web サイトです。海外では見られる、または完全に見えない。中国語を理解できる人は多くありません
もちろん、タイムアウトやカールサポートライブラリにも関係します
-----解決策---------これは優位性です
------解決策---------