ホームページ > バックエンド開発 > PHPの問題 > phpでWebコンテンツを取得するときに注意すべきことは何ですか?

phpでWebコンテンツを取得するときに注意すべきことは何ですか?

王林
リリース: 2023-02-25 09:24:01
オリジナル
2739 人が閲覧しました

phpでWebコンテンツを取得するときに注意すべきことは何ですか?

PHP で Web ページのコンテンツを取得する場合の注意事項

1. ネットワーク エラーが発生する可能性があり、あらゆるエラーが発生する可能性があります。たとえば、マシンがダウンしている、ネットワーク ケーブルが壊れている、ドメイン名が間違っている、ネットワークがタイムアウトする、ページが消える、Web サイトがジャンプする、サービスが禁止されている、ホストの負荷が十分でないなどです...

2. サーバーに制限が追加されました。一般的なブラウザのみにアクセスを許可します。

3. サーバーにホットリンク防止制限が追加されました。

4. 一部の Web サイトでは、ホットリンク防止の制限が追加されました。 HTTP リクエストの Accept-Encoding ヘッダー、またはヘッダーの有無。その部分の具体的なコンテンツは何ですか? とにかく、gzip 圧縮されたコンテンツを常に送信します

#5。URL リンクはあらゆる種類の奇妙なものには、漢字が含まれているものや、キャリッジ リターンやライン フィードが含まれているものもあります。

6. 一部の Web サイトには HTTP ヘッダーに Content-Type があり、Web ページにはいくつかの Content-Type があります。さらにとんでもないことは、それぞれの Content-Type が異なることです。最もとんでもないことは、これらの Content-Type がテキスト内で使用できないことです。Content-Type により文字化けが発生します。

7. ネットワーク リンクは次のとおりです。非常に遅いです。数千ページの分析にかかる時間を掛け合わせると、おいしい食事をとることをお勧めします

Get PHP Web page content メソッド

Method 1. file_get_contents メソッドを使用して、

$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";
    $html = file_get_contents($url);
    //如果出现中文乱码使用下面代码
    //$getcontent = iconv("gb2312", "utf-8",$html);
    echo "<textarea style=&#39;width:800px;height:600px;&#39;>".$html."</textarea>";
ログイン後にコピー

#メソッドを実装します。 2.curl を使用して、

$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";
    
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$html = curl_exec($ch);
curl_close($ch);

echo "<textarea style=&#39;width:800px;height:600px;&#39;>".$html."</textarea>";
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
ログイン後にコピー

を実装します。このコードを追加すると、リクエストがリダイレクトされると、最終リクエスト ページにアクセスできます。それ以外の場合、リクエスト結果には次の内容が表示されます:

<head><title>Object moved</title></head>
<body><h1>Object Moved</h1>This object may be found <a href="some link." rel="external nofoll
ログイン後にコピー
推奨チュートリアル:

PHP ビデオ チュートリアル

以上がphpでWebコンテンツを取得するときに注意すべきことは何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート