キャプチャしたコンテンツを正規表現でフィルタリングして、必要なコンテンツを取得することができます。正規表現を使用してフィルタリングする方法については、ここでは紹介しません。一般的に使用される PHP の方法をいくつか紹介します。 Web ページからコンテンツをクロールします。
1.file_get_contents
PHP コード
コードをコピー コードは次のとおりです:
$url = "http://www.jb51.net"; file_get_contents($ url);
//中国語の文字化けが表示される場合は、次のコードを使用します
//$getcontent = iconv("gb2312", "utf-8",$contents);
echo $contents;
2.curl
PHPコードコードをコピーします コードは次のとおりです:
$url = "http://www.jb51.net"; ch =curl_init();
$timeout = 5;
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
//ユーザー検出が必要な Web ページに追加する必要があります。 次の 2 行
//curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_ANY);
//curl_setopt($ch, CURLOPT_USERPWD, US_NAME.":".US_PWD); =curl_exec($ch);
curl_close($ch );
3.fopen-& gt; コードをコピーします。次のように:
& lt;? PHP
$ $handle = fopen ("http://www.jb51.net", "rb");
$contents = ""; ($handle, 1024);
if (strlen($data ) == 0) {