php を使用してページのコンテンツをキャプチャすると、Web ページのコンテンツの一部を抽出する単純なコンテンツ コレクターとして使用するなど、実際の開発で非常に役立ちます。キャプチャしたコンテンツをフィルタリングすることで取得できます。正規表現を使用して目的のコンテンツを見つけるには、php を使用して Web ページのコンテンツをクロールするためによく使用されるいくつかの方法を以下に示します。
1.file_get_contents
PHPコード
$url = "http://www.phpzixue.cn"; $contents = file_get_contents($url); //如果出现中文乱码使用下面代码 //$getcontent = iconv("gb2312", "utf-8",$contents); echo $contents; ?> |
$url = "http://www.phpzixue.cn"; $ch = curl_init(); $timeout = 5; curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout); //在需要用户检测的网页里需要增加下面两行 //curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_ANY); //curl_setopt($ch, CURLOPT_USERPWD, US_NAME.":".US_PWD); $contents = curl_exec($ch); curl_close($ch); echo $contents; ?> |
$url = "http://www.phpzixue.cn";
$ch =curl_init();
$タイムアウト = 5 curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout); //次の 2 行をユーザー検出が必要な Web ページに追加する必要があります
エコー $contents; ?> |
$handle = fopen ("http://www.phpzixue.cn", "rb");
$contents = "" する { $data = fread($handle, 1024); if (strlen($data) == 0) { 休憩 } $contents .= $data } while(true); fclose ($handle) エコー $contents; ?> |