単一ページの PHP 収集プログラムの作成と例の添付を手伝っていただけますか
たとえば、次のページを収集したいと考えています: http://news.163.com/12/0613/20/83TJ7PA700014JB6.html
要件:
タイトルを収集
テキストを収集
ありがとうございます!
-----解決策---------
まず、http://simplehtmldom.sourceforge.net/index.htm にアクセスして (「Sourceforge から最新バージョンをダウンロード」をクリックします)、簡単な規則である simple_html_dom.php をダウンロードします。公式 Web サイトには詳細なチュートリアルもあります。それは理解しやすいです。
header("コンテンツタイプ: text/html; charset=gb2312"); dirname(__FILE__) が必要です。 '/simple_html_dom.php'; $ch =curl_init(); curl_setopt($ch, CURLOPT_URL, 'http://news.163.com/12/0613/20/83TJ7PA700014JB6.html'); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5'); $htmls =curl_exec($ch); カール_クローズ($ch); $html = str_get_html($htmls); foreach($html->find('#h1title') as $title){ echotrip_tags($title).'<br />';//タイトル } foreach($html->find('#endText') as $content){ echotrip_tags($content);//テキスト } <br><font color="#e78608">------解決策------------------</font><br> PHP で QQ メールボックスの友達リストを取得する方法: <br><font color="#e78608">------解決策---------</font><br>ページを取得するだけです。タイトルはタイトルの間にありますタグと本文間のテキストでは、正規表現を使用して不要なコンテンツを削除します <div class="clear"></div>