URL と Web コンテンツをクロールする

WBOY
リリース: 2016-06-23 14:38:32
オリジナル
816 人が閲覧しました

テクノロジーの不足のため、私は一日中フォーラムを閲覧して過ごしました。 Web コンテンツのクロール (file_get_contents) と URL のクロール (これに何を使用すればよいのかわかりません) について多くのことを目にしたので、これを聞きたいと思いました。神様が何が起こっているのか教えてくれるといいのですが?ソースコード全体を教えていただければ幸いです。参考にさせていただきます。


ディスカッションへの返信 (解決策)

まずは Baidu に行きましょう

file_get_contents については、原理は同じです。欠点についてアドバイスをお願いします。 、

http://blog.csdn.net/zkg510168343/article/details/12996699
http://blog.csdn.net/zkg510168343/article/details/16983161

カール

マニュアルには例があります。マニュアルを読む必要があります。ああ


百度でたくさん見つけることができます。

Baidu php コレクション

Baidu file_get_contents() およびカール クロール コレクション

$url='http://www.iheima.com/'

if ($con );

preg_match_all('/

(.+).*

( .+ )

/isU', $con, $temp,PREG_SET_ORDER);
foreach ($temp as $key=> $v){
$title=$v[2]; [1];
$des=$v[3];
$con_url=file_get_contents($v_url);
$tags=''; +)"/isU', $con_url,$tags);
$tags=trim($tags[1],',');

preg_match('/class="txs_Content".*>(. +)
/isU', $con_url,$txt);
$txt=$txt[1];

}
十分明らかです

オープンソースの simple_html_dom があります
$html = file_get_html( 'http://www.baidu.com');
ID、CSS などのさまざまなクロール方法に基づいて Web コンテンツをキャプチャできます。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のおすすめ
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!