記事特集学ぶダウンロードに質問プログラミング辞典ゲーム最近の更新

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

ホームページ > バックエンド開発 > PHPチュートリアル > 本文

URL と Web コンテンツをクロールする

WBOY

リリース： 2016-06-23 14:38:32

オリジナル

816 人が閲覧しました

テクノロジーの不足のため、私は一日中フォーラムを閲覧して過ごしました。 Web コンテンツのクロール (file_get_contents) と URL のクロール (これに何を使用すればよいのかわかりません) について多くのことを目にしたので、これを聞きたいと思いました。神様が何が起こっているのか教えてくれるといいのですが？ソースコード全体を教えていただければ幸いです。参考にさせていただきます。

ディスカッションへの返信 (解決策)

まずは Baidu に行きましょう

file_get_contents については、原理は同じです。欠点についてアドバイスをお願いします。、

http://blog.csdn.net/zkg510168343/article/details/12996699
http://blog.csdn.net/zkg510168343/article/details/16983161

カール

マニュアルには例があります。マニュアルを読む必要があります。ああ

百度でたくさん見つけることができます。

Baidu php コレクション

Baidu file_get_contents() およびカールクロールコレクション

$url='http://www.iheima.com/'

if ($con );

preg_match_all('/

(.+).*
( .+ )
/isU', $con, $temp,PREG_SET_ORDER);
foreach ($temp as $key=> $v){
$title=$v[2]; [1];
$des=$v[3];
$con_url=file_get_contents($v_url);
$tags=''; +)"/isU', $con_url,$tags);
$tags=trim($tags[1],',');

preg_match('/class="txs_Content".*>(. +)

/isU', $con_url,$txt);
$txt=$txt[1];

}
十分明らかです

オープンソースの simple_html_dom があります
$html = file_get_html( 'http://www.baidu.com');
ID、CSS などのさまざまなクロール方法に基づいて Web コンテンツをキャプチャできます。

関連ラベル：

抓取url和网页内容

ソース：php.cn

前の記事：複数のプログラミング言語を持っている友達に教えてください: 第一言語への依存をどのように克服しましたか? 次の記事：CakePHPを助けてください~

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

NullPointerException とは何ですか?どのように修正すればよいですか?

2024-10-22 09:46:29
初心者からプログラマーへ: 旅は C の基礎から始まります

2024-10-13 13:53:41
PHP による Web 開発のロックを解除する: 初心者ガイド

2024-10-12 12:15:51
C の謎を解く: 新人プログラマーのための明確でシンプルな道

2024-10-11 22:47:31
コーディングの可能性を解き放つ: まったくの初心者のための C プログラミング

2024-10-11 19:36:51
内なるプログラマーを解き放つ: まったくの初心者のための C

2024-10-11 15:50:41
C で生活を自動化する: 初心者向けのスクリプトとツール

2024-10-11 15:07:41
PHP を簡単に: Web 開発の最初のステップ

2024-10-11 14:21:21
Python で何でも構築: 創造性を解き放つための初心者ガイド

2024-10-11 12:59:11
コーディングの鍵: 初心者のための Python の力を解き放つ

2024-10-11 12:17:31

最新の問題

return(); は 1 つのルートでは機能しませんが、ほぼ同じルートでは機能します 2 つのルートがあり、1 つは購読解除用、もう 1 つは復元用です。何かが欠けている場合を除き、どちらのルートも名前/機能/URL を除いて同じです。再開サブスクリプションをキャン...

から 2024-04-04 17:34:09

0

1

311

CSS セレクターを使用して、特定の属性またはタグを含む div 要素をターゲットにする方法は? 私はウェブサイトを生成する POS システムに取り組んでいます。コードのほとんどは独自仕様なので、あまり編集できません。いくつかの画像がカテゴリーとしてフローティングされたカテゴリ...

から 2024-04-03 22:25:59

0

1

277

まったく同じことを行うチュートリアルを見ているにもかかわらず、mySQL データベースから情報を受信できませんそこで、MySQL データベースの読み取りと書き込みを行うプログラムを作成しようとしており、それが YouTube チュートリアルにつながりました。私の問題は、チュートリアルの男と...

から 2024-04-03 14:46:04

0

1

298

LESS string-set に相当する現代のものは何ですか? 文字列セットとその使用例については、「LESS 文字列セットのプロパティとコンテンツメソッドの使用」を参照してください。かなり混乱した後、これは古く、Chrome バージョン ...

から 2024-04-02 13:29:36

0

1

361

Chrome 拡張機能に関する関連情報を抽出するユーザーがウェブサイト A にアクセスしたときにさまざまなウェブサイトから情報を集約する Chrome 拡張機能を構築しようとしています。 asyncfunctionfetchHT...

から 2024-03-30 12:17:29

0

1

402

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート

私たちについて免責事項 Sitemap: PHP中国語ウェブサイト：福祉オンライン PHP トレーニング，PHP 学習者の迅速な成長を支援します！