ホームページ > バックエンド開発 > PHPチュートリアル > PHPをベースにした簡単なデータ収集・保存プログラム例を詳しく解説

PHPをベースにした簡単なデータ収集・保存プログラム例を詳しく解説

PHP中文网
リリース: 2023-02-28 18:10:01
オリジナル
2116 人が閲覧しました

数日前、友人からニュース情報を収集するためのプログラムの作成を手伝ってほしいと頼まれ、時間をかけて PHP バージョンを作成し、メモに記録しました。

収集といえば、遠隔からの情報取得→必要なコンテンツの抽出→機密保管→閲覧→表示に過ぎません

単純な「泥棒プログラム」の強化版とも言えます"

以下は対応するコアコードです(悪用しないでください^_^)

収集される内容は、以下に示すようにゲームWebサイトでの告知です:

最初にできますfile_get_contents と単純な規則ルールを使用して基本的なページ情報を取得します

基本情報を整理してデータベースに収集します:

<?php
  include_once("conn.php");


   if($_GET[&#39;id&#39;]<=8&&$_GET[&#39;id&#39;]){
     $id=$_GET[&#39;id&#39;];
    $conn=file_get_contents("http://www.93moli.com/news_list_4_$id.html");//获取页面内容
  
  $pattern="/<li><a title=\"(.*)\" target=\"_blank\" href=\"(.*)\">/iUs";//正则

  preg_match_all($pattern, $conn, $arr);//匹配内容到arr数组

  //print_r($arr);die;
  
  foreach ($arr[1] as $key => $value) {//二维数组[2]对应id和[1]刚好一样,利用起key
    $url="http://www.93moli.com/".$arr[2][$key];
    $sql="insert into list(title,url) value (&#39;$value&#39;, &#39;$url&#39;)";
    mysql_query($sql);

    //echo "<a href=&#39;content.php?url=http://www.93moli.com/$url&#39;>$value</a>"."<br/>";  
  }
   $id++;
   echo "正在采集URL数据列表$id...请稍后...";
   echo "<script>window.location=&#39;list.php?id=$id&#39;</script>";

 }else{
   echo "采集数据结束。";
 }

?>
ログイン後にコピー

conn.php はデータベース接続ファイルです

list.php はこのページです

収集されるデータはページ単位で表示され、ページアドレスは定期的に増加するので、私はjsジャンプコードを排除し、収集されるページ数をid値を渡すことで制御することで、forループの数が多すぎることを回避します。大きい。

データをデータベースに簡単に入力する 次の記事では、特定の URL から情報を収集するプロセスについて説明します。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート