• 技术文章 >后端开发 >php教程

    基于PHP的简单采集数据入库程序_PHP

    2016-05-31 19:30:55原创280
    说到采集,无非就是远程获取信息->提取所需内容->分类存储->读取->展示

    也算是简单"小偷程序"的加强版吧

    下面是对应核心代码(别拿去做坏事哦^_^)

    所要采集的内容是某游戏网站上的公告,如下图:

    可先利用file_get_contents和简单正则获取基本页面信息

    整理下基本信息,采集入库:

    <?php
      include_once("conn.php");
    
    
       if($_GET['id']<=8&&$_GET['id']){
         $id=$_GET['id'];
        $conn=file_get_contents("http://www.93moli.com/news_list_4_$id.html");//获取页面内容
      
      $pattern="/
  • /iUs";//正则 preg_match_all($pattern, $conn, $arr);//匹配内容到arr数组 //print_r($arr);die; foreach ($arr[1] as $key => $value) {//二维数组[2]对应id和[1]刚好一样,利用起key $url="http://www.93moli.com/".$arr[2][$key]; $sql="insert into list(title,url) value ('$value', '$url')"; mysql_query($sql); //echo "$value"."
    "; } $id++; echo "正在采集URL数据列表$id...请稍后..."; echo ""; }else{ echo "采集数据结束。"; } ?>
  • conn.php是数据库连接文件

    list.php是本页面

    由于要采集的数据是分页显示的,且页面地址是规律递增,所以我用了js跳转代码,利用id传值控制采集的页数,也避免了for循环数目过大。

    轻轻松松数据入库,下篇文章写关于具体url采集信息的过程。

    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。
    专题推荐:PHP 采集 入库
    上一篇:PHPer 需要了解的 5 个 Composer 小技巧_PHP 下一篇:PHP学习笔记(一) 简单了解PHP_PHP
    VIP课程(WEB全栈开发)

    相关文章推荐

    • 【腾讯云】年中优惠,「专享618元」优惠券!• 20+值得了解的PHP面试题(附答案分析)• [PHP]实用函数7_PHP教程• 谈谈PHP语法(4)_PHP教程• 第1次亲密接触PHP5(2)_PHP教程• PHP 5 数据对象 (PDO) 抽象层与 Oracle_PHP教程
    1/1

    PHP中文网