• 技术文章 >php教程 >php手册

    php 问问采集代码

    2016-06-13 11:24:50原创374
    提供一款免费的php 问问采集代码哦,如果你正想采集问问,但是又不知道怎么写采集程序,这里为你提供一款经典的问问采集程序哦。

    提供一款免费的php教程 问问采集代码哦,如果你正想采集问问,但是又不知道怎么写采集程序,这里为你提供一款经典的问问采集程序哦。

    session_start();
    header("content-type:text/html;charset=utf-8");
    require("stole_config.php");
    require("conn.php");
    require("keyword.php");
    if(!empty($_post['ask']))
    {
    $ask=urlencode(trim($_post['ask']));//获取表单提交的问题
    $sp="s".$ask;
    }else
    {
    $sp=urlencode($_get['sp']);
    }
    if(empty($_get['jl']))
    {
    $_get['jl']=1;
    }
    $jl=$_get['jl'];
    $pg=intval($_get['pg']);//获取页数
    $rs=intval($_get['rs']);//获得 记录的参数
    if($rs>9)
    {
    $rs=0;
    $pg++;
    }
    if($pg>51)
    {
    echo "采集完毕! 总共采集 ".urldecode($sp)." ".$jl."条记录";
    exit();
    }
    if($sp)//有设定答案才开始
    {
    $str=@file_get_contents("http://wenwen.soso.com/z/search.e?sp={$sp}&pg={$pg}");
    @preg_match("/
      (.*)
    /ius",$str,$asklist);//获取问答列表
    //echo $asklist[1];
    $url="/@preg_match_all($url,$asklist[1],$urllist);//获取 所有的问题
    $t=$urllist[1][$rs];
    $uid=$t;
    $suid="ww{$uid}";
    $sct=mysql教程_query("select count(*) from {$table_prefix}c_article where suid='$suid' ");
    $sct=mysql_fetch_array($sct);
    $sct=$sct[0];
    if($sct==0)
    {
    $html=@file_get_contents("http://wenwen.soso.com/z/${t}");
    $html=str_replace("
    ","",str_replace("
    ","",$html));
    $html=str_replace("


    ","

    ",$html);
    //echo $html;
    @preg_match("/
    .*

    (.*)

    /ius",$html,$ask_title);
    $art_title=$ask_title[1];
    @preg_match("/
    (.*)
    /ius",$html,$answer);
    $j=count($answer)-1;
    $art_content="";//商品详细
    for($i=$j;$i>=1;$i--)
    {
    if(strlen($answer[$i])>$min_t1)
    {
    $art_content .= $answer[$i];
    }
    }
    $art_content=trim($art_content);
    $s1="/(
    )(.*)/ius";
    $art_content=preg_replace($s1,${2},trim($art_content));
    $word_arr=explode(",",iconv("gbk","utf-8",$cj_word));
    $word_allow=false;//初始化是否允许采集
    $word_count=count($word_arr);//总数
    for($i=0;$i<$word_count;$i++)
    {
    if(substr_count($art_title,$word_arr[$i])>0)
    {
    $word_allow=1;
    $i=$word_count;
    }
    }
    if($word_allow)//如果合法
    { //开始处理数据库教程
    if(strlen($art_content)>$min_t2)
    {
    echo "添加中............................
    ";
    echo $art_title."
    ";
    $art_title=iconv('utf-8','gbk', $art_title);
    $title_ct=mysql_query("select count(*) from {$table_prefix}c_article where art_title ="$art_title" ");//查看标题是否重复
    $title_ct=@mysql_fetch_array($title_ct);
    $title_ct=$title_ct[0];
    if($title_ct>0)
    {
    $art_title .="{$same_title}{$title_ct}";
    }
    $art_content=iconv('utf-8','gbk',str_replace("rn","
    ",$art_content));
    $art_content=strtr($art_content,$keyword);
    $art_time=date("y-m-d");
    $sql="insert into {$table_prefix}c_article(art_title,art_content,art_time,art_author,suid) values('$art_title','$art_content','$art_time','$art_author','$suid')";//插入采集表
    mysql_query($sql);
    if(empty($t_catx_id))//如果无分类
    {
    $sql2="insert into {$t_table}({$t_art_title},{$t_art_content},{$t_art_time},{$t_artx_author}) values('$art_title','$art_content','$art_time','$art_author')";
    }else
    {
    $sql2="insert into {$t_table}({$t_art_title},{$t_art_content},{$t_art_time},{$t_artx_author},{$t_catx_id}) values('$art_title','$art_content','$art_time','$art_author','$cat_id')";
    }
    mysql_query($sql2);//插入文章表
    $jl++;//如果存放数据库中 则记录加1
    //处理数据库结束
    }else
    {
    echo "长度不够";
    }
    }else
    {
    echo "主题不符合要求";
    }
    }else
    {
    echo "已经存在";
    }
    $rs++;
    //记录下本次采集 的状况
    $f_tt= urldecode($sp)."--页数".$pg." 记录数 ".$jl ;
    file_put_contents("ss.txt",$f_tt);
    echo "";
    exit();
    }
    ?>





    荐礼啦知道问问采集插件






    采集设置 卸载采集 查看采集记录 采集帮助 知道采集 问问采集









    php入门到就业线上直播课:查看学习

    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。

    前端(VUE)零基础到就业课程:点击学习

    清晰的学习路线+老师随时辅导答疑

    自己动手写 PHP MVC 框架:点击学习

    快速了解MVC架构、了解框架底层运行原理

    上一篇:根据用户ip地址提示选择城市php代码(1/7) 下一篇:自己动手写 PHP MVC 框架(40节精讲/巨细/新人进阶必看)

    相关文章推荐

    • ❤️‍🔥共22门课程,总价3725元,会员免费学• ❤️‍🔥接口自动化测试不想写代码?• mysql 数据备份类代码• PHP类中的魔术方法(Magic Method)简明总结,magicmethod• php mysql 数据库类• 解析用PHP实现var_export的详细介绍• 我的论坛源代码(五)
    1/1

    PHP中文网