提供一款免费的php 问问采集代码哦,如果你正想采集问问,但是又不知道怎么写采集程序,这里为你提供一款经典的问问采集程序哦。
提供一款免费的php教程 问问采集代码哦,如果你正想采集问问,但是又不知道怎么写采集程序,这里为你提供一款经典的问问采集程序哦。
session_start();
header("content-type:text/html;charset=utf-8");
require("stole_config.php");
require("conn.php");
require("keyword.php");
if(!empty($_post['ask']))
{
$ask=urlencode(trim($_post['ask']));//获取表单提交的问题
$sp="s".$ask;
}else
{
$sp=urlencode($_get['sp']);
}
if(empty($_get['jl']))
{
$_get['jl']=1;
}
$jl=$_get['jl'];
$pg=intval($_get['pg']);//获取页数
$rs=intval($_get['rs']);//获得 记录的参数
if($rs>9)
{
$rs=0;
$pg++;
}
if($pg>51)
{
echo "采集完毕! 总共采集 ".urldecode($sp)." ".$jl."条记录";
exit();
}
if($sp)//有设定答案才开始
{
$str=@file_get_contents("http://wenwen.soso.com/z/search.e?sp={$sp}&pg={$pg}");
@preg_match("/(.*)
/ius",$str,$asklist);//获取问答列表
//echo $asklist[1];
$url="/@preg_match_all($url,$asklist[1],$urllist);//获取 所有的问题
$t=$urllist[1][$rs];
$uid=$t;
$suid="ww{$uid}";
$sct=mysql教程_query("select count(*) from {$table_prefix}c_article where suid='$suid' ");
$sct=mysql_fetch_array($sct);
$sct=$sct[0];
if($sct==0)
{
$html=@file_get_contents("http://wenwen.soso.com/z/${t}");
$html=str_replace("","",str_replace("","",$html));
$html=str_replace("
","
",$html);
//echo $html;
@preg_match("/.*(.*)
/ius",$html,$ask_title);
$art_title=$ask_title[1];
@preg_match("/(.*)/ius",$html,$answer);
$j=count($answer)-1;
$art_content="";//商品詳細
for($i=$j;$i>=1; $i--)
{
if(strlen($answer[$i])>$min_t1)
{
$art_content .= $answer[$i]
}
}
$art_content=trim($art_content );
$s1="/()(.*)/ius";
$art_content=preg_replace($s1,${2},trim($art_content)) ;
$word_arr=explode(",",iconv("gbk","utf-8",$cj_word));
$word_allow=false;//初期化でコレクションが許可されるかどうか
$word_count=count($word_arr); //合計数
for($i=0;$i{
if(substr_count($art_title,$word_arr[$i])>0)
{
$word_allow=1;
$i=$word_count;
}
}
if($word_allow)//合法の場合
{ //データベースの処理チュートリアルを開始します
if(strlen($art_content)>$min_t2)
{
echo "追加中....................
";
echo $art_title."
";
$art_title=iconv('utf-8','gbk', $art_title);
$title_ct=mysql_query("select count(*) from {$table_prefix}c_article where art_title ="$art_title " ");//タイトルが繰り返されているかどうかを確認します
$title_ct=@mysql_fetch_array($title_ct);
if($title_ct>0)
{
$art_title .="{$same_title }{$title_ct] }";
}
$art_content=iconv('utf-8','gbk',str_replace("rn","
",$art_content));
$art_content=strtr($ art_content,$keyword );
$art_time=date("y-m-d");
$sql="{$table_prefix}c_article(art_title,art_content,art_time,art_author,suid) に挿入します。values('$art_title','$art_content ','$) art_time','$art_author','$suid')";//コレクションテーブルに挿入
mysql_query($sql);
if(empty($t_catx_id))//分類がない場合
{
$sql2 ="{$t_table}({$t_art_title},{$t_art_content},{$t_art_time},{$t_artx_author}) に挿入 value('$art_title','$art_content','$art_time','$art_author') )";
}else
{
$sql2="{$t_table}({$t_art_title},{$t_art_content},{$t_art_time},{$t_artx_author},{$t_catx_id}) 値('$art_title)に挿入','$art_content','$art_time','$art_author','$cat_id')";
}
mysql_query($sql2);//記事テーブルに挿入
$jl++;//保存されている場合は記録データベースに 1 を追加します
//データベースの処理終了
}else
{
echo "長さが不十分です";
}
}else
{
echo "テーマが要件を満たしていません"; "すでに存在します";
}
$rs++;
//このコレクションのステータスを記録します
$f_tt= urldecode($sp)."--ページ数".$pg."レコード数".$jl;
file_put_contents("ss.txt",$f_tt);
echo "<script>location.href='wenwen.php?jl=".$jl."&sp=".$sp."&pg=".$ pg."&rs=" .$rs." ';</script>
exit()
?>
おすすめKnow Ask Collection プラグイン< ;/h1>
<テーブル幅="700" セル間隔="1" bgcolor="#cccccc " style= "margin-top:6px; margin-bottom:6px;">コレクション設定 アンインストールコレクション a コレクション レコードを表示コレクション ヘルプコレクションについて知る コレクションについて質問する