ホームページ > バックエンド開発 > PHPチュートリアル > PHP が Baidu 関連の検索と独自性を獲得_PHP チュートリアル

PHP が Baidu 関連の検索と独自性を獲得_PHP チュートリアル

WBOY
リリース: 2016-07-13 17:42:56
オリジナル
1019 人が閲覧しました

 PHP获取百度相关搜索和原创程度 
获取原创程度是get_em_times,数值越高文本长度越长越不原创。 
用于采集项目的搜索引擎优化

class baidu {

        public static function build_request_uri($words){

                $words = urlencode(Text::convert_encoding($words,GBK,UTF-8));

                return /s?wd=.$words;

        }

        public static function get_relate_search($words){

                $content = self::get_content($words);

                if(preg_match(/

(((?!
).)*)
/, $content,$result)){

if(preg_match_all(/).)*>(.*?)/, $result[1], $result)) return $result[2];

}

FALSE を返す;

}

/**

词 * スペースに従って、 & lt; /em & gt; に完全に一致する Baidu キーワードを取得します。

* @param string $words

* @return int

*/

パブリック静的関数 get_em_times($words){

$word =explode( , $words);

$content = self::get_content($words);

preg_match_all(/(((?!).)*)/, $content,$result);

if(!isset($result[1]) || count($result[1])==0)

0 を返す;

$word_table = array_count_values($result[1]);

$times = 0;

foreach ($word を $pice として){

if(array_key_exists($pice, $word_table)) $times+=$word_table[$pice];

}

$times を返す;

}

パブリック静的関数 get_content($words){

static $loaded_contents = array();

if(!isset($loaded_contents[$words])){

$content = file_get_contents("http://www.baidu.com".self::build_request_uri($words));

$content = Text::convert_encoding($content,UTF-8,GBK);

$loaded_contents[$words] = $content;

}

return $loaded_contents[$words];

}

関数 check_veriy($content){

if(strpos($content,"http://verify.baidu.com/")!==FALSE){

//百度要求验证、异常

}

}

}

http://www.bkjia.com/PHPjc/486027.html

tru​​ehttp://www.bkjia.com/PHPjc/486027.html技術記事 PHP の取得百分率は、検索と原文の程度に関連しており、取得の程度は get_em_times であり、数値が高いほど、本文の長さが長くなるほど、不原得になります。
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のおすすめ
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート