Rumah > pembangunan bahagian belakang > tutorial php > PHP获取百度相关搜索和原创程度_PHP教程

PHP获取百度相关搜索和原创程度_PHP教程

WBOY
Lepaskan: 2016-07-13 17:42:56
asal
1020 orang telah melayarinya

 PHP获取百度相关搜索和原创程度 
获取原创程度是get_em_times,数值越高文本长度越长越不原创。 
用于采集项目的搜索引擎优化

class baidu {

        public static function build_request_uri($words){

                $words = urlencode(Text::convert_encoding($words,GBK,UTF-8));

                return /s?wd=.$words;

        }

        public static function get_relate_search($words){

                $content = self::get_content($words);

                if(preg_match(/

(((?!
).)*)/, $content,$result)){

                        if(preg_match_all(/).)*>(.*?)/, $result[1], $result)) return $result[2];

                }

                return FALSE;

        }

        /**

         * 根据空格分词,获取百度关键词完全匹配的次数

         * @param string $words

         * @return int 

         */

        public static function get_em_times($words){

                $word = explode( , $words);

                $content = self::get_content($words);

                preg_match_all(/(((?!).)*)/, $content,$result);

                if(!isset($result[1]) || count($result[1])==0)

                        return 0;

                $word_table = array_count_values($result[1]);

                $times = 0;

                foreach ($word as $pice){

                        if(array_key_exists($pice, $word_table)) $times+=$word_table[$pice];

                }

                return $times;

        }

        public static function get_content($words){

                static $loaded_contents = array();

                if(!isset($loaded_contents[$words])){

                        $content = file_get_contents("http://www.baidu.com".self::build_request_uri($words));

                        $content = Text::convert_encoding($content,UTF-8,GBK);

                        $loaded_contents[$words] = $content;

                }

                return $loaded_contents[$words];

        }

        function check_veriy($content){

                if(strpos($content,"http://verify.baidu.com/")!==FALSE){

                        //百度要求验证,异常

                }

        }

}

www.bkjia.comtruehttp://www.bkjia.com/PHPjc/486027.htmlTechArticlePHP获取百度相关搜索和原创程度 获取原创程度是get_em_times,数值越高文本长度越长越不原创。 用于采集项目的搜索引擎优化 class baidu { p...
Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan