ホームページ > バックエンド開発 > Python チュートリアル > phpsir は、Baidu のキーワード Web サイトのランキングを検出するための Python プログラムを開発しました

phpsir は、Baidu のキーワード Web サイトのランキングを検出するための Python プログラムを開発しました

WBOY
リリース: 2016-06-16 08:47:19
オリジナル
1569 人が閲覧しました

源码如下 :保存成utf-8 bd.py 文件

复制代 代码如下:

#!/usr/bin /env python
# -*-coding: utf-8 -*-
import sys
import urllib ,urllib2
import re
def baidu(w):
url= " http://www.baidu.com/s?」
values = {
"w":w.encode('gbk','ignore')
}
data = urllib.urlencode(values)
newurl = url + data
response = urllib2.urlopen(newurl)
the_page = response.read().decode('gbk','ignore')
return the_page

def ana(data,mysite):
o = re.compile("href="(.+?)"")
f = o.findall(data)
line = 1
f の ff:
そうでない場合re.search("baidu",ff) ではなく、re.search("^s?",ff) および re.search("^http://",ff):
if re.search(mysite, ff):
print "* " ,line ,ff
else:
print line ,ff
line += 1

if __name__ == "__main__":
mysite = sys.argv[2]
data = baidu(sys.argv[1].decode('utf-8'))
ana(data,mysite)

用法python bd.py "关键字" 我的領域名部分 :
例:
复制代代码如下:

python bd.py "vbs" "jb51.net"
関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート