python爬虫使用真实浏览器打开网页的两种方法总结-Tutorial Python-php.cn

python爬虫使用真实浏览器打开网页的两种方法总结

不言

Lepaskan： 2018-04-21 15:18:16

asal

3338 orang telah melayarinya

下面为大家分享一篇python爬虫使用真实浏览器打开网页的两种方法总结，具有很好的参考价值，希望对大家有所帮助。一起过来看看吧

1.使用系统自带库 os

这种方法的优点是，任何浏览器都能够使用，缺点不能自如的打开一个又一个的网页

import os 
os.system(&#39;"C:/Program Files/Internet Explorer/iexplore.exe" http://www.baidu.com&#39;)

Salin selepas log masuk

2.使用python 集成的库 webbroswer

python的webbrowser模块支持对浏览器进行一些操作,主要有以下三个方法：

import webbrowser 
webbrowser.open(url, new=0, autoraise=True) 
webbrowser.open_new(url) 
webbrowser.open_new_tab(url)

Salin selepas log masuk

他们虽然是三个方法，其实还是一个方法，只是传递的参数不同

webbrowser.open(url, new=0, autoraise=True) 在系统的默认浏览器中访问url地址，如果new=0, url会在同一个

浏览器窗口中打开；如果new=1，新的浏览器窗口会被打开;new=2 新的浏览器tab会被打开

其他的两个函数 webbrowser.open_new(url)，webbrowser.open_new_tab(url)其实都是返回了webbrowser.open() 这个方法

只是他们没有其他的两个参数了。

在调用其他的浏览器的时候需要提前注册，否则打开页面的是默认浏览器

import webbrowser 
chromePath = r&#39;你的浏览器目录&#39;   # 例如我的：D:\Google\Chrome\Application\chrome.exe 
webbrowser.register(&#39;chrome&#39;, None, webbrowser.BackgroundBrowser(chromePath)) #这里的&#39;chrome&#39;可以用其它任意名字，如chrome111，这里将想打开的浏览器保存到&#39;chrome&#39; 
webbrowser.get(&#39;chrome&#39;).open(&#39;www.baidu.com&#39;，new=1,autoraise=True)

Salin selepas log masuk

webbrowser 这个库锁支持的浏览器类型如下：

 Type Name Class Name Notes 
 &#39;mozilla&#39; Mozilla(&#39;mozilla&#39;) 
 &#39;firefox&#39; Mozilla(&#39;mozilla&#39;) 
 &#39;netscape&#39; Mozilla(&#39;netscape&#39;) 
 &#39;galeon&#39; Galeon(&#39;galeon&#39;) 
 &#39;epiphany&#39; Galeon(&#39;epiphany&#39;) 
 &#39;skipstone&#39; BackgroundBrowser(&#39;skipstone&#39;) 
 &#39;kfmclient&#39; Konqueror() (1) 
 &#39;konqueror&#39; Konqueror() (1) 
 &#39;kfm&#39; Konqueror() (1) 
 &#39;mosaic&#39; BackgroundBrowser(&#39;mosaic&#39;) 
 &#39;opera&#39; Opera() 
 &#39;grail&#39; Grail() 
 &#39;links&#39; GenericBrowser(&#39;links&#39;) 
 &#39;elinks&#39; Elinks(&#39;elinks&#39;) 
 &#39;lynx&#39; GenericBrowser(&#39;lynx&#39;) 
 &#39;w3m&#39; GenericBrowser(&#39;w3m&#39;) 
 &#39;windows-default&#39; WindowsDefault (2) 
 &#39;macosx&#39; MacOSX(&#39;default&#39;) (3) 
 &#39;safari&#39; MacOSX(&#39;safari&#39;) (3) 
 &#39;google-chrome&#39; Chrome(&#39;google-chrome&#39;) 
 &#39;chrome&#39; Chrome(&#39;chrome&#39;) 
 &#39;chromium&#39; Chromium(&#39;chromium&#39;) 
 &#39;chromium-browser&#39; Chromium(&#39;chromium-browser&#39;)

Salin selepas log masuk

这些内容都可以在源文件中看到，路径为： python2.7/libs/webbroser.py