技术文章 > 后端开发 > Python教程

python实现从web抓取文档的方法

原创: 2016-06-16 08:41:44 709浏览

本文实例讲述了Python实现从Web的一个URL中抓取文档的方法，分享给大家供大家参考。具体方法分析如下：

实例代码如下：

import urllib 
doc = urllib.urlopen("http://www.python.org").read() 
print doc#直接打印出网页 
def reporthook(*a): 
 print a 
#将http://www.renren.com网页保存到renre.html中，
#每读取一个块调用一字reporthook函数 
 
urllib.urlretrieve("http://www.renren.com",'renren.html',reporthook) 
#将http://www.renren.com网页保存到renre.html中 
urllib.urlretrieve("http://www.renren.com",'renren.html')

程序运行结果如下：


..........................网页内容

(0, 8192, -1) (1, 8192, -1) (2, 8192, -1)

其中urllib.urlopen返回一个类文件对象。

希望本文所述对大家的Python程序设计有所帮助。

python web 抓取文档 PHP课程 HTML视频教程 CSS视频 JS视频教程 Vue视频教程

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn核实处理。

上一条：python实现给字典添加条目的方法下一条：python实现udp数据报传输的方法

相关文章

查看更多

热门课程

Laravel 9 学习正当时—保姆级教程，想学不会都难！

￥229
￥279

已抢66680个
抢
前端基础到实战（HTML5+CSS3+ES6+NPM）

￥800
￥1200

已抢38210个
抢
PHP基础到实战（PHP+MySQL）

￥800
￥1200

已抢21109个
抢
PHP入门到实战消息队列RabbitMQ

￥59
￥99

已抢2660个
抢
C#+WPF上位机开发课程（模块化与反应式编程）

￥250
￥499

已抢929个
抢
在线商城系统开发（Laravel实战五）

￥159
￥299

已抢19180个
抢

打开APP，随时随地在线学习！