Python使用urllib2模块抓取HTML页面资源的实例分享-Python教程-PHP中文网

Python使用urllib2模块抓取HTML页面资源的实例分享

2016-06-10 15:05:05原创

先把要抓取的网络地址列在单独的list文件中

http://www.jb51.net/article/83440.html
http://www.jb51.net/article/83437.html
http://www.jb51.net/article/83430.html
http://www.jb51.net/article/83449.html

然后我们来看程序操作，代码如下：

#!/usr/bin/python

import os
import sys
import urllib2
import re

def Cdown_data(fileurl, fpath, dpath):
 if not os.path.exists(dpath):
  os.makedirs(dpath)
 try:
  getfile = urllib2.urlopen(fileurl) 
  data = getfile.read()
  f = open(fpath, 'w')
  f.write(data)
  f.close()
 except:
 print 

with open('u1.list') as lines:
 for line in lines:
  URI = line.strip()
  if '?' and '%' in URI:
   continue
 elif URI.count('//m.sbmmt.com/m/') == 2:
   continue
  elif URI.count('//m.sbmmt.com/m/') > 2:
   #print URI,URI.count('//m.sbmmt.com/m/')
  try:
    dirpath = URI.rpartition('//m.sbmmt.com/m/')[0].split('//')[1]
    #filepath = URI.split('//')[1].split('//m.sbmmt.com/m/')[1]
    filepath = URI.split('//')[1]
   if filepath:
     print URI,filepath,dirpath
     Cdown_data(URI, filepath, dirpath)
   except:
    print URI,'error'

原文网址为：http://www.diyoms.com/python/1806.html

声明：本文原创发布php中文网，转载请注明出处，感谢您的尊重！如有疑问，请联系admin@php.cn处理

专题推荐：Python urllib2 HTML

上一篇：Python实现简单字典树的方法下一篇：Python实现新浪博客备份的方法

独孤九贱(3)_JavaScript视频教程

javascript是运行在浏览器上的脚本语言，连续多年，被评为全球最受欢迎的编程语言。是前端开发必备三大法器中，最具杀伤力。如果前端开发是降龙十八掌，好么javascript就是第18掌：亢龙有悔。没有它，你的前端生涯是不完整的。《php.cn独孤九贱（3）－JavaScript视频教程》课程特色：php中文网原创幽默段子系列课程，以恶搞，段子为主题风格的php视频教程！轻松的教学风格，简短的教学模式，让同学们在不知不觉中，学会了javascript知识。

独孤九贱(6)_jQuery视频教程

jQuery是一个快速、简洁的JavaScript框架。设计的宗旨是“write Less，Do More”，即倡导写更少的代码，做更多的事情。它封装JavaScript常用的功能代码，提供一种简便的JavaScript设计模式，优化HTML文档操作、事件处理、动画设计和Ajax交互。核心特性可以总结为：具有独特的链式语法和短小清晰的多功能接口；具有高效灵活的css选择器，并且可对CSS选择器进行扩展；拥有便捷的插件扩展机制和丰富的插件。兼容各种主流浏览器，如IE 6.0+、FF 1.5+、Safari 2.0+、Opera 9.0+等,是全球最流行的前端开发框架之一。PHP中文网根据最新版本,独家录制jQuery最新视频教程,回馈PHP中文网的新老用户。

Python使用urllib2模块抓取HTML页面资源的实例分享

相关文章推荐

相关课程推荐

javascript初级视频教程

jquery 基础视频教程

javascript三级联动视频教程

独孤九贱(3)_JavaScript视频教程

独孤九贱(6)_jQuery视频教程

全部评论我要评论

PHP中文网