지역 사회 배우다 도구 라이브러리 여가

한국어

집 > 백엔드 개발 > 파이썬 튜토리얼 > python爬虫入门教程之点点美女图片爬虫代码分享

python爬虫入门教程之点点美女图片爬虫代码分享

WBOY

풀어 주다： 2016-06-16 08:42:14

원래의

1373명이 탐색했습니다.

继续鼓捣爬虫，今天贴出一个代码，爬取点点网「美女」标签下的图片，原图。

# -*- coding: utf-8 -*- 

#--------------------------------------- 
#  程序：点点美女图片爬虫 
#  版本：0.2 
#  作者：zippera 
#  日期：2013-07-26 
#  语言：Python 2.7 
#  说明：能设置下载的页数 
#--------------------------------------- 
 
import urllib2
import urllib
import re
 
 
 
pat = re.compile('<div class="feed-big-img">\n.*&#63;imgsrc="(ht.*&#63;)\".*&#63;')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3&#63;page="
 
 
count = 1
 
while count < 2:
 
  print "Page " + str(count) + "\n"
  myurl = nexturl1 + str(count)
  myres = urllib2.urlopen(myurl)
  mypage = myres.read()
  ucpage = mypage.decode("utf-8") #转码
 
  mat = pat.findall(ucpage)
  
 
  
  
  
  if len(mat):
    cnt = 1
    for item in mat:
      print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
      cnt += 1
      fnp = re.compile('(\w{10}\.\w+)$')
      fnr = fnp.findall(item)
      if fnr:
        fname = fnr[0]
        urllib.urlretrieve(item, fname)
    
  else:
    print "no data"
    
  count += 1

로그인 후 복사

使用方法：新建一个文件夹，把代码保存为name.py文件，运行python name.py就可以把图片下载到文件夹。

관련 라벨：

python

원천：php.cn

이전 기사：Python中函数的用法实例教程 다음 기사：Python Tkinter基础控件用法

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

저자별 최신 기사

NullPointerException은 무엇이며 어떻게 해결합니까?

2024-10-22 09:46:29
초보자에서 코더까지: C 기초로 시작되는 여정

2024-10-13 13:53:41
PHP로 웹 개발 잠금 해제: 초보자 가이드

2024-10-12 12:15:51
C에 대한 이해: 새로운 프로그래머를 위한 명확하고 간단한 길

2024-10-11 22:47:31
코딩 잠재력 발휘: 완전 초보자를 위한 C 프로그래밍

2024-10-11 19:36:51
내면의 프로그래머를 깨워보세요: 완전 초보자를 위한 C

2024-10-11 15:50:41
C로 일상을 자동화하세요: 초보자를 위한 스크립트 및 도구

2024-10-11 15:07:41
PHP가 쉬워졌습니다: 웹 개발의 첫 번째 단계

2024-10-11 14:21:21
Python으로 무엇이든 빌드하기: 창의력을 발휘하기 위한 초보자 가이드

2024-10-11 12:59:11
코딩의 핵심: 초보자를 위한 Python의 힘 활용

2024-10-11 12:17:31

최신 이슈

Python/MySQL은 정수 데이터를 올바르게 유지할 수 없습니다. 여기에는 코드가 필요하지 않습니다. 게임을 만들고 있는데 점수를 저장해야 해서 아주 긴 숫자를 저장하고 싶어요. 하지만 테스트하고 점수를 25000000000으로...

에서 2024-04-04 19:09:44

0

1

367

Selenium을 사용하여 클래스에서 URL을 클릭하고 정의하고 싶습니다. 오늘은 또 다른 팁이 필요해요. 저는 Python/Selenium 코드를 작성하려고 하는데 아이디어는 www.thewebsiteIwantoclickon을 클릭하는...

에서 2024-04-04 14:14:44

0

1

3492

Selenium + Python - Execute_script를 통해 이미지 검사 Python에서 Selenium을 사용하여 페이지에 이미지가 표시되는지 확인해야 합니다. 예를 들어 https://openweathermap.org/ 페이지의 왼...

에서 2024-04-03 09:32:15

0

1

375

처음 X 행을 유지하고 테이블 행을 삭제하는 방법 MySQLincident_archive에 수백만 개의 레코드가 있는 큰 테이블이 있습니다. 생성된 열을 기준으로 행을 정렬하고 첫 번째 X 행을 유지하고 나머지는...

에서 2024-04-01 18:32:54

0

1

347

BeautifulSoup을 사용하여 특정 Google 날씨 텍스트를 긁는 방법은 무엇입니까? BeautifulSoup을 사용하여 Python에서 코스 텍스트 "New York City, USA"를 찾는 방법은 무엇입니까? 연습을 위해 비...

에서 2024-04-01 14:06:14

0

1

308

관련 주제

더>

인기 추천

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿