지역 사회 배우다 도구 라이브러리 여가

한국어

집 > 백엔드 개발 > 파이썬 튜토리얼 > Python3.4 기반의 간단한 크롤러 기능에 대한 자세한 소개

Python3.4 기반의 간단한 크롤러 기능에 대한 자세한 소개

巴扎黑

풀어 주다： 2017-09-16 10:16:36

원래의

1585명이 탐색했습니다.

이 글은 주로 간단한 크롤링 및 크롤러 기능을 구현하기 위한 Python3.4 프로그래밍을 소개하며, Python3.4 웹 페이지 크롤링 및 정기적인 파싱 관련 작업 기술이 필요하면 참고할 수 있습니다.

이 글의 예는 Python3.4의 간단한 구현을 알려줍니다. Python3.4 프로그래밍 크롤링 크롤러 기능. 참고할 수 있도록 모든 사람과 공유하세요. 세부 사항은 다음과 같습니다:

import urllib.request
import urllib.parse
import re
import urllib.request,urllib.parse,http.cookiejar
import time
def getHtml(url):
  cj=http.cookiejar.CookieJar()
  opener=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
  opener.addheaders=[(&#39;User-Agent&#39;,&#39;Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36&#39;),(&#39;Cookie&#39;,&#39;4564564564564564565646540&#39;)]
  urllib.request.install_opener(opener)
  page = urllib.request.urlopen(url)
  html = page.read()
  return html
#print ( html)
#html = getHtml("http://weibo.com/")
def getimg(html):
  html = html.decode(&#39;utf-8&#39;)
  reg=&#39;"screen_name":"(.*?)"&#39;
  imgre = re.compile(reg)
  src=re.findall(imgre,html)
  return src
#print ("",getimg(html))
uid=[&#39;2808675432&#39;,&#39;3888405676&#39;,&#39;2628551531&#39;,&#39;2808587400&#39;]
for a in list(uid):
  print (getimg(getHtml("http://weibo.com/"+a)))
  time.sleep(1)

로그인 후 복사

위 내용은 Python3.4 기반의 간단한 크롤러 기능에 대한 자세한 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨：

기다 단순한

원천：php.cn

이전 기사：Python에서 구현된 8가지 정렬 알고리즘 요약(1부) 다음 기사：Python 개발 MapReduce 시리즈 WordCount 데모

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

저자별 최신 기사

PHP 배열에 요소를 추가하는 방법

2023-03-14 15:58:02
간단한 객관식 평가 시스템을 구현하는 JS를 보여주는 예

1970-01-01 08:00:00
동일한 IP의 여러 제출을 제한하는 PHP 솔루션

2023-03-15 07:38:01
정규식을 사용하여 HTML에서 양식 유효성 검사 구현

1970-01-01 08:00:00
JavaScript 엄격 모드의 포인팅 문제에 대한 자세한 설명

1970-01-01 08:00:00
Java로 트리 메뉴(다단계 메뉴 포함)를 작성하기 위한 예제 코드

1970-01-01 08:00:00
마우스 오버 시 부드러운 전환을 구현하는 CSS3의 예에 대한 자세한 설명

1970-01-01 08:00:00
Swiper 캐러셀 이미지 소스코드 공유 분석

1970-01-01 08:00:00
VsCode 플러그인 요약 및 구성

1970-01-01 08:00:00
HttpUtils 요청 도구 클래스 코드

1970-01-01 08:00:00

최신 이슈

function_exists()는 사용자 정의 함수를 결정할 수 없습니다. 기능 테스트() { ...

에서 2024-04-29 11:01:01

0

3

2289

Chrome 모바일 버전을 표시하는 방법 안녕하세요 선생님, Chrome을 모바일 버전으로 어떻게 변경하나요?

에서 2024-04-23 00:22:19

0

11

2429

자식 창이 부모 창을 작동하지만 출력이 응답하지 않습니다. 처음 두 문장은 실행 가능하지만 마지막 문장은 구현할 수 없습니다.

에서 2024-04-19 15:37:47

0

1

2041

상위 창에 출력이 없습니다. document.onclick = function(){ window.opener.document.write('나는 자식 창의 출력입니다.');

에서 2024-04-18 23:52:34

0

1

1926

CSS 마인드맵 코스웨어는 어디에 있나요? 코스웨어

에서 2024-04-16 10:10:18

0

0

1998

관련 주제

더>

인기 추천

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿