> 백엔드 개발 > 파이썬 튜토리얼 > Python 비디오 크롤러는 헤드라인 비디오 다운로드를 구현합니다.

Python 비디오 크롤러는 헤드라인 비디오 다운로드를 구현합니다.

不言
풀어 주다: 2018-05-07 13:49:15
원래의
2077명이 탐색했습니다.

이 글에서는 주로 Python 정규 매칭, 네트워크 전송, 파일 읽기 및 쓰기 및 기타 관련 운영 기술을 포함한 헤드라인 동영상 다운로드 기능을 구현하는 Python 비디오 크롤러를 소개합니다.

이 글에서는 예제를 설명합니다. Python 비디오 크롤러의 헤드라인 비디오 기능 다운로드를 구현합니다. 참고용으로 모든 사람과 공유하세요. 세부 사항은 다음과 같습니다.

1. 수요 분석

헤드라인 짧은 동영상 캡처

아이디어:

웹 페이지 소스 코드를 분석하고, 동영상 리소스를 찾아 구문 분석합니다. URL (소스 코드 보기, mp4 검색)
URL에 대한 요청 시작 및 바이너리 데이터 반환
바이너리 데이터를 비디오 형식으로 저장

비디오 링크:
http://video.eastday.com/a/170612170956054127565 .html

2. 코드 구현

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's
로그인 후 복사

"D:Program FilesPython27python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok, 다운로드 완료!
총 소요 시간: 3.204 99992371s
종료 코드 0

으로 프로세스가 완료되었습니다.

다운로드가 완료되었으며 재생할 수 있습니다~

관련 권장 사항:

파이썬 비디오 고속 전송 프로그램을 만드는 videocapture 라이브러리

위 내용은 Python 비디오 크롤러는 헤드라인 비디오 다운로드를 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿