Gemeinschaft Lernen Tools-Bibliothek Freizeit

Deutsch

Heim > Backend-Entwicklung > Python-Tutorial > Hauptteil

python正则匹配抓取豆瓣电影链接和评论代码分享

WBOY

Freigeben： 2016-06-06 11:28:58

Original

1122 Leute haben es durchsucht

代码如下:

import urllib.request
import re
import time

def movie(movieTag):

    tagUrl=urllib.request.urlopen(url)
    tagUrl_read = tagUrl.read().decode('utf-8')
    return tagUrl_read

def subject(tagUrl_read):

    '''
        这里还存在问题：
        ①这只针对单独的一页进行排序，而没有对全部页面的电影进行排序
        ②下次更新添加电影链接，考虑添加电影海报
        ③需要追加列表
        ④导入到本地txt或excel中
        ⑤在匹配电影名字时是否可以同时匹配链接与名字、评分、评论组成数组
        ⑥
    '''
#正则表达式匹配电影的名字（链接）、评分与评论
    nameURL = re.findall(r'(http://movie.douban.com/subject/[0-9.]+)\/"\s+title="(.+)"',tagUrl_read)
    scoreURL = re.findall(r'([0-9.]+)',tagUrl_read)
    evaluateURL = re.findall(r'\((\w+)人评价\)',tagUrl_read)
    movieLists = list(zip(nameURL,scoreURL,evaluateURL))
    newlist.extend(movieLists)
    return newlist

#用quote处理特殊（中文）字符
movie_type = urllib.request.quote(input('请输入电影类型(如剧情、喜剧、悬疑)：'))
page_end=int(input('请输入搜索结束时的页码：'))
num_end=page_end*20
num=0
page_num=1
newlist=[]
while num    url=r'http://movie.douban.com/tag/%s?start=%d'%(movie_type,num)
    movie_url = movie(url)
    subject_url=subject(movie_url)
    num=page_num*20
    page_num+=1
else:
    #使用sorted函数对列表进行排列，reverse参数为True时升序，默认或False时为降序， key=lambda还不是很明白这里的原理
    movieLIST = sorted(newlist, key=lambda movieList : movieList[1],reverse = True)
    for movie in movieLIST:
        print(movie)

time.sleep(3)

print('结束')

Verwandte Etiketten：

python正则匹配豆瓣电影

Quelle：php.cn

Vorheriger Artikel：python模拟登录百度贴吧(百度贴吧登录)实例 Nächster Artikel：python获取beautifulphoto随机某图片代码实例

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Neueste Artikel des Autors

Was ist eine NullPointerException und wie behebe ich sie?

2024-10-22 09:46:29
Vom Anfänger zum Programmierer: Ihre Reise beginnt mit C-Grundlagen

2024-10-13 13:53:41
Webentwicklung mit PHP freischalten: Ein Leitfaden für Anfänger

2024-10-12 12:15:51
C entmystifizieren: Ein klarer und einfacher Weg für neue Programmierer

2024-10-11 22:47:31
Entfalten Sie Ihr Programmierpotenzial: C-Programmierung für absolute Anfänger

2024-10-11 19:36:51
Entfesseln Sie Ihren inneren Programmierer: C für absolute Anfänger

2024-10-11 15:50:41
Automatisieren Sie Ihr Leben mit C: Skripte und Tools für Anfänger

2024-10-11 15:07:41
PHP leicht gemacht: Ihre ersten Schritte in der Webentwicklung

2024-10-11 14:21:21
Erstellen Sie alles mit Python: Ein Leitfaden für Anfänger, um Ihrer Kreativität freien Lauf zu lassen

2024-10-11 12:59:11
Der Schlüssel zum Programmieren: Die Leistungsfähigkeit von Python für Anfänger freischalten

2024-10-11 12:17:31

Aktuelle Ausgaben

Regulärer Ausdruck zum Abgleichen von Wörtern Ich habe ein Skript, in dem ich versuche, neue Jobnamen mit vorhandenen Jobnamen in einer ...

Aus 2024-04-06 21:24:04

0

1

606

PHP: Regulärer Ausdruck zum Abgleichen und Ersetzen mehrerer Instanzen mehrerer doppelter Übereinstimmungen Ich möchte ein Shortcode-System für eine Gaming-Community/-Datenbank schreiben, in dem Ben...

Aus 2024-04-04 15:41:01

0

1

439

Kann ich ein JSON-Array-Feld mit der IN-Klausel verwenden? Ich habe diese Abfrage ausgeführt: select*fromhousedatawhereJSON_EXTRACT(properties->&q...

Aus 2024-04-04 10:51:09

0

1

263

Problem: Regulärer MySQL-Ausdruck (Limiter funktioniert nicht) Mod-Hinweis: Nicht entfernen/Nicht schließen Ich habe diese Frage schon einmal gestellt un...

Aus 2024-04-02 23:35:21

0

1

263

Die Behauptungen des HTML-Eingabemodus sind inkonsistent, während die Behauptungen des JavaScript-Tests konsistent sind Ich versuche, einen Mustervergleich bei einer Passworteingabe durchzuführen, aber irgendwi...

Aus 2024-04-02 08:50:49

0

1

287

verwandte Themen

Mehr>

Beliebte Empfehlungen

Beliebte Tutorials

Mehr>

Verwandte Tutorials

Beliebte Empfehlungen

Aktuelle Kurse

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1418576
php入门教程之一周学会PHP

4260165
JAVA 初级入门视频教程

2495363
小甲鱼零基础入门学习Python视频教程

504721
PHP 零基础入门教程

859646

Neueste Downloads

Mehr>

Web-Effekte

Quellcode der Website

Website-Materialien

Frontend-Vorlage