python - 如何爬取豆瓣电影的详细信息

Question

我想爬取每个电影的制片国家地区，但是它上面并不在一个标签里面应该怎么办我用的是request和BeautifulSoup {代码...} 这部分是已经获取该网页

ringa_lee · Answer

Référez-vous au code suivant :

#!/usr/bin/env python
# -*- coding:utf-8 -*-

import re
import requests
from bs4 import BeautifulSoup

result = requests.get('https://movie.douban.com/subject/3541415/')
result.encoding = 'utf-8'
soup = BeautifulSoup(result.text, 'html.parser')

try:
    info = soup.select('#info')[0]
    print re.findall(ur'(?<=制片国家/地区: ).+?(?=
)', info.text)[0]
except Exception, e:
    print e

迷茫 · Answer

regular correspond au contenu entre et .

怪我咯 · Answer

1. Vous pouvez utiliser des expressions régulières

2. Il est recommandé d'utiliser soup.find_all
pour lire le document

https://www.crummy.com/softwa...

soup.find_all("title")
# [The Dormouse's story]

soup.find_all("p", "title")
# [The Dormouse's story]

soup.find_all("a")
# [Elsie,
#  Lacie,
#  Tillie]

soup.find_all(id="link2")
# [Lacie]

Réponse de Huang Ge Python