84669 人が学習中
152542 人が学習中
20005 人が学習中
5487 人が学習中
7821 人が学習中
359900 人が学習中
3350 人が学習中
180660 人が学習中
48569 人が学習中
18603 人が学習中
40936 人が学習中
1549 人が学習中
1183 人が学習中
32909 人が学習中
我想爬取每个电影的制片国家地区,但是它上面并不在一个标签里面应该怎么办我用的是request和BeautifulSoup
res2=requests.get(h2) res2.encoding='utf-8' soup2=BeautifulSoup(res2.text)
这部分是已经获取该网页
认证0级讲师
参考以下代码:
#!/usr/bin/env python # -*- coding:utf-8 -*- import re import requests from bs4 import BeautifulSoup result = requests.get('https://movie.douban.com/subject/3541415/') result.encoding = 'utf-8' soup = BeautifulSoup(result.text, 'html.parser') try: info = soup.select('#info')[0] print re.findall(ur'(?<=制片国家/地区: ).+?(?=\n)', info.text)[0] except Exception, e: print e
正则匹配和之间的内容。
1、可以用正则
2、建议用soup.find_all看文档
https://www.crummy.com/softwa...
soup.find_all("title") # [The Dormouse's story] soup.find_all("p", "title") # [The Dormouse's story] soup.find_all("a") # [Elsie, # Lacie, # Tillie] soup.find_all(id="link2") # [Lacie]
The Dormouse's story
黄哥Python 回答
参考以下代码:
正则匹配
和
之间的内容。1、可以用正则
2、建议用soup.find_all
看文档
https://www.crummy.com/softwa...
黄哥Python 回答