我想爬电影票房的数据,网站是http://www.cbooo.cn/movieweek,我要爬网页最下面的【票房日期:2016-11-14至2016-11-20 单周票房:57271万 单周场次:1463995场 单周人次:1781万】这些数据,代码如下:
from bs4 import BeautifulSoup
import urllib.request
z = input("请输入网址:")
a = urllib.request.urlopen(z).read()
b = BeautifulSoup(a,"html.parser")
c = b.select("#content > p.alldate")
for i in c:
print(i.get_text())
输出结果是
票房日期:
单月票房:万
单月场次:万场
单月人次:万
关键的数据没有啊,这是怎么回事呢,我最想要的是那些数据,怎么弄也没有,跪求解决办法
谢谢
谢谢
谢谢
Étant donné que les données dont vous avez besoin sont générées dynamiquement par ajax et ne peuvent pas être trouvées dans le code source html, vous devez pouvoir charger dynamiquement l'outil js. Vous pouvez l'utiliser
selenium+PhantomJS
pour exécuter le contenu js. , mais c'est relativement lent.Mais pour le site Web que vous devez explorer, utilisez le navigateur pour capturer le paquet et constatez que le chemin de la requête ajax est
Vous pouvez donc initier une demande directement,
Pas besoin d'utiliser phantomJS ci-dessus. Il s'avère que la chaîne json renvoyée contient les données dont vous avez besoin et que les données dont vous avez besoin se trouvent dans data2 à la fin.