网络爬虫 - python urlopen.read()不完整

Question

这个目的说来有点不忍启齿....不过抱着解决问题的态度，我还是提了这个问题：这个是原网页https://movie.douban.com/tag/%E6%83%85%E8%89%B2?start=0&amp;type=T 这个网页有20个电影，但我抓取的结果只有17个，我...

大家讲道理 · Answer

这个网页就17个电影。
补充：
未登录状态下，结果是17条。
登录状态下，结果是20条。
根据此逻辑，可以通过模拟登录，解决这个问题。

怪我咯 · Answer

https://movie.douban.com/tag/%E6%83%85%E8%89%B2?start=0&type=T

这个网页只有17个电影

巴扎黑 · Answer

用chrome的拷贝xpath功能,拷贝最后一个电影的xpath,是第17个.
//*[@id="content"]/p/p[1]/p[2]/table[17]