爬虫获取页面链接，求问如何判断是最新的链接？

想做一个自动转发网站新闻的微博机器人作为python练手项目。
我知道需要api对接、需要爬取网站的新闻链接和标题。
但是如何只提取最新的新闻呢？
以下是按照我的要求过滤后，输出所有新闻的代码:

bar = soup.find_all('li', attrs={'data-label': True})
news = len(bar)
for i in range(news):
    if u'巴塞罗那' in bar[i]['data-label'].split(','):
        print bar[i]

我想提取过滤后列表里的第一条:print bar .但提取后会反复显示len(bar)次，而且跳过过滤规则，请问如何解决？

# Python

小葫芦1829 天前288 次浏览

爬虫获取页面链接，求问如何判断是最新的链接？

全部回复(1)我要回复