python - 爬虫获取页面链接，求问如何判断是最新的链接？

Question

小弟想做一个自动转发网站新闻的微博机器人作为python练手项目。我知道需要api对接、需要爬取网站的新闻链接和标题。但是如何只提取最新的新闻呢？以下是按照我的要求过滤后，输出所有新闻的代码: {代码...} 我想...

伊谢尔伦 · Answer

ライブブロードキャストをクロールしていますか?

変数 lasttime を設定して、最後のクロールの時刻を記録できます

リーリー

阿神 · Answer

実際、この問題は非常によくある問題、つまり重い文章です。まず、各ニュースにタイムスタンプやライブブロードキャストバーの接続方法などの一意の識別子を追加する必要があります: "http://news.zhibo8.cc/zuqiu/2016-10-18/5805df3d3422f",利用可能:

リーリー

ニュースの一意の ID として、より厳密には、0:

などのサッカーのロゴを追加します。リーリー

一意の ID を使用すると、現在のページのニュースの ID を順番にメモリに保存してから、次のページをクロールするなど、さまざまな方法で処理が容易になります。新しいニュースは、現在のリストの最初の ID の後のニュースです。次に、リストを更新します。たとえば、新しいニュースが n 件追加された場合、古いニュースをリストから削除できます。空間や時間に関係なく、とても良いです。
ニュースを保存したい場合は、削除したニュースを毎回データベースに保存してください。

迷茫 · Answer

ニュース Web ページには時間フィールドがありませんか?

大家讲道理 · Answer

あなたの目標は、最新のニュースを抽出し、設定したキーワードを含めることです。！実際、最も簡単な方法は、time.sleep(60) を設定し、1 分後に Web ページのデータを再クロールすることです。そうすれば、最新のニュースを入手できますよね。また、あなたの質問には情報が少なすぎます。

php 8、私も来ます

ウェブサイトのレイアウトを 30 分で学ぶ

ビデオチュートリアルに精通したOracleの入門

あなたの最初のUNI-APPコード

ゼロからアプリの起動までフラッター

兄弟連新版Linuxビデオチュートリアル

AXURE 9 ビデオチュートリアル (プロダクトマネージャーのインタラクティブな製品設計 UI に適しています)

基礎能力ゼロ PS ビデオチュートリアル

16日間のUIビデオチュートリアル

PS テクニックとスライステクニックのビデオチュートリアル

アリクラウド環境構築およびプロジェクトオンラインビデオチュートリアル

コンピュータネットワークの概要 - プログラマが身につけるべき基礎知識

プログラマーのための基本チュートリアル - HTTP プロトコルの説明

Websocket ビデオチュートリアル