これは主に、CSDN プラットフォーム上のプロジェクトで実装されている、ニュース解析、テキスト セグメンテーションの統計分析、およびワード クラウド生成のための Python スクリプトからインスピレーションを得ています。また、人工知能と機械学習の側面に関連する複雑なニュース項目をより正確に分類するための独自のスクリプトも作成しました。試してみましたが、作業量が多すぎることが判明し、ニュース ポータル Chita.ru の既存の分類を使用する方が簡単であることが判明しました。言及された記事のソース コードが読みにくく、ワード クラウドなどの追加ライブラリが含まれていることを考慮すると、クロスプラットフォームにするのが難しいため、独自のスクリプトを作成することにしました。
このスクリプトを使用すると、サイト Chita.ru からニュースを抽出し、Excel に保存できます。
使用されるライブラリ: requests、解析用の BeautifulSoup、Excel での作業用の openpyxl。
次のコマンドを使用して、ターミナルからスクリプトを直接実行できます。
このコマンドは、Chita.ru からニュースを受信するための Python スクリプトをダウンロードして実行します:
python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
Python スクリプト (GitHub で入手可能):
GitHub で表示
python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
- 私。 V. Sokolova、A. V. Kuznetsova - 「検索エンジンで人気のニュース クエリに基づいた社会リスク抽出の研究」 (ロシア科学アカデミー システム分析研究所、システムとネットワーク、Vol. 39、No. 2020年1月1日)
- D. I. フェドロフ - 「ビッグデータの文脈におけるソーシャル ネットワーク VKontakte のニュース サービスの機能の分析」 (モスクワ州立大学ジャーナリズム学部、2017 年)
- V. A. パブロフ - 「ロシアにおけるオンライン ニュースの読み方の傾向: 人気の検索クエリの例」 (モスクワ州立大学、モダン メディア、2013 年、第 9 号)
- 私。 N. グセフ - 「ビッグデータ分析の文脈におけるロシア社会思想の社会的雰囲気と構造的特徴」 (RSU、RSU Journal、2013 年、第 5 号)
以上が[Python] Chita.ru サイトからニュースを受信するためのスクリプトの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。