首页 > 后端开发 > Python教程 > [Python] 用于从 Chita.ru 网站接收新闻的脚本

[Python] 用于从 Chita.ru 网站接收新闻的脚本

Patricia Arquette
发布: 2024-11-27 17:34:12
原创
753 人浏览过

[Python] Скрипт для получения новостей с сайта Chita.ru

使用 Python 从 Chita.ru 接收新闻

主要受到Python脚本的启发,用于新闻解析、文本切分统计分析和词云生成,并在CSDN平台的项目中实现。我还编写了自己的脚本,以更准确地对与人工智能和机器学习方面相关的复杂新闻进行分类。我尝试过,但工作量太大了,结果发现使用新闻门户Chita.ru中现有的分类会更容易。鉴于上述文章中的源代码难以阅读,并且其中包含词云等额外库,很难使其跨平台,所以我决定编写自己的脚本。

此脚本允许您从网站 Chita.ru 中提取新闻并将其保存在 Excel 中。

使用的库:requestsBeautifulSoup 用于解析,openpyxl 用于 Excel 工作。

运行脚本的便捷方式

您可以使用以下命令直接从终端执行脚本。

此命令下载并执行 Python 脚本以接收来自 Chita.ru 的新闻:

python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
登录后复制
登录后复制

Python 脚本(可在 GitHub 上获取):

在 GitHub 上查看

python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
登录后复制
登录后复制

最好与许多有关大数据分析的科学文章一起使用:

  • 我。 V. Sokolova,A. V. Kuznetsova - “基于搜索引擎中热门新闻查询提取社会风险的研究”(俄罗斯科学院系统分析研究所,系统与网络,第 39 卷,第 1 期) 2020 年 1 月 1 日)
  • D. I. Fedorov - “大数据背景下社交网络 VKontakte 中新闻服务的功能分析”(莫斯科国立大学新闻学院,2017 年)
  • V. A. 巴甫洛夫 - “俄罗斯在线新闻阅读趋势:流行搜索查询示例”(莫斯科国立大学,现代媒体,2013 年,第 9 期)
  • 我。 N. Gusev - “大数据分析背景下俄罗斯社会思想的社会氛围和结构特征”(RSU,RSU Journal,2013年,第5期)

以上是[Python] 用于从 Chita.ru 网站接收新闻的脚本的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:dev.to
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板