Il s'inspire principalement du script Python pour l'analyse des actualités, l'analyse statistique de la segmentation du texte et la génération de nuages de mots, tels qu'implémentés dans les projets sur la plateforme CSDN. J'ai également écrit mon propre script pour classer plus précisément les actualités complexes liées aux aspects de l'intelligence artificielle et de l'apprentissage automatique. J'ai essayé, mais la quantité de travail s'est avérée trop lourde et il s'est avéré plus facile d'utiliser la classification existante du portail d'information Chita.ru. Étant donné que le code source de l'article mentionné est difficile à lire et qu'il inclut des bibliothèques supplémentaires telles que des nuages de mots, il est difficile de le rendre multiplateforme, j'ai donc décidé d'écrire mon propre script.
Ce script vous permet d'extraire les actualités du site Chita.ru et de les enregistrer dans Excel.
Bibliothèques utilisées : requests, BeautifulSoup pour l'analyse et openpyxl pour travailler avec Excel.
Vous pouvez exécuter le script directement depuis le terminal en utilisant la commande suivante.
Cette commande télécharge et exécute un script Python pour recevoir des nouvelles de Chita.ru :
python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
Script Python (disponible sur GitHub) :
Voir sur GitHub
python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
- Je. V. Sokolova, A. V. Kuznetsova - « Étude sur l'extraction des risques sociaux sur la base des requêtes d'actualités populaires dans les moteurs de recherche » (Institut d'analyse des systèmes de l'Académie des sciences de Russie, Systèmes et réseaux, Vol. 39, No. 1 janvier 2020)
- D. I. Fedorov - « Analyse de la fonctionnalité des services d'information du réseau social VKontakte dans le contexte du big data » (Université d'État de Moscou, Faculté de journalisme, 2017)
- V. A. Pavlov - « Tendances de la lecture des informations en ligne en Russie : l'exemple des requêtes de recherche populaires » (Université d'État de Moscou, Modern Media, 2013, n° 9)
- Je. N. Gusev - « Ambiance sociale et caractéristiques structurelles de la pensée sociale russe dans le contexte de l'analyse du Big Data » (RSU, RSU Journal, 2013, n° 5)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!