Es ist hauptsächlich vom Python-Skript für das Parsen von Nachrichten, die statistische Analyse der Textsegmentierung und die Generierung von Wortwolken inspiriert, wie es in Projekten auf der CSDN-Plattform implementiert ist. Außerdem habe ich mein eigenes Skript geschrieben, um komplexe Nachrichten im Zusammenhang mit Aspekten der künstlichen Intelligenz und des maschinellen Lernens genauer zu klassifizieren. Ich habe es versucht, aber der Arbeitsaufwand erwies sich als zu groß und es erwies sich als einfacher, die bestehende Klassifizierung des Nachrichtenportals Chita.ru zu verwenden. Da der Quellcode aus dem genannten Artikel schwer zu lesen ist und zusätzliche Bibliotheken wie Wortwolken enthält, ist es schwierig, ihn plattformübergreifend zu machen, also habe ich beschlossen, mein eigenes Skript zu schreiben.
Mit diesem Skript können Sie Nachrichten von der Website Chita.ru extrahieren und in Excel speichern.
Verwendete Bibliotheken: requests, BeautifulSoup zum Parsen und openpyxl für die Arbeit mit Excel.
Sie können das Skript mit dem folgenden Befehl direkt vom Terminal aus ausführen.
Dieser Befehl lädt ein Python-Skript herunter und führt es aus, um Nachrichten von Chita.ru zu empfangen:
python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
Python-Skript (verfügbar auf GitHub):
Auf GitHub ansehen
python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
- Ich. V. Sokolova, A. V. Kuznetsova – „Studie zur Extraktion sozialer Risiken basierend auf beliebten Nachrichtenanfragen in Suchmaschinen“ (Institut für Systemanalyse der Russischen Akademie der Wissenschaften, Systeme und Netzwerke, Bd. 39, Nr. 1. Januar 2020)
- D. I. Fedorov – „Analyse der Funktionalität von Nachrichtendiensten im sozialen Netzwerk VKontakte im Kontext von Big Data“ (Moskauer Staatliche Universität, Fakultät für Journalismus, 2017)
- V. A. Pavlov – „Trends beim Lesen von Online-Nachrichten in Russland: das Beispiel beliebter Suchanfragen“ (Moskauer Staatsuniversität, Moderne Medien, 2013, Nr. 9)
- Ich. N. Gusev – „Soziale Atmosphäre und Strukturmerkmale des russischen Sozialdenkens im Kontext der Big-Data-Analyse“ (RSU, RSU Journal, 2013, Nr. 5)
Das obige ist der detaillierte Inhalt von[Python] Skript zum Empfangen von Nachrichten von der Website Chita.ru. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!