Ia diilhamkan terutamanya oleh skrip Python untuk penghuraian berita, analisis statistik pembahagian teks dan penjanaan awan perkataan, seperti yang dilaksanakan dalam projek pada platform CSDN. Saya juga menulis skrip saya sendiri untuk mengklasifikasikan item berita kompleks yang berkaitan dengan aspek kecerdasan buatan dan pembelajaran mesin dengan lebih tepat. Saya cuba, tetapi jumlah kerja ternyata terlalu banyak, dan ternyata lebih mudah untuk menggunakan klasifikasi sedia ada dari portal berita Chita.ru. Memandangkan kod sumber daripada artikel yang disebutkan sukar dibaca dan ia termasuk perpustakaan tambahan seperti awan perkataan, sukar untuk menjadikannya merentas platform, jadi saya memutuskan untuk menulis skrip saya sendiri.
Skrip ini membolehkan anda mengekstrak berita daripada tapak Chita.ru dan menyimpannya dalam Excel.
Perpustakaan yang digunakan: permintaan, BeautifulSoup untuk menghurai dan openpyxl untuk bekerja dengan Excel.
Anda boleh melaksanakan skrip terus dari terminal menggunakan arahan berikut.
Perintah ini memuat turun dan melaksanakan skrip Python untuk menerima berita daripada Chita.ru:
python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
Skrip Python (tersedia di GitHub):
Lihat di GitHub
python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
- Saya. V. Sokolova, A. V. Kuznetsova - "Kajian mengekstrak risiko sosial berdasarkan pertanyaan berita popular dalam enjin carian" (Institut Analisis Sistem Akademi Sains Rusia, Sistem dan Rangkaian, Jld. 39, No. 1, Januari 2020)
- D. I. Fedorov - "Analisis fungsi perkhidmatan berita dalam rangkaian sosial VKontakte dalam konteks data besar" (Moscow State University, Fakulti Kewartawanan, 2017)
- V. A. Pavlov - “Arah aliran membaca berita dalam talian di Rusia: contoh pertanyaan carian popular” (Moscow State University, Modern Media, 2013, No. 9)
- Saya. N. Gusev - "Suasana sosial dan ciri struktur pemikiran sosial Rusia dalam konteks analisis data besar" (RSU, Jurnal RSU, 2013, No. 5)
Atas ialah kandungan terperinci [Python] Skrip untuk menerima berita dari tapak Chita.ru. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!