Cara Membuat CLI Wikipedia
Bina alat baris arahan Wikipedia menggunakan Python dan API Wikipedia
Membuat alat antara muka baris arahan Wikipedia (CLI) merupakan projek yang sangat memuaskan yang menggabungkan kesederhanaan Python dengan pangkalan pengetahuan Wikipedia yang luas. Tutorial ini akan membimbing anda langkah demi langkah membina alat CLI yang mendapat maklumat daripada Wikipedia menggunakan APInya.
Prasyarat
Sebelum anda bermula, pastikan anda mempunyai yang berikut:
- Python 3.7 atau lebih tinggi dipasang pada sistem anda.
- Pengetahuan asas Python dan pengalaman menggunakan API.
- Sambungan Internet untuk mengakses API Wikipedia.
Langkah 1: Fahami API Wikipedia
Wikipedia menyediakan API RESTful di //m.sbmmt.com/link/27bf6226213cf288dfbf62ffc02bad4f. API ini membolehkan pembangun menanyakan Wikipedia untuk kandungan, metadata dan banyak lagi. Titik akhir utama yang akan kami gunakan termasuk:
-
action=query
: Dapatkan kandungan umum daripada Wikipedia. -
list=search
: Cari artikel mengikut kata kunci. -
prop=extracts
: Dapatkan semula abstrak artikel.
URL asas untuk semua permintaan API ialah:
<code>//m.sbmmt.com/link/27bf6226213cf288dfbf62ffc02bad4f</code>
Langkah 2: Sediakan persekitaran Python
Mula-mula buat persekitaran maya Python dan pasang perpustakaan yang diperlukan. Kami akan menggunakan requests
untuk membuat permintaan HTTP dan argparse
untuk mengendalikan parameter CLI.
<code># 创建虚拟环境 python -m venv wikipedia-cli-env # 激活环境 # 在Windows上: wikipedia-cli-env\Scripts\activate # 在Mac/Linux上: source wikipedia-cli-env/bin/activate # 安装依赖项 pip install requests argparse</code>
Langkah 3: Rancang fungsi CLI
Alat CLI kami akan menyertakan ciri berikut:
- Cari artikel Wikipedia : Membolehkan pengguna mencari artikel mengikut kata kunci.
- Dapatkan ringkasan artikel: Dapatkan ringkasan ringkas artikel tertentu.
- Lihat Bantuan CLI: Memaparkan arahan penggunaan.
Langkah 4: Laksanakan alat CLI
Berikut ialah kod Python untuk alat CLI:
import argparse import requests # 定义维基百科API的基本URL WIKIPEDIA_API_URL = "//m.sbmmt.com/link/27bf6226213cf288dfbf62ffc02bad4f" def search_articles(query): """搜索与查询匹配的维基百科文章。""" params = { 'action': 'query', 'list': 'search', 'srsearch': query, 'format': 'json', } response = requests.get(WIKIPEDIA_API_URL, params=params) response.raise_for_status() # 对错误的响应引发错误 data = response.json() if 'query' in data: return data['query']['search'] else: return [] def get_article_summary(title): """获取维基百科文章的摘要。""" params = { 'action': 'query', 'prop': 'extracts', 'exintro': True, 'titles': title, 'format': 'json', } response = requests.get(WIKIPEDIA_API_URL, params=params) response.raise_for_status() data = response.json() pages = data.get('query', {}).get('pages', {}) for page_id, page in pages.items(): if 'extract' in page: return page['extract'] return "No summary available." def main(): parser = argparse.ArgumentParser(description="一个与维基百科交互的CLI工具。") subparsers = parser.add_subparsers(dest="command") # 子命令:search search_parser = subparsers.add_parser("search", help="在维基百科上搜索文章。") search_parser.add_argument("query", help="搜索查询。") # 子命令:summary summary_parser = subparsers.add_parser("summary", help="获取特定维基百科文章的摘要。") summary_parser.add_argument("title", help="维基百科文章的标题。") args = parser.parse_args() if args.command == "search": results = search_articles(args.query) if results: print("搜索结果:") for result in results: print(f"- {result['title']}: {result['snippet']}") else: print("未找到结果。") elif args.command == "summary": summary = get_article_summary(args.title) print(summary) else: parser.print_help() if __name__ == "__main__": main()
Langkah 5: Uji alat CLI
Simpan skrip sebagai wikipedia_cli.py
. Anda kini boleh menjalankan alat dari terminal:
- Cari artikel:
<code>python wikipedia_cli.py search "Python programming"</code>
- Dapatkan ringkasan artikel:
<code>python wikipedia_cli.py summary "Python (programming language)"</code>
Langkah 6: Tingkatkan Alat
Untuk menjadikan alat lebih berkuasa dan mesra pengguna, sila pertimbangkan untuk menambah yang berikut:
- Rawatan ralat : Menyediakan mesej ralat terperinci untuk permintaan API yang gagal. Format
- : Gunakan perpustakaan seperti untuk mendapatkan output yang lebih indah.
rich
Caches : Mencapai cache untuk mengelakkan berulang panggilan API yang berulang kali ditanyakan. - Fungsi tambahan : Tambah sokongan untuk mendapatkan artikel, kategori atau imej yang berkaitan.
- Kesimpulan Anda telah berjaya menggunakan Python dan APInya untuk membina alat Wikipedia CLI! Alat ini boleh digunakan sebagai titik permulaan yang baik untuk projek yang lebih maju, seperti mengintegrasikannya ke dalam aplikasi lain atau membuat versi GUI. Saya doakan anda gembira!
Atas ialah kandungan terperinci Cara Membuat CLI Wikipedia. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Kunci untuk menangani pengesahan API adalah untuk memahami dan menggunakan kaedah pengesahan dengan betul. 1. Apikey adalah kaedah pengesahan yang paling mudah, biasanya diletakkan dalam tajuk permintaan atau parameter URL; 2. BasicAuth menggunakan nama pengguna dan kata laluan untuk penghantaran pengekodan Base64, yang sesuai untuk sistem dalaman; 3. OAuth2 perlu mendapatkan token terlebih dahulu melalui client_id dan client_secret, dan kemudian bawa bearertoken dalam header permintaan; 4. Untuk menangani tamat tempoh token, kelas pengurusan token boleh dikemas dan secara automatik menyegarkan token; Singkatnya, memilih kaedah yang sesuai mengikut dokumen dan menyimpan maklumat utama adalah kunci.

Untuk mewujudkan API moden dan cekap menggunakan Python, FastAPI disyorkan; Ia berdasarkan kepada jenis python standard yang diminta dan secara automatik dapat menghasilkan dokumen, dengan prestasi yang sangat baik. Selepas memasang FastAPI dan Asgi Server UVicorn, anda boleh menulis kod antara muka. Dengan menentukan laluan, menulis fungsi pemprosesan, dan data yang kembali, API boleh dibina dengan cepat. FastAPI menyokong pelbagai kaedah HTTP dan menyediakan sistem dokumentasi Swaggersui dan Redoc yang dihasilkan secara automatik. Parameter URL boleh ditangkap melalui definisi laluan, manakala parameter pertanyaan boleh dilaksanakan dengan menetapkan nilai lalai untuk parameter fungsi. Penggunaan rasional model Pydantic dapat membantu meningkatkan kecekapan dan ketepatan pembangunan.

Dalam Python, pembolehubah yang ditakrifkan di dalam fungsi adalah pembolehubah tempatan dan hanya sah dalam fungsi; Ditakrifkan secara luaran adalah pembolehubah global yang boleh dibaca di mana sahaja. 1. Pembolehubah tempatan dimusnahkan kerana fungsi dilaksanakan; 2. Fungsi ini boleh mengakses pembolehubah global tetapi tidak dapat diubahsuai secara langsung, jadi kata kunci global diperlukan; 3. Jika anda ingin mengubah suai pembolehubah fungsi luar dalam fungsi bersarang, anda perlu menggunakan kata kunci nonlocal; 4. Pembolehubah dengan nama yang sama tidak mempengaruhi satu sama lain dalam skop yang berbeza; 5. Global mesti diisytiharkan apabila mengubah suai pembolehubah global, jika tidak, kesilapan unboundlocalerror akan dibangkitkan. Memahami peraturan ini membantu mengelakkan pepijat dan menulis lebih banyak fungsi yang boleh dipercayai.

Untuk menguji API, anda perlu menggunakan Perpustakaan Permintaan Python. Langkah -langkahnya adalah untuk memasang perpustakaan, menghantar permintaan, mengesahkan respons, menetapkan masa dan cuba semula. Pertama, pasang perpustakaan melalui PipinstallRequests; kemudian gunakan permintaan.get () atau requests.post () dan kaedah lain untuk menghantar permintaan GET atau pos; Kemudian semak respons.status_code dan response.json () untuk memastikan hasil pulangan mematuhi jangkaan; Akhirnya, tambah parameter tamat masa untuk menetapkan masa tamat, dan menggabungkan perpustakaan semula untuk mencapai percubaan automatik untuk meningkatkan kestabilan.

Bagaimana cara mengendalikan fail JSON yang besar di Python? 1. Gunakan Perpustakaan IJSON untuk mengalir dan mengelakkan limpahan memori melalui parsing item demi item; 2. Jika dalam format Jsonlines, anda boleh membacanya dengan garis dan memprosesnya dengan json.loads (); 3. Atau memecah fail besar ke dalam kepingan kecil dan kemudian memprosesnya secara berasingan. Kaedah ini dengan berkesan menyelesaikan masalah batasan memori dan sesuai untuk senario yang berbeza.

Ya, apythonclasscanhavemulleConstructorsThoughalternetechniques.1.usedefaultargumentsIntheS

Di Python, kaedah melintasi tupel dengan gelung termasuk secara langsung melelehkan unsur -unsur, mendapatkan indeks dan elemen pada masa yang sama, dan memproses tuple bersarang. 1. Gunakan gelung untuk terus mengakses setiap elemen dalam urutan tanpa menguruskan indeks; 2. Gunakan penghitungan () untuk mendapatkan indeks dan nilai pada masa yang sama. Indeks lalai adalah 0, dan parameter permulaan juga boleh ditentukan; 3. Di samping itu, tuple tidak berubah dan kandungan tidak dapat diubah suai dalam gelung. Nilai yang tidak diingini boleh diabaikan oleh \ _. Adalah disyorkan untuk memeriksa sama ada tuple kosong sebelum melintasi untuk mengelakkan kesilapan.

Kunci untuk menggunakan Python untuk memanggil WebAPI untuk mendapatkan data adalah untuk menguasai proses asas dan alat umum. 1. Menggunakan permintaan untuk memulakan permintaan HTTP adalah cara yang paling langsung. Gunakan kaedah GET untuk mendapatkan respons dan gunakan JSON () untuk menghuraikan data; 2. Bagi API yang memerlukan pengesahan, anda boleh menambah token atau kunci melalui tajuk; 3. Anda perlu menyemak kod status tindak balas, disyorkan untuk menggunakan respons.raise_for_status () untuk mengendalikan pengecualian secara automatik; 4. Menghadapi antara muka paging, anda boleh meminta halaman yang berbeza pada gilirannya dan menambah kelewatan untuk mengelakkan batasan kekerapan; 5. Semasa memproses data JSON yang dikembalikan, anda perlu mengekstrak maklumat mengikut struktur, dan data kompleks dapat ditukar kepada data
