[Cara menggunakan ungkapan biasa Python untuk menukar aksara Cina kepada Pinyin]
Dalam kerja dan kehidupan harian, selalunya perlu untuk menukar aksara Cina kepada Pinyin, yang menjadikannya lebih mudah untuk mencari dan memproses teks Cina . Menggunakan ungkapan biasa Python, anda boleh melaksanakan fungsi menukar aksara Cina kepada Pinyin dengan mudah. Saya akan berkongsi kaedah pelaksanaan khusus di bawah.
Pertama, kita perlu memasang pustaka Pinyin, di sini kita menggunakan pustaka pihak ketiga Pinyin. Ia boleh dipasang melalui arahan berikut:
pip install pinyin
Seterusnya, kami perlu mengimport pustaka:
import pinyin
Seterusnya, kami menggunakan ungkapan biasa untuk memproses teks Cina. Mari kita lihat ungkapan biasa yang perlu digunakan:
pattern = re.compile(u'[u4e00-u9fa5]+')
Maksud ungkapan biasa ini adalah untuk memadankan semua aksara Cina, dengan u4e00
mewakili aksara Cina pertama dalam bahasa Cina dan u9fa5
mewakili aksara Cina terakhir aksara Cina.
Langkah seterusnya, kita boleh mentakrifkan fungsi untuk menukar aksara Cina kepada pinyin, seperti yang ditunjukkan di bawah:
def chinese_to_pinyin(sentence): # 正则表达式匹配中文 pattern = re.compile(u'[u4e00-u9fa5]+') # 分离出中文 result = pattern.findall(sentence) # 对每个中文转换为拼音 for ch in result: sentence = sentence.replace(ch, pinyin.get(ch, format="strip", delimiter="")) return sentence
Proses pelaksanaan fungsi ini adalah seperti berikut:
get
dalam pustaka pinyin untuk menukarnya kepada bentuk pinyin. Seterusnya kita boleh menguji fungsi ini, seperti yang ditunjukkan di bawah:
text = '这是一个测试,将汉字转换为拼音的测试。' print(chinese_to_pinyin(text)) # 输出结果:zhe shi yi ge ce shi,jiang han zi zhuan huan wei pin yin de ce shi。
Pada ketika ini, kami telah berjaya menukar aksara Cina kepada pinyin.
Sudah tentu, jika anda mahu pinyin yang ditukar dijadikan huruf besar atau semua huruf besar, anda boleh melakukannya dengan menambahkan parameter, seperti yang ditunjukkan di bawah:
# 转换为首字母大写形式 pinyin.get('你好', format='strip', delimiter=' ', capitalize=True) # 输出结果:Nǐ Hǎo # 转换为全大写 pinyin.get('你好', format='strip', delimiter='').upper() # 输出结果:NI HAO
Ringkasan:
Melalui Python biasa Menggunakan ungkapan dan perpustakaan pihak ketiga Pinyin, kami dengan mudah melaksanakan fungsi menukar aksara Cina kepada Pinyin. Kaedah ini sesuai untuk memproses beberapa data teks dan mempunyai nilai rujukan tertentu untuk jurutera dan penyelidik yang perlu memproses teks.
Atas ialah kandungan terperinci Cara menggunakan ungkapan biasa Python untuk menukar aksara Cina kepada Pinyin. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!