Rumah > pembangunan bahagian belakang > Tutorial Python > Cara menggunakan ungkapan biasa Python untuk menukar aksara Cina kepada Pinyin

Cara menggunakan ungkapan biasa Python untuk menukar aksara Cina kepada Pinyin

WBOY
Lepaskan: 2023-06-22 10:33:41
asal
2056 orang telah melayarinya

[Cara menggunakan ungkapan biasa Python untuk menukar aksara Cina kepada Pinyin]

Dalam kerja dan kehidupan harian, selalunya perlu untuk menukar aksara Cina kepada Pinyin, yang menjadikannya lebih mudah untuk mencari dan memproses teks Cina . Menggunakan ungkapan biasa Python, anda boleh melaksanakan fungsi menukar aksara Cina kepada Pinyin dengan mudah. ​​Saya akan berkongsi kaedah pelaksanaan khusus di bawah.

Pertama, kita perlu memasang pustaka Pinyin, di sini kita menggunakan pustaka pihak ketiga Pinyin. Ia boleh dipasang melalui arahan berikut:

pip install pinyin
Salin selepas log masuk

Seterusnya, kami perlu mengimport pustaka:

import pinyin
Salin selepas log masuk

Seterusnya, kami menggunakan ungkapan biasa untuk memproses teks Cina. Mari kita lihat ungkapan biasa yang perlu digunakan:

pattern = re.compile(u'[u4e00-u9fa5]+')
Salin selepas log masuk

Maksud ungkapan biasa ini adalah untuk memadankan semua aksara Cina, dengan u4e00 mewakili aksara Cina pertama dalam bahasa Cina dan u9fa5 mewakili aksara Cina terakhir aksara Cina.

Langkah seterusnya, kita boleh mentakrifkan fungsi untuk menukar aksara Cina kepada pinyin, seperti yang ditunjukkan di bawah:

def chinese_to_pinyin(sentence):
    # 正则表达式匹配中文
    pattern = re.compile(u'[u4e00-u9fa5]+')
    # 分离出中文
    result = pattern.findall(sentence)
    # 对每个中文转换为拼音
    for ch in result:
        sentence = sentence.replace(ch, pinyin.get(ch, format="strip", delimiter=""))
    return sentence
Salin selepas log masuk

Proses pelaksanaan fungsi ini adalah seperti berikut:

  1. Penggunaan pertama Ungkapan biasa sepadan dengan semua aksara Cina dan menyimpannya dalam senarai.
  2. Kemudian untuk setiap aksara Cina, gunakan fungsi get dalam pustaka pinyin untuk menukarnya kepada bentuk pinyin.
  3. Akhir sekali, gantikan setiap aksara Cina dengan bentuk pinyin yang sepadan.

Seterusnya kita boleh menguji fungsi ini, seperti yang ditunjukkan di bawah:

text = '这是一个测试,将汉字转换为拼音的测试。'
print(chinese_to_pinyin(text)) 

# 输出结果:zhe shi yi ge ce shi,jiang han zi zhuan huan wei pin yin de ce shi。
Salin selepas log masuk

Pada ketika ini, kami telah berjaya menukar aksara Cina kepada pinyin.

Sudah tentu, jika anda mahu pinyin yang ditukar dijadikan huruf besar atau semua huruf besar, anda boleh melakukannya dengan menambahkan parameter, seperti yang ditunjukkan di bawah:

# 转换为首字母大写形式
pinyin.get('你好', format='strip', delimiter=' ', capitalize=True) 

# 输出结果:Nǐ Hǎo

# 转换为全大写
pinyin.get('你好', format='strip', delimiter='').upper() 

# 输出结果:NI HAO
Salin selepas log masuk

Ringkasan:

Melalui Python biasa Menggunakan ungkapan dan perpustakaan pihak ketiga Pinyin, kami dengan mudah melaksanakan fungsi menukar aksara Cina kepada Pinyin. Kaedah ini sesuai untuk memproses beberapa data teks dan mempunyai nilai rujukan tertentu untuk jurutera dan penyelidik yang perlu memproses teks.

Atas ialah kandungan terperinci Cara menggunakan ungkapan biasa Python untuk menukar aksara Cina kepada Pinyin. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan