masyarakat Belajar Perpustakaan Alatan Masa lapang

Melayu

Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimanakah Fungsi `unicodedata.normalize()` Python Memudahkan Perwakilan Unikod?

Bagaimanakah Fungsi `unicodedata.normalize()` Python Memudahkan Perwakilan Unikod?

DDD

Lepaskan： 2024-11-22 16:12:15

asal

244 orang telah melayarinya

How Does Python's `unicodedata.normalize()` Function Simplify Unicode Representations?

Menormalkan Unikod dalam Python: Mempermudahkan Perwakilan Unikod

Dalam Python, modul unicodedata menyediakan fungsi .normalize() untuk memudahkan perwakilan rentetan Unicode . Fungsi ini mengubah entiti Unicode terurai kepada bentuk komposit termudah mereka.

Pertimbangkan contoh berikut:

import unicodedata

char = "á"
print(len(char))  # Output: 1

[print(unicodedata.name(c)) for c in char]  # Output: ['LATIN SMALL LETTER A WITH ACUTE']

char = "á"
print(len(char))  # Output: 2

[print(unicodedata.name(c)) for c in char]  # Output: ['LATIN SMALL LETTER A', 'COMBINING ACUTE ACCENT']

Salin selepas log masuk

Aksara "á" terdiri daripada dua titik kod: U 0061 (HURUF KECIL LATIN A) dan U 0301 (MENGABUKKAN AKSEN AKUT). Diuraikan, aksara ini muncul sebagai "á."

Untuk menormalkan rentetan ini, kita boleh menggunakan .normalize('NFC'), yang mengembalikan bentuk yang digubah:

print(ascii(unicodedata.normalize('NFC', '\u0061\u0301')))  # Output: '\xe1'

Salin selepas log masuk

Sebaliknya, . normalize('NFD') mengembalikan bentuk terurai:

print(ascii(unicodedata.normalize('NFD', '\u00E1')))  # Output: 'a\u0301'

Salin selepas log masuk

Borang normalisasi tambahan wujud untuk dikendalikan mata kod keserasian. NFKC dan NFKD menggantikan aksara keserasian dengan bentuk kanoniknya. Contohnya, U 2160 (ROMAN NUMERAL SATU) menormalkan kepada "I" menggunakan NFKC:

print(unicodedata.normalize('NFKC', '\u2167'))  # Output: 'VIII'

Salin selepas log masuk

Perlu ambil perhatian bahawa penormalan tidak selalu boleh diterbalikkan, kerana sesetengah aksara mungkin tidak mempunyai bentuk terurai yang unik.

Atas ialah kandungan terperinci Bagaimanakah Fungsi `unicodedata.normalize()` Python Memudahkan Perwakilan Unikod?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber：php.cn

Artikel sebelumnya：Bagaimana untuk Mencari Subkelas Kelas Python Menggunakan `__subclass__`? Artikel seterusnya：Bagaimanakah Saya Boleh Menyesuaikan Respons Ralat untuk Laluan Tertentu dalam FastAPI?

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

Adakah Fungsi `eval()` PHP Benar-benar Jahat, atau Hanya Disalah Faham?

2024-12-19 21:52:12
Eatures teratas React vYou Perlu Tahu

2024-12-19 21:51:09
Bagaimana untuk Menghuraikan Struktur JSON Kompleks dengan Cekap dalam Go Menggunakan `json.Unmarshal`?

2024-12-19 21:50:10
Sempadan Ralat dalam Reaksi: Mengendalikan Ralat dengan Anggun dalam Apl Anda

2024-12-19 21:49:11
Patutkah Saya Menggunakan Singletons untuk Sambungan Pangkalan Data dalam PHP?

2024-12-19 21:48:15
Bagaimana untuk Beralih Antara Iframes dalam Selenium menggunakan Python?

2024-12-19 21:47:19
Bagaimana untuk Membetulkan Ralat 'Gagal Membina Sambungan Asli Permata' Semasa Pemasangan MySQL2?

2024-12-19 21:46:17
Bagaimanakah Saya Boleh Mengesahkan Perwakilan Perduaan Nombor dalam Memori C?

2024-12-19 21:45:15
Carian Substring Rentetan Python: Bila Menggunakan Operator `in` vs. Kaedah Lain?

2024-12-19 21:43:10
Bagaimanakah Saya Boleh Menggunakan Kesatuan Go Generik dengan Berkesan dalam Kekangan Jenis untuk Pengujian?

2024-12-19 21:42:11

Isu terkini

function_exists() tidak boleh menentukan fungsi tersuai Ujian fungsi () {return true;} jika (function_exists ('test')) {echo "test is functio...

daripada 2024-04-29 11:01:01

0

3

2239

Bagaimana untuk memaparkan versi mudah alih Google Chrome Hello cikgu, bagaimana saya boleh menukar Google Chrome kepada versi mudah alih?

daripada 2024-04-23 00:22:19

0

11

2379

Tetingkap anak mengendalikan tetingkap induk, tetapi output tidak bertindak balas. Dua ayat pertama boleh dilaksanakan, tetapi ayat terakhir tidak boleh dilaksanakan.

daripada 2024-04-19 15:37:47

0

1

1989

Tiada output dalam tetingkap induk document.onclick = function(){ window.opener.document.write('Saya adalah output tetingkap ...

daripada 2024-04-18 23:52:34

0

1

1877

Di manakah perisian kursus tentang pemetaan minda CSS? Perisian kursus

daripada 2024-04-16 10:10:18

0

0

1947

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan