Pengekodan Rentetan UTF-8 dalam Sumber Python
Seseorang mungkin menghadapi ralat sintaks apabila menggunakan aksara Unicode dalam kod sumber Python 2 tanpa mengisytiharkan pengekodan. Ini kerana Python 2 menggunakan ASCII sebagai pengekodan sumber lalai.
Untuk mendayakan penggunaan rentetan UTF-8 dalam Python 2, isytiharkan pengekodan dalam pengepala kod sumber:
# -*- coding: utf-8 -*-
Arahan ini, yang ditakrifkan dalam PEP 0263, mengarahkan Python untuk mentafsir kod sumber sebagai UTF-8.
Setelah pengekodan diisytiharkan, aksara Unicode boleh digunakan dalam rentetan seperti yang ditunjukkan:
# -*- coding: utf-8 -*- u = 'idzie wąż wąską dróżką' uu = u.decode('utf8') s = uu.encode('cp1250') print(s)
Dalam Python 3, UTF-8 ialah pengekodan sumber lalai, jadi langkah ini tidak diperlukan. Aksara Unikod boleh digunakan terus dalam kod sumber tanpa sebarang pengisytiharan pengekodan yang jelas.
Atas ialah kandungan terperinci Bagaimana untuk Menggunakan Rentetan UTF-8 dalam Kod Sumber Python 2?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!