UnicodeDecodeError: codec 'ascii' tidak boleh menyahkod bait biasanya berlaku apabila anda cuba menukar Python 2.x str yang mengandungi bukan -ASCII aksara kepada rentetan Unicode tanpa menyatakan pengekodan rentetan asal.
Unicode rentetan (juga dikenali sebagai unicodes) ialah jenis rentetan berasingan dalam Python yang memegang kod titik Unicode dan boleh mewakili mana-mana titik Unicode di seluruh spektrum. Sebaliknya, rentetan mengandungi teks yang dikodkan dalam pelbagai format (cth., UTF-8, UTF-16, ISO-8895-1).
Pembangun modul Markdown mungkin menggunakan unicode() sebagai gerbang kualiti untuk memastikan masuk rentetan ialah Unicode. Memandangkan mereka tidak dapat menentukan pengekodan rentetan masuk, anda mesti menyahkodnya sebelum menghantarnya ke Markdown.
Rentetan Unicode boleh diisytiharkan dalam kod anda dengan awalan "u":
my_u = u'my ünicôdé strįng' print(type(my_u)) # <type 'unicode'>
Rentetan Unicode juga boleh timbul daripada fail, pangkalan data atau modul rangkaian, di mana anda tidak perlu menentukan pengekodan.
Penukaran Unikod boleh berlaku walaupun tanpa panggilan unicode() yang jelas:
# Explicit conversion without encoding unicode('€') # New-style format string into Unicode string # Python attempts to convert value string to Unicode first u"The currency is: {}".format('€') # Old-style format string into Unicode string # Python attempts to convert value string to Unicode first u'The currency is: %s' % '€' # Append string to Unicode # Python attempts to convert string to Unicode first u'The currency is: ' + '€'
Dalam rajah berikut, "café " dikodkan secara berbeza dalam "UTF-8" dan "Cp1252" bergantung pada jenis terminal. Dalam kedua-dua kes, "caf" dikodkan dalam ASCII biasa. Walaupun UTF-8 menggunakan dua bait untuk mewakili "é", Cp1252 menggunakan satu bait yang juga sepadan dengan nilai titik Unicode. Dalam kes ini, nyahkod() digunakan dengan pengekodan yang betul dan penukaran yang berjaya kepada Unikod dilakukan:
[Rajah penukaran Unikod yang berjaya dengan pengekodan yang betul]
Walau bagaimanapun, jika nyahkod () dipanggil dengan "ascii", yang serupa dengan memanggil unicode() tanpa menyatakan pengekodan, UnicodeDecodeError akan berlaku:
[Rajah penukaran Unikod yang tidak berjaya dengan pengekodan yang salah]
Adalah amalan terbaik untuk mencipta "sandwich Unicode" dalam kod anda, di mana anda:
Pendekatan ini menghalang anda daripada perlu risau tentang pengekodan rentetan sepanjang anda kod.
Untuk fail, gunakan TextWrapper modul io dengan pengekodan yang sesuai:
my_u = u'my ünicôdé strįng' print(type(my_u)) # <type 'unicode'>
Atas ialah kandungan terperinci Bagaimana untuk Menyelesaikan Ralat 'UnicodeDecodeError: codec 'ascii' tidak dapat menyahkod bait' Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!