Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimana untuk Menyelesaikan Ralat 'UnicodeDecodeError: codec 'ascii' tidak dapat menyahkod bait' Python?

Bagaimana untuk Menyelesaikan Ralat 'UnicodeDecodeError: codec 'ascii' tidak dapat menyahkod bait' Python?

Mary-Kate Olsen
Lepaskan: 2024-12-10 17:00:12
asal
221 orang telah melayarinya

How to Solve Python's

Cara membetulkan "UnicodeDecodeError: codec 'ascii' tidak dapat menyahkod bait"

tl;dr / Quick Fix

  • Elakkan penyahkodan/pengekodan yang tidak perlu.
  • Jangan menganggap Pengekodan UTF-8 untuk rentetan.
  • Tukar rentetan kepada rentetan Unikod secepat mungkin dalam kod anda.
  • Laraskan tempat anda (lihat: Bagaimana untuk menyelesaikan UnicodeDecodeError dalam Python 3.6?).
  • Tahan godaan untuk tambah nilai pantas menggodam.

Unicode Zen dalam Python 2.x

UnicodeDecodeError: codec 'ascii' tidak boleh menyahkod bait biasanya berlaku apabila anda cuba menukar Python 2.x str yang mengandungi bukan -ASCII aksara kepada rentetan Unicode tanpa menyatakan pengekodan rentetan asal.

Unicode rentetan (juga dikenali sebagai unicodes) ialah jenis rentetan berasingan dalam Python yang memegang kod titik Unicode dan boleh mewakili mana-mana titik Unicode di seluruh spektrum. Sebaliknya, rentetan mengandungi teks yang dikodkan dalam pelbagai format (cth., UTF-8, UTF-16, ISO-8895-1).

Pembangun modul Markdown mungkin menggunakan unicode() sebagai gerbang kualiti untuk memastikan masuk rentetan ialah Unicode. Memandangkan mereka tidak dapat menentukan pengekodan rentetan masuk, anda mesti menyahkodnya sebelum menghantarnya ke Markdown.

Rentetan Unicode boleh diisytiharkan dalam kod anda dengan awalan "u":

my_u = u'my ünicôdé strįng'
print(type(my_u)) # <type 'unicode'>
Salin selepas log masuk
Salin selepas log masuk

Rentetan Unicode juga boleh timbul daripada fail, pangkalan data atau modul rangkaian, di mana anda tidak perlu menentukan pengekodan.

Gotchas

Penukaran Unikod boleh berlaku walaupun tanpa panggilan unicode() yang jelas:

# Explicit conversion without encoding
unicode('€')

# New-style format string into Unicode string
# Python attempts to convert value string to Unicode first
u"The currency is: {}".format('€')

# Old-style format string into Unicode string
# Python attempts to convert value string to Unicode first
u'The currency is: %s' % '€'

# Append string to Unicode
# Python attempts to convert string to Unicode first
u'The currency is: ' + '€'
Salin selepas log masuk

Contoh

Dalam rajah berikut, "café " dikodkan secara berbeza dalam "UTF-8" dan "Cp1252" bergantung pada jenis terminal. Dalam kedua-dua kes, "caf" dikodkan dalam ASCII biasa. Walaupun UTF-8 menggunakan dua bait untuk mewakili "é", Cp1252 menggunakan satu bait yang juga sepadan dengan nilai titik Unicode. Dalam kes ini, nyahkod() digunakan dengan pengekodan yang betul dan penukaran yang berjaya kepada Unikod dilakukan:

[Rajah penukaran Unikod yang berjaya dengan pengekodan yang betul]

Walau bagaimanapun, jika nyahkod () dipanggil dengan "ascii", yang serupa dengan memanggil unicode() tanpa menyatakan pengekodan, UnicodeDecodeError akan berlaku:

[Rajah penukaran Unikod yang tidak berjaya dengan pengekodan yang salah]

Sandwich Unicode

Adalah amalan terbaik untuk mencipta "sandwich Unicode" dalam kod anda, di mana anda:

  1. Nyahkod semua data masuk ke Unicode rentetan.
  2. Lakukan operasi pada rentetan Unikod.
  3. Ekod ke str semasa keluar.

Pendekatan ini menghalang anda daripada perlu risau tentang pengekodan rentetan sepanjang anda kod.

Input / Nyahkod

  • Untuk kod sumber, gunakan Literal rentetan Unikod (cth., u'Zürich') dan tambahkan pengepala pengekodan (cth., # pengekodan: utf-8).
  • Untuk fail, gunakan TextWrapper modul io dengan pengekodan yang sesuai:

    my_u = u'my ünicôdé strįng'
    print(type(my_u)) # <type 'unicode'>
    Salin selepas log masuk
    Salin selepas log masuk
  • Untuk pangkalan data, konfigurasikan sambungan untuk mengembalikan data Unicode dan gunakan rentetan Unicode untuk pertanyaan SQL.
  • Untuk HTTP, pertimbangkan untuk menggunakan perpustakaan Permintaan Python, yang mengembalikan Unicode sebagai response.text .
  • Untuk penyahkodan manual, gunakan my_string.decode(encoding), di mana pengekodan adalah sesuai nilai.

Output

  • stdout/printing: Python cuba untuk mengkonfigurasi pengekod forstdout untuk mengekod rentetan Unicode kepada pengekodan konsol. Jika pengekodan konsol tidak betul, anda mungkin menghadapi ralat.
  • Fail: io.open boleh mengekod Unikod kepada rentetan bait secara telus.
  • Pangkalan Data: Konfigurasi yang betul membolehkan anda menulis data Unikod terus ke pangkalan data.

Atas ialah kandungan terperinci Bagaimana untuk Menyelesaikan Ralat 'UnicodeDecodeError: codec 'ascii' tidak dapat menyahkod bait' Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan