UnicodeDecodeError: Invalid Continuation Byte
Apabila cuba menyahkod rentetan menggunakan codec "utf-8", ralat "UnicodeDecodeError: ' Codec utf8' tidak boleh menyahkod byte 0xe9..." mungkin timbul. Ini menunjukkan bait kesinambungan yang tidak sah dalam rentetan.
Dalam coretan kod yang disediakan:
o = "a test of \xe9 char" v = o.decode("utf-8")
Rentetan "ujian bagi aksara xe9" mengandungi aksara yang diwakili oleh bait xe9. Bait ini bukan bait kesinambungan yang sah dalam jujukan UTF-8, jadi codec "utf-8" tidak boleh menyahkodnya.
Walau bagaimanapun, sebaliknya, apabila menggunakan codec "latin-1", penyahkodan berjaya:
v = o.decode("latin-1")
Ini kerana codec "latin-1" mentafsir xe9 sebagai aksara bait tunggal, bukannya sebagai sebahagian daripada urutan UTF-8. Akibatnya, rentetan itu kekal sebagai rentetan tanpa menemui UnicodeDecodeError.
Atas ialah kandungan terperinci Mengapa Penyahkodan `utf-8` Gagal pada `\\xe9` Semasa `latin-1` Berjaya?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!