Apabila memproses sejumlah besar fail serupa, menghadapi UnicodeDecodeError boleh mengecewakan. Ralat khusus ini, yang berpunca daripada kaedah read_csv Pandas, menunjukkan ketidakupayaan untuk menyahkod bait dalam fail menggunakan pengekodan UTF-8.
Untuk menyelesaikan isu ini, Pandas menyediakan pilihan pengekodan, membolehkan anda menentukan pengekodan format fail. Pengekodan yang biasa digunakan termasuk:
Untuk kebanyakan fail, menggunakan Pengekodan UTF-8 sudah memadai.
Contoh Kod:
import pandas as pd filepath = 'filepath.csv' data = pd.read_csv(filepath, encoding="utf-8")
Jika pengesanan pengekodan fail diperlukan, pertimbangkan untuk menggunakan alatan seperti enca, file -i (Linux ), atau fail -I (macOS). Pengekodan kemudiannya boleh ditentukan dengan sewajarnya.
Dengan menggunakan pilihan pengekodan, anda boleh memastikan penyahkodan fail CSV yang betul dan mengelakkan ralat yang tidak dijangka daripada mengganggu proses import data anda.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Membetulkan UnicodeDecodeError Semasa Membaca Fail CSV dalam Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!