Menggantikan Nilai NaN dengan Purata Lajur dalam Pandas DataFrames
Apabila bekerja dengan panda DataFrames, menghadapi nilai NaN (hilang) adalah perkara biasa. Untuk mengendalikan nilai ini dengan berkesan, adalah penting untuk menggantikannya dengan nilai yang sesuai. Satu cara yang cekap ialah menggantikan nilai NaN dengan purata lajur masing-masing.
Penyelesaian Menggunakan DataFrame.fillna
Tidak seperti pendekatan yang disebut dalam soalan yang dirujuk, panda DataFrames boleh dikendalikan secara berbeza. Kaedah DataFrame.fillna menyediakan penyelesaian yang mudah untuk mengisi nilai NaN:
<code class="python">df.fillna(df.mean())</code>
Penjelasan Terperinci:
Contoh:
Mari kita pertimbangkan DataFrame berikut:
A B C 0 -0.166919 0.979728 -0.632955 1 -0.297953 -0.912674 -1.365463 2 -0.120211 -0.540679 -0.680481 3 NaN -2.027325 1.533582 4 NaN NaN 0.461821 5 -0.788073 NaN NaN 6 -0.916080 -0.612343 NaN 7 -0.887858 1.033826 NaN 8 1.948430 1.025011 -2.982224 9 0.019698 -0.795876 -0.046431
Selepas menggunakan kaedah fillna dengan purata:
A B C 0 -0.166919 0.979728 -0.632955 1 -0.297953 -0.912674 -1.365463 2 -0.120211 -0.540679 -0.680481 3 -0.151121 -2.027325 1.533582 4 -0.151121 -0.231291 0.461821 5 -0.788073 -0.231291 -0.530307 6 -0.916080 -0.612343 -0.530307 7 -0.887858 1.033826 -0.530307 8 1.948430 1.025011 -2.982224 9 0.019698 -0.795876 -0.046431
Seperti yang ditunjukkan, nilai NaN telah digantikan dengan purata lajur yang sepadan.
Atas ialah kandungan terperinci Bagaimana untuk Menggantikan Nilai yang Hilang dalam Pandas DataFrames dengan Purata Lajur?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!