Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimana untuk Menggantikan Nilai yang Hilang dalam Pandas DataFrames dengan Purata Lajur?

Bagaimana untuk Menggantikan Nilai yang Hilang dalam Pandas DataFrames dengan Purata Lajur?

Barbara Streisand
Lepaskan: 2024-10-28 18:33:02
asal
1059 orang telah melayarinya

How to Replace Missing Values in Pandas DataFrames with Column Averages?

Menggantikan Nilai NaN dengan Purata Lajur dalam Pandas DataFrames

Apabila bekerja dengan panda DataFrames, menghadapi nilai NaN (hilang) adalah perkara biasa. Untuk mengendalikan nilai ini dengan berkesan, adalah penting untuk menggantikannya dengan nilai yang sesuai. Satu cara yang cekap ialah menggantikan nilai NaN dengan purata lajur masing-masing.

Penyelesaian Menggunakan DataFrame.fillna

Tidak seperti pendekatan yang disebut dalam soalan yang dirujuk, panda DataFrames boleh dikendalikan secara berbeza. Kaedah DataFrame.fillna menyediakan penyelesaian yang mudah untuk mengisi nilai NaN:

<code class="python">df.fillna(df.mean())</code>
Salin selepas log masuk

Penjelasan Terperinci:

  • Fungsi df.mean() mengira purata setiap lajur dalam DataFrame.
  • Kaedah fillna mengambil purata yang dikira dan mengisi nilai NaN dalam setiap lajur dengan purata yang sepadan.

Contoh:

Mari kita pertimbangkan DataFrame berikut:

          A         B         C
0 -0.166919  0.979728 -0.632955
1 -0.297953 -0.912674 -1.365463
2 -0.120211 -0.540679 -0.680481
3       NaN -2.027325  1.533582
4       NaN       NaN  0.461821
5 -0.788073       NaN       NaN
6 -0.916080 -0.612343       NaN
7 -0.887858  1.033826       NaN
8  1.948430  1.025011 -2.982224
9  0.019698 -0.795876 -0.046431
Salin selepas log masuk

Selepas menggunakan kaedah fillna dengan purata:

          A         B         C
0 -0.166919  0.979728 -0.632955
1 -0.297953 -0.912674 -1.365463
2 -0.120211 -0.540679 -0.680481
3 -0.151121 -2.027325  1.533582
4 -0.151121 -0.231291  0.461821
5 -0.788073 -0.231291 -0.530307
6 -0.916080 -0.612343 -0.530307
7 -0.887858  1.033826 -0.530307
8  1.948430  1.025011 -2.982224
9  0.019698 -0.795876 -0.046431
Salin selepas log masuk

Seperti yang ditunjukkan, nilai NaN telah digantikan dengan purata lajur yang sepadan.

Atas ialah kandungan terperinci Bagaimana untuk Menggantikan Nilai yang Hilang dalam Pandas DataFrames dengan Purata Lajur?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan