Menggantikan Nilai Kosong (Ruang Putih) dengan NaN dalam Panda
Pembersihan data ialah langkah penting dalam analisis data. Satu tugas biasa ialah menggantikan nilai kosong (ruang putih) dengan NaN. Ini boleh dilakukan dengan cekap menggunakan Panda.
Untuk mencapainya, gunakan fungsi df.replace(). Fungsi ini membenarkan carian berasaskan ungkapan biasa dan operasi ganti pada nilai DataFrame. Begini cara anda boleh melaksanakannya:
<code class="python">import numpy as np import pandas as pd df = pd.DataFrame([ [-0.532681, 'foo', 0], [1.490752, 'bar', 1], [-1.387326, 'foo', 2], [0.814772, 'baz', ' '], [-0.222552, ' ', 4], [-1.176781, 'qux', ' '], ], columns='A B C'.split(), index=pd.date_range('2000-01-01','2000-01-06')) # Replace fields that contain only whitespace (or are empty) with NaN print(df.replace(r'^\s*$', np.nan, regex=True)) # Output: # A B C # 2000-01-01 -0.532681 foo 0 # 2000-01-02 1.490752 bar 1 # 2000-01-03 -1.387326 foo 2 # 2000-01-04 0.814772 baz NaN # 2000-01-05 -0.222552 NaN 4 # 2000-01-06 -1.176781 qux NaN</code>
Perhatikan bahawa kod ini menggantikan medan yang mengandungi hanya ruang putih atau kosong (iaitu, sepadan dengan ungkapan biasa r'^s*$'**). Jika data sah anda mengandungi ruang putih, laraskan regex dengan sewajarnya (cth., alih keluar **$ dari hujung untuk r'^s ').
Atas ialah kandungan terperinci Bagaimanakah saya menggantikan nilai kosong (ruang putih) dengan NaN dalam Pandas DataFrame?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!