Konvertieren von Pandas-Spalten mit NaN-Werten in Dtype „int“
Bei der Arbeit mit Datenmanipulation in Python mithilfe der Pandas-Bibliothek kommt es häufig vor um auf Spalten mit fehlenden oder NaN-Werten zu stoßen. Das Konvertieren solcher Spalten in ganzzahlige Datentypen („int“) stellt eine besondere Herausforderung dar, da NaN-Werte nicht mit ganzzahligen Operationen kompatibel sind.
Um dieses Problem zu lösen, hat Pandas in Version 0.24 einen neuen ganzzahligen Datentyp eingeführt, der Nullwerte zulassen kann. . Dieser Datentyp ermöglicht die Darstellung ganzzahliger Werte mit möglichen fehlenden Werten.
Um den dtype einer Spalte explizit als „int64“ anzugeben, kann die Methode „astypte“ verwendet werden. Beachten Sie jedoch unbedingt, dass die Methode „astype“ NaN-Werte nicht direkt in Ganzzahlen konvertieren kann.
Um eine Spalte mit NaN-Werten in einen ganzzahligen Datentyp zu konvertieren, der NULL-Werte zulässt, führen Sie die folgenden Schritte aus:
Initialisieren Sie das Spalte mithilfe der Array-Funktion mit dem entsprechenden dtype. Zum Beispiel:
'arr = pd.array([1, 2, np.nan], dtype=pd.Int64Dtype())'
Weisen Sie das neu erstellte Array der Pandas-Serie zu.
' pd.Series(arr)'
Um eine Spalte in einem DataFrame zu konvertieren Verwenden Sie für einen ganzzahligen Datentyp, der NULL-Werte zulässt, die Methode „astype“.
'df['myCol'] = df['myCol'].astype('Int64')'
Das obige ist der detaillierte Inhalt vonWie konvertiere ich Pandas-Spalten mit NaN-Werten in den Datentyp „Integer'?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!