Conversion d'une colonne Pandas avec des valeurs manquantes en type entier
Dans Pandas, la conversion d'une colonne contenant des valeurs manquantes (NaN) en entier entraîne souvent erreurs. En effet, les types entiers ne peuvent pas contenir d'informations manquantes par défaut. Cependant, Pandas propose désormais une solution via des types de données entiers nullables.
Nullable Integer Dtype
Dans les versions 0.24. de Pandas, vous pouvez utiliser des types de données entiers nullables pour représenter des valeurs entières avec d'éventuelles valeurs manquantes. Ce type de données est implémenté sous la forme de tableaux.IntegerArray et nécessite une spécification explicite lors de la création d'un tableau ou d'une série :
arr = pd.array([1, 2, np.nan], dtype=pd.Int64Dtype()) pd.Series(arr) 0 1 1 2 2 NaN dtype: Int64
Conversion d'une colonne en entier nul
Pour convertir une colonne en un type de données entier nullable, utilisez la syntaxe suivante :
df['myCol'] = df['myCol'].astype('Int64')
En spécifiant le Int64 dtype, vous informez explicitement Pandas que la colonne doit avoir un type de données entier capable de prendre en charge les valeurs manquantes (NaN). Cette approche vous permet de représenter des valeurs entières avec des informations manquantes sans rencontrer d'erreurs de conversion de type.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!