Regrouper une colonne pandas avec des compartiments personnalisés et des nombres de valeurs
Lorsque vous travaillez avec des données numériques, il est souvent utile de regrouper les valeurs dans des compartiments pour détecter des modèles ou des tendances. Ce processus, appelé binning, peut être facilement effectué à l'aide de la bibliothèque pandas.
Pour regrouper une colonne, vous pouvez utiliser la fonction pandas.cut. Voici comment cela fonctionne dans l'exemple que vous avez fourni :
bins = [0, 1, 5, 10, 25, 50, 100] df['binned'] = pd.cut(df['percentage'], bins)
Ce code crée une nouvelle colonne appelée binned dans votre DataFrame. Chaque valeur de cette colonne représente le groupe auquel appartient la valeur numérique correspondante dans la colonne de pourcentage. Le paramètre bins spécifie les limites des bacs.
Pour visualiser la répartition des valeurs à travers les bacs, vous pouvez utiliser la fonction value_counts :
df['binned'].value_counts()
Ce code renverra le nombre d'occurrences de chaque bac, fournissant efficacement le nombre de valeurs pour les bacs.
Par exemple, si vous avez ce qui suit data :
df['percentage'].head() 46.5 44.2 100.0 42.12
Et vous utilisez les bacs suivants :
bins = [0, 1, 5, 10, 25, 50, 100]
La sortie de df['binned'].value_counts() serait :
(25, 50] 3 (50, 100] 1
Cela signifie que trois valeurs entrent dans la case (25, 50] et une valeur entre dans la case (50, 100).
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!