Diviser les colonnes de tuples dans les dataframes Pandas
Dans Pandas, les dataframes peuvent contenir des colonnes qui contiennent des tuples comme éléments. Pour extraire et manipuler efficacement les éléments individuels de ces tuples, une tâche courante consiste à les diviser en colonnes distinctes. Cet article fournit une démonstration détaillée de la façon de réaliser cette division.
Considérez l'exemple de trame de données suivant :
<code class="python">import pandas as pd df = pd.DataFrame({'a': [1, 2], 'b': [(1, 2), (3, 4)]})</code>
La colonne « b » contient des tuples et nous souhaitons les diviser en « b » Colonnes b1' et 'b2'. Pour ce faire, nous pouvons utiliser la méthode pd.DataFrame(col.tolist()) appliquée à la colonne 'b' :
<code class="python">df[['b1', 'b2']] = pd.DataFrame(df['b'].tolist(), index=df.index)</code>
Cette opération crée une nouvelle dataframe avec 'b1' et 'b2' colonnes, où chaque élément de tuple de la colonne « b » d'origine est affecté à ses colonnes « b1 » et « b2 » correspondantes.
Le dataframe résultant ressemblerait maintenant à ceci :
<code class="python">print(df) a b b1 b2 0 1 (1, 2) 1 2 1 2 (3, 4) 3 4</code>
Désormais, le dataframe comporte les éléments de tuple individuels divisés en colonnes distinctes, permettant un accès et une manipulation pratiques.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!