Remodelage des pandas : conversion du format long au format large
Lorsque vous travaillez avec des données tabulaires, il est souvent nécessaire de les remodeler du format long au format large . Bien que Pandas fournisse des fonctions telles que fondre et empiler, elles peuvent ne pas suffire pour des scénarios de remodelage complexes.
Dans le contexte fourni, nous avons un long ensemble de données avec des colonnes comprenant « Vendeur », « Hauteur », « produit », et « prix ». L'objectif est de le remodeler dans un format large avec trois colonnes supplémentaires : « produit_1 », « prix_1 », etc.
Une approche consiste à utiliser la méthode pivot. Prenons l'exemple suivant avec un ensemble de données fictif :
<code class="python">import pandas as pd data = { 'Salesman': ['Knut', 'Knut', 'Knut', 'Steve'], 'Height': [6, 6, 6, 5], 'product': ['bat', 'ball', 'wand', 'pen'], 'price': [5, 1, 3, 2] } df = pd.DataFrame(data)</code>
Pour remodeler cet ensemble de données long au format large, nous pouvons pivoter sur la colonne « Vendeur » et définir la colonne « produit » comme nouveaux en-têtes de colonne tandis que le La colonne « prix » devient les valeurs correspondantes :
<code class="python">df_wide = df.pivot(index='Salesman', columns='product', values='price')</code>
Cela se traduira par une trame de données grand format comme vous le souhaitez :
<code class="python">print(df_wide) bat ball wand pen 0 5 1 3 NaN 1 NaN NaN NaN 2</code>
Cette solution montre comment remodeler une trame de données longue en une trame large format en utilisant la méthode pivot, répondant au besoin d'une méthode simple pour effectuer de telles tâches de remodelage dans Pandas.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!