Bei der Datenanalyse ist das Transponieren eines Datenrahmens entscheidend für die Organisation von Daten in ein geeigneteres Format. Ein häufiger Anwendungsfall ist das Pivotieren eines Datenrahmens basierend auf bestimmten Spaltenwerten.
Für eine CSV-Tabelle mit Daten wie folgt:
Indicator Country Year Value 1 Angola 2005 6 2 Angola 2005 13 3 Angola 2005 10 4 Angola 2005 11 5 Angola 2005 5 1 Angola 2006 3 2 Angola 2006 2 3 Angola 2006 7 4 Angola 2006 3 5 Angola 2006 6
Sie können den Datenrahmen drehen, um dieses Format zu erhalten:
Country Year 1 2 3 4 5 Angola 2005 6 13 10 11 5 Angola 2006 3 2 7 3 6
Um diese Transformation zu erreichen, können Sie die .pivot-Methode wie folgt verwenden:
out = df.pivot(index=['Country', 'Year'], columns='Indicator', values='Value') print(out)
Für Daten mit Bei doppelten Beschriftungskombinationen können Sie die Methode .pivot_table verwenden, die standardmäßig die Mittelwertberechnung anwendet:
out = df.pivot_table( index=['Country', 'Year'], columns='Indicator', values='Value') print(out.rename_axis(columns=None).reset_index())
Durch die Verwendung der Methoden .rename_axis und .reset_index können Sie den Datenrahmen in einem flachen Tabellenformat wiederherstellen.
Ausführliche Dokumentation zum Umformen und Pivot-Tabellen finden Sie im Pandas-Benutzerhandbuch.
Das obige ist der detaillierte Inhalt vonWie kann ich einen Pandas-Datenrahmen drehen, um Daten nach bestimmten Spalten umzuformen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!