Bei der Datenanalyse kann es sinnvoll sein, Datensätze neu zu strukturieren, um die Lesbarkeit und Analyse zu verbessern. Eine häufige Transformation besteht darin, Spalten in Zeilen umzuwandeln. In diesem Artikel wird erläutert, wie Sie diesen Vorgang mit der Pandas-Bibliothek durchführen.
Stellen Sie sich einen Datensatz mit orts- und datumsspezifischen Informationen vor, die in Spaltenüberschriften gespeichert sind, wie unten gezeigt:
| location | name | Jan-2010 | Feb-2010 | March-2010 | |---|---|---|---|---| | A | "test" | 12 | 20 | 30 | | B | "foo" | 18 | 20 | 25 |
Das Ziel ist um die Daten wie folgt in ein Format umzuwandeln, in dem jedes Datum einer Zeile entspricht:
| location | name | Date | Value | |---|---|---|---| | A | "test" | Jan-2010 | 12 | | A | "test" | Feb-2010 | 20 | | A | "test" | March-2010 | 30 | | B | "foo" | Jan-2010 | 18 | | B | "foo" | Feb-2010 | 20 | | B | "foo" | March-2010 | 25 |
Um diese Transformation zu erreichen, stellt Pandas die Schmelzfunktion bereit. Wenden Sie einfach „melt“ auf den DataFrame an und geben Sie die Spalten an, die als Zeilenbezeichner (id_vars) und die Spaltenüberschriften für die neuen Spalten (var_name und value_name) beibehalten werden sollen.
import pandas as pd df.melt(id_vars=["location", "name"], var_name="Date", value_name="Value")
Für Pandas-Versionen vor 0.20 eine geringfügige Es ist ein anderer Ansatz erforderlich, der eine Kombination aus Schmelzen und Sortieren beinhaltet:
df2 = pd.melt(df, id_vars=["location", "name"], var_name="Date", value_name="Value") df2 = df2.sort(["location", "name"])
Denken Sie daran, den Index zurückzusetzen, um eine Reinigung sicherzustellen Ausgabe:
df2.reset_index(drop=True)
Diese Technik bietet eine praktische Möglichkeit, Datenrahmen umzuformen und erleichtert die Analyse und Darstellung tabellarischer Daten.
Das obige ist der detaillierte Inhalt vonWie kann ich mit Pandas Melt() Spalten in Zeilen umwandeln?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!