Methode zum Gruppieren von DataFrame-Zeilen zum Erstellen von Listen in GroupBy
Im Bereich der Datenmanipulation mit Pandas ist es oft notwendig, DataFrame-Zeilen zu manipulieren in bestimmte Formate umwandeln. Eine häufige Anforderung besteht darin, Zeilen basierend auf einer bestimmten Spalte zu gruppieren und die Werte aus einer anderen Spalte als Listen abzurufen.
Stellen Sie sich einen DataFrame mit den Spalten „a“ und „b“ vor, wie unten gezeigt:
a b A 1 A 2 B 5 B 5 B 4 C 6
Das Ziel besteht darin, diesen DataFrame in einen neuen umzuwandeln, in dem die Zeilen nach Spalte „a“ gruppiert werden und die Werte aus Spalte „b“ in Listen für jede Gruppe umgewandelt werden. Die gewünschte Ausgabe würde wie folgt aussehen:
A [1, 2] B [5, 5, 4] C [6]
Um dies zu erreichen, können wir die Pandas-Funktionen „Groupby“ und „Apply“ nutzen, wie unten gezeigt:
# Import the pandas library import pandas as pd # Create a DataFrame from the provided data df = pd.DataFrame( {'a':['A','A','B','B','B','C'], 'b':[1,2,5,5,4,6]}) # Group the DataFrame by column 'a' grouped = df.groupby('a') # Apply the list function to each group to get the 'b' values as lists group_b_lists = grouped['b'].apply(list) # Reset the index of the resulting Series to obtain a DataFrame df_result = group_b_lists.reset_index(name='b_lists') # Print the transformed DataFrame print(df_result)
Dieser Code effektiv gruppiert den ursprünglichen DataFrame nach Spalte „a“, wendet die Listenfunktion auf jede Gruppe an und weist die resultierenden Listen einer neuen Spalte namens „b_lists“ zu. Der resultierende DataFrame wird dann gedruckt, um die gewünschte Ausgabe anzuzeigen.
Das obige ist der detaillierte Inhalt vonWie gruppiere ich Pandas DataFrame-Zeilen und wandele Spaltenwerte in Listen um?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!