In Pandas Sie kann auf Datenrahmen mit Zellen stoßen, die Listen mit mehreren Werten enthalten. Anstatt mehrere Werte in einer einzelnen Zelle zu speichern, kann es von Vorteil sein, den Datenrahmen zu erweitern, sodass jedes Element in der Liste eine eigene Zeile einnimmt.
Pandas Version 0.25 und höher führt die .explode() ein Methode für Series und DataFrame. Diese Methode trennt Listenelemente effektiv in verschiedene Zeilen.
Um eine Spalte aufzulösen, verwenden Sie einfach die folgende Syntax:
df.explode('column_name')
Betrachten wir beispielsweise den folgenden Datenrahmen:
import pandas as pd import numpy as np df = pd.DataFrame( {'trial_num': [1, 2, 3, 1, 2, 3], 'subject': [1, 1, 1, 2, 2, 2], 'samples': [list(np.random.randn(3).round(2)) for i in range(6)] } )
Um die Spalte „Beispiele“ aufzulösen, würden wir Folgendes verwenden:
df_exploded = df.explode('samples')
Dies würde das Gewünschte ergeben Ausgabe:
subject trial_num samples 0 1 1 0.57 1 1 1 -0.83 2 1 1 1.44 3 1 2 -0.01 4 1 2 1.13 5 1 2 0.36 6 1 3 1.18 # etc.
Die Methode .explode() kann gemischte Spalten aus Listen und Skalaren verarbeiten. sowie leere Listen und NaNs. Es ist jedoch wichtig zu beachten, dass es jeweils nur eine einzelne Spalte auflösen kann.
Das obige ist der detaillierte Inhalt vonWie explodiere ich Listen in Pandas DataFrames?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!