In diesem Zusammenhang haben Sie einen Pandas DataFrame mit gruppierten Daten und möchten die erste Zeile aus jeder Gruppe extrahieren. Dies kann durch verschiedene Methoden erreicht werden.
Ein einfacher Ansatz besteht darin, die Funktion first() zu verwenden, die den ersten Nicht-Null-Wert aus jeder Spalte abruft:
df.groupby('id').first()
Diese Methode schließt aus die Indexspalte aus der Ausgabe. Um die ID-Spalte als Spalte einzuschließen, verwenden Sie reset_index():
df.groupby('id').first().reset_index()
Alternativ können Sie head(n) verwenden, um die ersten n Zeilen aus jeder Gruppe abzurufen:
df.groupby('id').head(2).reset_index(drop=True)
In diesem Beispiel entfernt der Parameter „drop=True“ die Spalte „Index zurücksetzen“ aus der Ausgabe.
Ein anderer Ansatz besteht darin, den Parameter as_index in groupby() festzulegen:
df.groupby('id', as_index=False).nth(0)
Diese Methode enthält die ID standardmäßig als Spalte.
Denken Sie daran, diese Methoden basierend auf Ihren spezifischen Anforderungen an die Spalteneinbindung und die Anzahl der abzurufenden Zeilen anzupassen.
Das obige ist der detaillierte Inhalt vonWie extrahiere ich die erste Zeile jeder Gruppe in einem Pandas DataFrame?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!