Partielle String-Übereinstimmungen im Pandas-DataFrame finden
Das Filtern eines Pandas-DataFrames basierend auf Teil-String-Kriterien ist beim Umgang mit Textdaten oft eine Notwendigkeit. In diesem Artikel wird gezeigt, wie Sie diesen Vorgang mit der leistungsstarken Series.str-Methode durchführen.
Stellen Sie sich einen DataFrame mit einer Spalte mit Zeichenfolgenwerten vor. Um Zeilen basierend auf teilweisen Zeichenfolgenübereinstimmungen zu filtern, verwenden Sie die folgende Syntax:
df[df['column_name'].str.contains("partial_string")]
Die Methode str.contains() verwendet ein reguläres Ausdrucksmuster und gibt einen booleschen DataFrame zurück, der angibt, ob jede Zelle in der angegebenen Spalte die Anforderungen erfüllt Muster.
Um beispielsweise alle Zeilen im DataFrame zu finden, in denen die Namensspalte die Teilzeichenfolge „John“ enthält, verwenden Sie Folgendes Code:
df[df['name'].str.contains("John")]
Diese Methode ist mit Pandas-Versionen 0.8.1 und höher kompatibel und bietet eine effiziente Möglichkeit, teilweise Zeichenfolgenübereinstimmungen in Ihren DataFrame-Vorgängen durchzuführen.
Das obige ist der detaillierte Inhalt vonWie kann ich teilweise String-Übereinstimmungen in einem Pandas-DataFrame finden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!