Datenrahmenzeilen innerhalb eines angegebenen Datumsbereichs auswählen
Problem:
So erstellen Sie ein neuer DataFrame aus einer CSV-Datei, der nur Zeilen mit Datumsangaben innerhalb eines angegebenen Bereichs oder zwischen zwei enthält Datumsangaben.
Lösung 1: Verwenden einer booleschen Maske
Stellen Sie sicher, dass die Datumsspalte des DataFrame eine Serie mit einem datetime64[ns]-Datentyp ist. Erstellen Sie eine boolesche Maske, indem Sie die Daten mit dem Start- und Enddatum vergleichen. Verwenden Sie diese Maske, um die Zeilen auszuwählen und entweder einen neuen DataFrame zu erstellen oder den vorhandenen zu überschreiben.
Beispiel:
df['date'] = pd.to_datetime(df['date']) mask = (df['date'] > start_date) & (df['date'] <= end_date) df_filtered = df.loc[mask]
Lösung 2: Verwenden von a DatetimeIndex
Konvertieren Sie die Datumsspalte in einen DatetimeIndex. Dadurch können Sie Zeilen nach Datum mit df.loc[start_date:end_date] auswählen.
Beispiel:
import pandas as pd df['date'] = pd.date_range('2000-1-1', periods=200, freq='D') df = df.set_index(['date']) df_filtered = df.loc['2000-6-1':'2000-6-10']
Zusätzliche Hinweise:
Das obige ist der detaillierte Inhalt vonWie filtere ich DataFrame-Zeilen nach Datumsbereich in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!