选择两个日期之间的 DataFrame 行
简介
处理时间序列数据时,通常需要根据日期范围选择特定行。本文探讨了在 pandas DataFrames 中实现此目的的两种方法。
方法 1:布尔掩码
确保日期列是具有 dtype 的 Series datetime64[ns]:
df['date'] = pd.to_datetime(df['date'])
使用比较运算符与开始日期和结束日期创建布尔掩码:
mask = (df['date'] > start_date) & (df['date'] <= end_date)
选择子 DataFrame 使用mask:
df.loc[mask]
方法 2:DatetimeIndex
将日期列设置为索引:
df = df.set_index(['date'])
使用日期范围对 DataFrame 进行切片:
df.loc[start_date:end_date]
示例
考虑一个带有日期列的 DataFrame。以下代码使用布尔掩码方法选择 '2000-06-01' 和 '2000-06-10' 之间的行:
import pandas as pd df = pd.DataFrame({ 'date': pd.date_range('2000-1-1', periods=200, freq='D'), 'value': np.random.rand(200) }) mask = (df['date'] > '2000-06-01') & (df['date'] <= '2000-06-10') result_df = df[mask]
结果包括从 6 月 1 日到 10 日的行, 2000.
比较
以上是如何在 Pandas 中高效选择特定日期范围内的 DataFrame 行?的详细内容。更多信息请关注PHP中文网其他相关文章!