将缺失日期添加到 Pandas Dataframe
处理时间序列数据时,经常会遇到缺失日期。当事件发生在某些日期而不是其他日期时,就会出现这种情况。为了准确地表示这些数据,有必要考虑缺失的日期。
在提供的代码中,创建了一个以日期为索引的 Pandas 数据框。虽然日期范围包括特定时间范围内的所有日期,但数据框的大小较小,因为某些日期没有关联的事件。当尝试绘制日期范围和数据框时,这会导致大小不匹配。
首选方法是将缺失的日期添加到计数为 0 的系列中。这可确保包含所有日期的完整图表。为此,可以使用重新索引方法:
import pandas as pd idx = pd.date_range('09-01-2013', '09-30-2013') s = pd.Series({'09-02-2013': 2, '09-03-2013': 10, '09-06-2013': 5, '09-07-2013': 1}) s.index = pd.DatetimeIndex(s.index) s = s.reindex(idx, fill_value=0)
这将输出一个新的系列 s,其中 '09-01-2013' 和 '09-30-2013' 之间的所有缺失日期都用 0 填充值:
2013-09-01 0 2013-09-02 2 2013-09-03 10 2013-09-04 0 2013-09-05 0 2013-09-06 5 2013-09-07 1 2013-09-08 0 ...
通过使用重新索引,缺失的日期将添加到该系列中,从而可以准确地绘制和分析时间序列数据。
以上是如何填充 Pandas DataFrame 中缺失的日期?的详细内容。更多信息请关注PHP中文网其他相关文章!