將缺失日期加入 Pandas Dataframe
處理時間序列資料時,常常會遇到缺失日期。當事件發生在某些日期而不是其他日期時,就會發生這種情況。為了準確地表示這些數據,有必要考慮缺失的日期。
在提供的程式碼中,建立了一個以日期為索引的 Pandas 資料框。雖然日期範圍包括特定時間範圍內的所有日期,但資料框的大小較小,因為某些日期沒有關聯的事件。當嘗試繪製日期範圍和資料框時,這會導致大小不符。
首選方法是將缺少的日期加到計數為 0 的系列中。這可確保包含所有日期的完整圖表。為此,可以使用重新索引方法:
import pandas as pd idx = pd.date_range('09-01-2013', '09-30-2013') s = pd.Series({'09-02-2013': 2, '09-03-2013': 10, '09-06-2013': 5, '09-07-2013': 1}) s.index = pd.DatetimeIndex(s.index) s = s.reindex(idx, fill_value=0)
這將輸出一個新的系列s,其中'09-01-2013' 和'09-30-2013' 之間的所有缺失日期都用 0填充值:
2013-09-01 0 2013-09-02 2 2013-09-03 10 2013-09-04 0 2013-09-05 0 2013-09-06 5 2013-09-07 1 2013-09-08 0 ...
透過使用重新索引,缺失的日期將添加到該系列中,從而可以準確地繪製和分析時間序列資料。
以上是如何填入 Pandas DataFrame 中缺少的日期?的詳細內容。更多資訊請關注PHP中文網其他相關文章!