欠落している日付を Pandas Dataframe に追加する
時系列データを扱うとき、欠落している日付が発生することがよくあります。これは、イベントが特定の日付には発生するが、他の日付には発生しない場合に発生する可能性があります。このデータを正確に表現するには、欠落している日付を考慮する必要があります。
提供されたコードでは、日付をインデックスとして Pandas データフレームが作成されます。日付範囲には特定の時間枠内のすべての日が含まれますが、一部の日付には関連するイベントがないため、データフレームのサイズは小さくなります。これにより、日付範囲とデータフレームをプロットしようとすると、サイズが不一致になります。
推奨されるアプローチは、欠落している日付をカウント 0 で系列に追加することです。これにより、すべての日付が考慮された完全なグラフが保証されます。これを行うには、再インデックス メソッドを利用できます。
import pandas as pd idx = pd.date_range('09-01-2013', '09-30-2013') s = pd.Series({'09-02-2013': 2, '09-03-2013': 10, '09-06-2013': 5, '09-07-2013': 1}) s.index = pd.DatetimeIndex(s.index) s = s.reindex(idx, fill_value=0)
これにより、「09-01-2013」と「09-30-2013」の間の欠落している日付がすべて 0 で埋められた新しいシリーズが出力されます。値:
2013-09-01 0 2013-09-02 2 2013-09-03 10 2013-09-04 0 2013-09-05 0 2013-09-06 5 2013-09-07 1 2013-09-08 0 ...
再インデックスを使用すると、欠落している日付が系列に追加され、正確なプロットと分析が可能になります。時系列データ
以上がPandas DataFrame で欠落している日付を埋めるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。