Pandas DataFrame으로 작업할 때 데이터세트에서 날짜가 누락되는 상황에 직면하는 것이 일반적입니다. 이로 인해 통계 작성이나 계산과 같은 작업을 수행할 때 오류가 발생할 수 있습니다.
특정 날짜에 여러 이벤트가 있거나 특정 날짜에 이벤트가 없는 데이터 프레임이 있는 경우를 생각해 보세요. 데이터프레임을 날짜별로 그룹화하고 이벤트 수를 계산하면 원래 범위보다 날짜가 더 적은 계열이 생성될 수 있습니다. 이로 인해 원래 날짜 범위에 대해 계열을 구성하려고 할 때 오류가 발생할 수 있습니다.
이 문제에 대한 해결책은 개수가 0인 계열에 누락된 날짜를 추가하는 것입니다. 이는 재색인을 사용하여 달성할 수 있습니다. 기능. reindex 함수는 새 인덱스를 인수로 사용하고 누락된 값을 지정된 값(기본값은 NaN)으로 채웁니다.
import pandas as pd idx = pd.date_range('09-01-2013', '09-30-2013') s = pd.Series({'09-02-2013': 2, '09-03-2013': 10, '09-06-2013': 5, '09-07-2013': 1}) s.index = pd.DatetimeIndex(s.index) s = s.reindex(idx, fill_value=0)
위 코드는 reindex를 사용하여 누락된 날짜를 계열 s에 추가합니다. 채우기 값은 0입니다. 그러면 '09-01-2013' ~ '09-30-2013' 범위의 모든 날짜가 포함된 계열이 생성되고 날짜 개수는 0이 됩니다. 아무런 사건도 일어나지 않은 곳.
위 내용은 내 Pandas DataFrame에서 누락된 날짜를 어떻게 채울 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!