데이터 세트를 처리할 때 부동 소수점 숫자가 숫자를 나타내는 Excel 스타일 형식의 날짜를 접하는 것이 일반적입니다. 특정 epoch 날짜 이후의 일수입니다. Pandas는 이러한 숫자를 일반 날짜/시간 객체로 변환하는 편리한 방법을 제공하여 원활한 데이터 조작 및 분석을 가능하게 합니다.
제공된 콘텐츠에 설명된 사례의 목표는 날짜가 포함된 XML 파일을 Excel 스타일로 구문 분석하는 것입니다. 예: 42580.3333333333. 이를 달성하기 위해 Pandas는 TimedeltaIndex를 사용하는 간단한 솔루션을 제공합니다.
import pandas as pd import datetime as dt df = pd.DataFrame({'date': [42580.3333333333, 10023]}) df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1900, 1, 1)
이 코드는 부동 소수점 값에서 TimedeltaIndex를 구성하고 이를 1900년 1월 1일의 스칼라 날짜/시간에 추가하여 Excel 날짜를 날짜/시간으로 효과적으로 변환합니다.
그러나 Excel은 표준과 약간 다른 신기원 날짜를 사용한다는 점에 유의하는 것이 중요합니다. datetime 객체이므로 그에 따라 결과 날짜를 조정해야 할 수도 있습니다. 이를 설명하기 위해 코드를 다음과 같이 수정할 수 있습니다.
df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1899, 12, 30)
이렇게 하면 Excel 스타일 날짜가 올바른 날짜/시간 값으로 변환되어 Pandas 프레임워크 내에서 정확한 데이터 처리 및 분석이 가능해집니다.
위 내용은 Pandas는 어떻게 Excel 스타일 날짜를 효율적으로 구문 분석할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!