Lorsque vous traitez des ensembles de données, il est courant de rencontrer des dates formatées dans le style Excel, où un nombre à virgule flottante représente le nombre de jours depuis une date d’époque spécifique. Pandas fournit un moyen pratique de convertir ces nombres en objets datetime réguliers, permettant une manipulation et une analyse transparentes des données.
Dans le cas décrit dans le contenu fourni, l'objectif est d'analyser un fichier XML contenant des dates dans le style Excel, tel que 42580.3333333333. Pour y parvenir, Pandas propose une solution simple en utilisant TimedeltaIndex :
import pandas as pd import datetime as dt df = pd.DataFrame({'date': [42580.3333333333, 10023]}) df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1900, 1, 1)
Ce code construit un TimedeltaIndex à partir des valeurs flottantes et l'ajoute à la date/heure scalaire du 1er janvier 1900, convertissant efficacement les dates Excel en datetime. objets.
Cependant, il est important de noter qu'Excel utilise une date d'époque légèrement différente de celle des objets datetime standard, les dates résultantes devront donc peut-être être ajustées en conséquence. Pour tenir compte de cela, le code peut être modifié comme suit :
df['real_date'] = pd.TimedeltaIndex(df['date'], unit='d') + dt.datetime(1899, 12, 30)
Cela garantit que les dates de style Excel sont converties en valeurs datetime correctes, permettant un traitement et une analyse précis des données dans le cadre Pandas.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!