Lorsque vous travaillez avec des dataframes pandas, il est courant de rencontrer des situations où des dates sont manquantes dans l'ensemble de données. Cela peut entraîner des erreurs lors de l'exécution d'opérations telles que le traçage ou le calcul de statistiques.
Considérons le cas où vous disposez d'une trame de données avec plusieurs événements à une date donnée ou aucun événement à une date donnée. Si vous regroupez la trame de données par date et comptez les événements, vous risquez de vous retrouver avec une série comportant moins de dates que la plage d'origine. Cela peut provoquer une erreur lorsque vous essayez de tracer la série par rapport à la plage de dates d'origine.
La solution à ce problème consiste à ajouter les dates manquantes à la série avec un nombre de 0. Ceci peut être réalisé en utilisant la réindexation fonction. La fonction de réindexation prend un nouvel index comme argument et remplit les valeurs manquantes avec une valeur spécifiée (par défaut NaN).
import pandas as pd idx = pd.date_range('09-01-2013', '09-30-2013') s = pd.Series({'09-02-2013': 2, '09-03-2013': 10, '09-06-2013': 5, '09-07-2013': 1}) s.index = pd.DatetimeIndex(s.index) s = s.reindex(idx, fill_value=0)
Le code ci-dessus utilise la réindexation pour ajouter les dates manquantes à la série s, avec une valeur de remplissage de 0. Cela donne une série avec toutes les dates comprises entre « 01-09-2013 » et « 30-09-2013 », avec des comptes de 0 pour dates où aucun événement ne s'est produit.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!