Comprendre l'argument Skiprows dans l'importation csv de Pandas
Lors de l'importation de fichiers CSV dans Pandas, l'argument skiprows peut être utilisé pour exclure ou inclure des lignes spécifiques dans l'ensemble de données. Cependant, son utilisation peut être ambiguë, soulevant des questions sur sa fonctionnalité.
Selon la documentation de pandas, les skiprows peuvent prendre un argument de type liste ou un entier. Si un argument de type liste est fourni, il représente les numéros de ligne à ignorer (indexés à 0). Cependant, si un nombre entier est donné, cela signifie le nombre de lignes à sauter au début du fichier.
Le nœud de la question réside dans la compréhension de la façon dont la valeur entière fait la différence entre sauter la première ligne et la ligne avec l'index 1. Pour simplifier, considérons un exemple :
import pandas as pd from io import StringIO s = """1, 2 ... 3, 4 ... 5, 6""" print(pd.read_csv(StringIO(s), skiprows=[1], header=None)) print(pd.read_csv(StringIO(s), skiprows=1, header=None))
Ici, nous fournissons à la fois une liste et une valeur entière aux skiprows. Comme vous pouvez le constater :
Ce comportement précise que :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!