Le contenu de cet article est un résumé des fonctions couramment utilisées dans les pandas de Python. Il a une certaine valeur de référence. Les amis dans le besoin peuvent s'y référer.
pandas est une bibliothèque de traitement de données en python Lors de son utilisation, il faut d'abord saisir import pandas as pd
pour l'importer.
1.df = pd.read_csv("File Path") : C'est la méthode pour lire les fichiers csv si vous souhaitez lire Excel ou d'autres documents, il existe une fonction de lecture correspondante.
2.df.dtypes : S'il y a des données de caractères dans le fichier, l'objet est renvoyé.
3.df.head(n) : Afficher les n premières lignes de données Si aucun paramètre n'est transmis, les 5 premières lignes de. les données seront affichées.
4.df.tail(n) : Afficher les n dernières lignes de données Si aucun paramètre n'est transmis, les 5 dernières lignes de données. les données seront affichées.
5.df.columns : Affiche les noms de colonnes du tableau de données sous forme de liste.
6.df.shape : Affiche le nombre de lignes et de colonnes de données dans le tableau sous forme de tuples.
7.df.loc[n] : renvoie la ligne d'index n.
8.df.loc[m][n] : renvoie les données dont la valeur d'index est m lignes et n colonnes.
9.df.loc[m:n] : renvoie les lignes avec des valeurs d'index de m à n.
10.df.loc[[m,n,k]] : renvoie les lignes dont les valeurs d'index sont respectivement m,n,k.
11.df["str"] : renvoie la colonne nommée str.
12.df.columns.tolist() : Transformez les noms de colonnes en liste.
13.df["str"]*df["str"] : Si les dimensions des deux colonnes sont les mêmes, alors le les positions correspondantes des deux colonnes sont multipliées.
14.df.sort_values("str",inplace=True,ascending=False) : Organisez la colonne str par ordre décroissant et obtenez Les données remplacent les données d'origine. inplace indique s'il faut remplacer les données d'origine par les données triées. La valeur par défaut est False, ce qui signifie aucun remplacement. croissant indique l'ordre de tri, la valeur par défaut est True, c'est-à-dire classé par ordre croissant.
15.judge = pd.isnull(df["str"]) : renvoie une valeur booléenne et les données de la colonne str sont une valeur nulle renvoie True, sinon renvoie False.
16.a["judge"] : Renvoyez le juge comme True, qui correspond aux données manquantes, puis appelez la fonction len(), qui est Le nombre de données manquantes peuvent être trouvées.
17.df.pivot_table(index="a",values= "b",aggfunc=np.mean) : Il s'agit d'une fonction très importante qui fait la moyenne de b et le classe selon la catégorie de a. Le troisième paramètre est par défaut la moyenne.
18.df.loc[n, "str"] : localisez les données à la ligne n, nom de colonne str.
19.sort_res.reset_index(drop=True) : Réorganiser les numéros des données triées. Drop fait référence à la suppression ou non des données d'origine. En comparant les résultats avec la figure 14, nous pouvons voir que les nombres ont été réorganisés.
20.df.apply() : Voici comment utiliser une fonction personnalisée dans les pandas. Le nom de la fonction est passé entre parenthèses.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!