Compétences en traitement des données : utilisez Pandas pour supprimer des colonnes spécifiques dans DataFrame
Lors de l'analyse et du traitement des données, la suppression des colonnes inutiles dans DataFrame est l'une des exigences courantes. Pandas est une bibliothèque d'analyse et de traitement de données couramment utilisée en Python, offrant des fonctions riches et des méthodes de fonctionnement flexibles. Cet article explique comment utiliser Pandas pour supprimer des colonnes spécifiques dans un DataFrame et fournit des exemples de code spécifiques.
1. Tout d'abord, nous devons importer la bibliothèque Pandas et créer un DataFrame pour la démonstration :
import pandas as pd # 创建示例DataFrame data = {'姓名': ['张三', '李四', '王五', '赵六'], '性别': ['男', '女', '男', '女'], '年龄': [25, 30, 35, 28], '成绩': [80, 90, 85, 95]} df = pd.DataFrame(data) print(df)
Dans le code ci-dessus, nous avons créé un DataFrame contenant quatre colonnes de nom, de sexe, d'âge et de notes, et l'avons imprimé. les résultats sont les suivants :
姓名 性别 年龄 成绩 0 张三 男 25 80 1 李四 女 30 90 2 王五 男 35 85 3 赵六 女 28 95
2. Ensuite, nous montrerons comment supprimer des colonnes spécifiques dans un DataFrame à l'aide de Pandas.
drop
pour supprimer une seule colonne drop
方法删除单个列# 删除单个列 df_drop = df.drop('性别', axis=1) print(df_drop)
以上代码中,我们使用drop
方法删除了DataFrame中的'性别'列,并将结果保存在新的DataFrame df_drop
中。axis=1
表示删除的是列,结果如下:
姓名 年龄 成绩 0 张三 25 80 1 李四 30 90 2 王五 35 85 3 赵六 28 95
# 删除多个列 df_drop_multi = df.drop(['年龄', '成绩'], axis=1) print(df_drop_multi)
以上代码中,我们使用drop
方法删除了DataFrame中的'年龄'和'成绩'两列,并将结果保存在新的DataFrame df_drop_multi
中,结果如下:
姓名 性别 0 张三 男 1 李四 女 2 王五 男 3 赵六 女
# 直接使用列表索引删除多个列 df_drop_iat = df[df.columns[[0, 2]]] print(df_drop_iat)
以上代码中,我们使用DataFrame的columns
属性和列表索引的方式删除了DataFrame中的'姓名'和'年龄'两列,并将结果保存在新的DataFrame df_drop_iat
中,结果如下:
姓名 年龄 0 张三 25 1 李四 30 2 王五 35 3 赵六 28
三、通过以上示例,我们学习了在使用Pandas中删除DataFrame中特定列的不同方法和技巧。这些方法的选择取决于实际需求以及个人偏好。
总结:
drop
方法删除单个或多个列,需要指定axis=1
表示删除的是列。df.columns
drop
pour supprimer la colonne 'genre' dans le DataFrame et enregistrez le résultat dans le nouveau DataFrame df_drop
. axis=1
signifie que la colonne est supprimée, le résultat est le suivant : drop
La méthode supprime les colonnes 'age' et 'grade' dans le DataFrame et enregistre les résultats dans un nouveau DataFrame df_drop_multi
Les résultats sont les suivants : 🎜rrreee. columns
de DataFrame et l'index de liste pour supprimer le 'nom' et 'age' dans le DataFrame et enregistrez le résultat dans un nouveau DataFrame df_drop_iat
, le résultat est le suivant : 🎜rrreee🎜 3. Grâce aux exemples ci-dessus, nous avons appris différentes méthodes et techniques de suppression colonnes spécifiques dans DataFrame à l'aide de Pandas. Le choix de ces méthodes dépend des besoins pratiques ainsi que des préférences personnelles. 🎜🎜Résumé : 🎜🎜🎜Utilisez la méthode drop
pour supprimer une ou plusieurs colonnes. Vous devez spécifier axis=1
pour indiquer que les colonnes sont en cours de suppression. 🎜🎜Utilisez l'index de liste pour supprimer plusieurs colonnes. Vous pouvez directement sélectionner les colonnes qui doivent être conservées via l'attribut df.columns
. 🎜🎜Lors de la suppression d'une colonne, le DataFrame d'origine n'est pas modifié, mais un nouveau DataFrame est renvoyé. 🎜🎜🎜Grâce aux opérations flexibles et aux fonctions riches fournies par Pandas, nous pouvons facilement traiter et gérer les données dans DataFrame pour répondre aux différents besoins d'analyse et de traitement des données. 🎜Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!