Comment décompresser une colonne de type liste en lignes distinctes dans un DataFrame ?-Tutoriel Python-php.cn

Table des matières

Décompression d'une colonne de type liste en lignes séparées dans un DataFrame

Maison

développement back-end

Tutoriel Python

Comment décompresser une colonne de type liste en lignes distinctes dans un DataFrame ?

Linda Hamilton

Nov 11, 2024 pm 10:51 PM

How to Unpack a List-Like Column into Separate Rows in a DataFrame?

Décompression d'une colonne de type liste en lignes séparées dans un DataFrame

Question :

Comment pouvons-nous transformer un DataFrame cellule contenant une liste en lignes individuelles pour chaque valeur de cette liste ?

Exemple :

Considérez le DataFrame suivant :

name	opponent	nearest_neighbors
A.J. Price	76ers	['Zach LaVine', 'Jeremy Lin', 'Nate Robinson', 'Isaia']

Notre objectif consiste à "exploser" la colonne les plus proches_neighbours, en créant une nouvelle ligne pour chaque valeur de la liste.

Réponse :

Dans la version pandas 0.25 et ultérieure, l'explosion( ) rend cette opération simple :

import pandas as pd

df = (pd.DataFrame({'name': ['A.J. Price'] * 3, 
                    'opponent': ['76ers', 'blazers', 'bobcats'], 
                    'nearest_neighbors': [['Zach LaVine', 'Jeremy Lin', 'Nate Robinson', 'Isaia']] * 3})
      .set_index(['name', 'opponent']))

df.explode('nearest_neighbors')

Sortie :

name	opponent	nearest_neighbors
A.J. Price	76ers	Zach LaVine
A.J. Price	76ers	Jeremy Lin
A.J. Price	76ers	Nate Robinson
A.J. Price	76ers	Isaia
A.J. Price	blazers	Zach LaVine
A.J. Price	blazers	Jeremy Lin
A.J. Price	blazers	Nate Robinson
A.J. Price	blazers	Isaia
A.J. Price	bobcats	Zach LaVine
A.J. Price	bobcats	Jeremy Lin
A.J. Price	bobcats	Nate Robinson
A.J. Price	bobcats	Isaia

La méthode éclater() déroule efficacement chaque liste dans la colonne les plus proches_neighbours, créant une nouvelle ligne pour chaque valeur.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undress AI Tool

Images de déshabillage gratuites

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Comment signaler un compte d'identité sur Instagram

3 Il y a quelques semaines By 下次还敢

Wuchang: Fallen Feathers - Empereur de dragon Zhu Youjian Boss Fight Guide

1 Il y a quelques mois By DDD

Comment changer la personnalité de Chatgpt dans les paramètres (cynique, robot, auditeur, nerd)

3 Il y a quelques semaines By DDD

Comment combattre Eris dans les abîmes néon

3 Il y a quelques semaines By Jack chen

Pokémon TCG Scarlet & Violet: Black Bolt Elite Trainer Box Review

1 Il y a quelques mois By Jack chen

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Tutoriel PHP

1607

276

Setting up and using Magic Mouse in Windows

Afficher plus

Related knowledge

SQLALCHEMY 2.0 AVERTISSEMENT AVERTISSEMENT ET CONNECTION Guide de résolution des problèmes de prolongation Aug 05, 2025 pm 07:57 PM

Cet article vise à aider les débutants de Sqlalchemy à résoudre l'avertissement "supprimé en aval de warning" rencontré lors de l'utilisation de Create_Engine et l'erreur de clôture de connexion "ResourceCloseDerror" ultérieure. L'article expliquera la cause de cet avertissement en détail et fournira des étapes et des exemples de code spécifiques pour éliminer les problèmes d'avertissement et de résolution de la connexion pour vous assurer que vous pouvez interroger et faire fonctionner la base de données en douceur.

Python Shutil rmtree Exemple Aug 01, 2025 am 05:47 AM

ShutLil.rmtree () est une fonction de Python qui supprime récursivement l'intégralité de l'arborescence du répertoire. Il peut supprimer les dossiers spécifiés et tous les contenus. 1. Utilisation de base: utilisez ShutLil.rmtree (Path) pour supprimer le répertoire, et vous devez gérer FileLenotFoundError, PermissionError et autres exceptions. 2. Application pratique: vous pouvez effacer les dossiers contenant des sous-répertoires et des fichiers en un seul clic, tels que des données temporaires ou des répertoires mis en cache. 3. Remarques: L'opération de suppression n'est pas restaurée; FilenotFoundError est lancé lorsque le chemin n'existe pas; Il peut échouer en raison d'autorisations ou d'occupation des fichiers. 4. Paramètres facultatifs: les erreurs peuvent être ignorées par ignore_errors = true

Python pour l'ingénierie des données etl Aug 02, 2025 am 08:48 AM

Python est un outil efficace pour implémenter les processus ETL. 1. Extraction des données: les données peuvent être extraites des bases de données, des API, des fichiers et d'autres sources via des pandas, sqlalchemy, demandes et autres bibliothèques; 2. Conversion des données: utilisez des pandas pour le nettoyage, la conversion de type, l'association, l'agrégation et d'autres opérations pour assurer la qualité des données et optimiser les performances; 3. Chargement des données: utilisez la méthode Pandas To_SQL ou le SDK de la plate-forme cloud pour écrire des données sur le système cible, faire attention aux méthodes d'écriture et au traitement par lots; 4. Recommandations d'outils: Air Flow, Dagster, Prefect sont utilisés pour la planification et la gestion de processus, combinant des alarmes de journal et des environnements virtuels pour améliorer la stabilité et la maintenabilité.

Comment automatiser la saisie de données d'Excel à un formulaire Web avec Python? Aug 12, 2025 am 02:39 AM

La méthode de remplissage des données Excel dans les formulaires Web à l'aide de Python est: utilisez d'abord des pandas pour lire les données Excel, puis utilisez le sélénium pour contrôler le navigateur pour remplir et soumettre automatiquement le formulaire; Les étapes spécifiques incluent l'installation de bibliothèques Pandas, OpenPyxl et Selenium, en téléchargeant le pilote de navigateur correspondant, en utilisant des pandas pour lire le nom, le courrier électronique, le téléphone et d'autres champs dans le fichier data.xlsx, le lancement du navigateur via le sélénium pour ouvrir la page Web cible, localiser les éléments de formulaire et remplir le traitement de données, en utilisant le formulaire Web pour traiter le contenu dynamique, ajouter le contenu de la charge dynamique, ajouter un traitement exception et traiter toutes les lignes de données dans une boucle.

Python Pandas Styling Dataframe Exemple Aug 04, 2025 pm 01:43 PM

L'utilisation de pandasstyling dans Jupyternotebook peut réaliser le bel affichage de DataFrame. 1. Utilisez Highlight_max et Highlight_min pour mettre en évidence la valeur maximale (vert) et la valeur minimale (rouge) de chaque colonne; 2. Ajouter la couleur d'arrière-plan du gradient (comme le blues ou les rouges) à la colonne numérique via background_gradient pour afficher visuellement la taille des données; 3. Fonction personnalisée Color_score combinée avec ApplyMap pour définir des couleurs de texte pour différents intervalles fractionnaires (≥90 vert, 80 ~ 89 orange, 60 ~ 79 rouge,

Comment exécuter des requêtes SQL dans Python? Aug 02, 2025 am 01:56 AM

Installer le pilote de base de données correspondant; 2. Utilisez Connect () pour se connecter à la base de données; 3. Créez un objet de curseur; 4. Utilisez EXECUTE () ou Execumany () pour exécuter SQL et utiliser une requête paramétrée pour empêcher l'injection; 5. Utilisez fetchall (), etc. pour obtenir des résultats; 6. commit () est requis après modification; 7. Enfin, fermez la connexion ou utilisez un gestionnaire de contexte pour le gérer automatiquement; Le processus complet garantit que les opérations SQL sont sûres et efficaces.

Comment créer un environnement virtuel à Python Aug 05, 2025 pm 01:05 PM

Pour créer un environnement virtuel Python, vous pouvez utiliser le module VENV. Les étapes sont: 1. Entrez le répertoire de projet pour exécuter l'environnement Python-Mvenvenv pour créer l'environnement; 2. Utilisez SourceEnv / Bin / Activer sur Mac / Linux et Env \ Scripts \ Activate sur Windows; 3. Utilisez le package d'installation PiPinstall, PipFreeze> exigence.txt pour exporter les dépendances; 4. Veillez à éviter de soumettre l'environnement virtuel à GIT et confirmez qu'il est dans le bon environnement pendant l'installation. Les environnements virtuels peuvent isoler les dépendances du projet pour prévenir les conflits, en particulier adaptés au développement multi-projets, et les éditeurs tels que PyCharm ou VScode sont également

Comment partager des données entre plusieurs processus dans Python? Aug 02, 2025 pm 01:15 PM

Utilisez le multiprocessement.queue pour transmettre des données en toute sécurité entre plusieurs processus, adaptés aux scénarios de plusieurs producteurs et consommateurs; 2. Utilisez le multiprocessement.Pipe pour atteindre une communication bidirectionnelle à grande vitesse entre deux processus, mais uniquement pour les connexions à deux points; 3. Utilisez la valeur et le tableau pour stocker des types de données simples dans la mémoire partagée et doivent être utilisés avec le verrouillage pour éviter les conditions de concurrence; 4. Utiliser Manager pour partager des structures de données complexes telles que les listes et les dictionnaires, qui sont très flexibles mais ont de faibles performances, et conviennent aux scénarios avec des états partagés complexes; Les méthodes appropriées doivent être sélectionnées en fonction de la taille des données, des exigences de performance et de la complexité. La file d'attente et le gestionnaire conviennent le plus aux débutants.

See all articles