Diviser le texte d'une colonne en plusieurs lignes
Lorsque vous travaillez avec des fichiers CSV volumineux, il peut être nécessaire de diviser le texte dans une colonne spécifique en plusieurs lignes. Pandas et Python offrent des méthodes efficaces pour accomplir cette tâche.
Utilisation de Pandas
Split by Space :
df['Seatblocks'].str.split(' ').apply(Series, 1).stack()
Cela divise chaque ligne de la colonne « Seatblocks » par espace et crée une nouvelle colonne pour chaque chaîne résultante.
Divisé par deux points :
df['Seatblocks'].str.split(' ').apply(lambda x: Series(x.split(':')))
Cela divise davantage chaque chaîne de la nouvelle colonne par deux points, créant ainsi plusieurs colonnes pour chaque chaîne séparée par deux points.
Exemple
Considérez ce fichier CSV :
CustNum | CustomerName | ItemQty | Item | Seatblocks | ItemExt |
---|---|---|---|---|---|
32363 | McCartney, Paul | 3 | F04 | 2:218:10:4,6 | 60 |
31316 | Lennon, John | 25 | F01 | 1:13:36:1,12 1:13:37:1,13 | 300 |
En utilisant les méthodes ci-dessus, la colonne « Seatblocks » peut être divisée en plusieurs lignes :
CustNum | CustomerName | ItemQty | Item | Seatblocks1 | Seatblocks2 | Seatblocks3 | Seatblocks4 | ItemExt |
---|---|---|---|---|---|---|---|---|
32363 | McCartney, Paul | 3 | F04 | 2 | 218 | 10 | 4,6 | 60 |
31316 | Lennon, John | 25 | F01 | 1 | 13 | 36 | 1,12 | 300 |
31316 | Lennon, John | 25 | F01 | 1 | 13 | 37 | 1,13 | 300 |
Conclusion
En utilisant les opérations de fractionnement et d'empilement de Pandas, il est possible de restructurer efficacement les données texte d'une colonne en plusieurs lignes, permettant une analyse et une manipulation plus approfondies.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!