Memisahkan Teks dalam Lajur kepada Berbilang Baris
Apabila bekerja dengan fail CSV yang besar, mungkin perlu untuk memisahkan teks dalam lajur tertentu ke dalam beberapa baris. Panda dan Python menawarkan kaedah yang cekap untuk melaksanakan tugas ini.
Menggunakan Panda
Dipisahkan oleh Ruang:
df['Seatblocks'].str.split(' ').apply(Series, 1).stack()
Ini membahagikan setiap baris dalam lajur 'Sekat tempat duduk' mengikut ruang dan mencipta lajur baharu untuk setiap rentetan yang terhasil.
Pisah mengikut Titik Bertitik:
df['Seatblocks'].str.split(' ').apply(lambda x: Series(x.split(':')))
Ini memisahkan lagi setiap rentetan dalam lajur baharu mengikut bertindih, mencipta berbilang lajur untuk setiap rentetan yang dipisahkan bertindih.
Contoh
Pertimbangkan fail CSV ini:
CustNum | CustomerName | ItemQty | Item | Seatblocks | ItemExt |
---|---|---|---|---|---|
32363 | McCartney, Paul | 3 | F04 | 2:218:10:4,6 | 60 |
31316 | Lennon, John | 25 | F01 | 1:13:36:1,12 1:13:37:1,13 | 300 |
Menggunakan kaedah di atas, lajur 'Sekat tempat duduk' boleh dibahagikan kepada beberapa baris:
CustNum | CustomerName | ItemQty | Item | Seatblocks1 | Seatblocks2 | Seatblocks3 | Seatblocks4 | ItemExt |
---|---|---|---|---|---|---|---|---|
32363 | McCartney, Paul | 3 | F04 | 2 | 218 | 10 | 4,6 | 60 |
31316 | Lennon, John | 25 | F01 | 1 | 13 | 36 | 1,12 | 300 |
31316 | Lennon, John | 25 | F01 | 1 | 13 | 37 | 1,13 | 300 |
Kesimpulan
Dengan menggunakan operasi membelah dan menyusun Pandas, adalah mungkin untuk menstruktur semula data teks dalam lajur dengan cekap kepada berbilang baris, membolehkan analisis dan manipulasi selanjutnya.
Atas ialah kandungan terperinci Bagaimanakah saya boleh memisahkan teks dalam lajur kepada berbilang baris menggunakan Panda dan Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!