Memelihara Pemisah dalam Pemisahan Rentetan Python
Apabila membelah rentetan dalam Python, tingkah laku lalai adalah membuang aksara pemisahan. Walau bagaimanapun, terdapat situasi di mana mengekalkan pemisah ini boleh memberi manfaat.
Pertimbangkan senario berikut, di mana anda ingin menokenkan rentetan, melakukan beberapa operasi padanya dan kemudian membina semula rentetan asal. Untuk mencapai matlamat ini, memelihara pemisah adalah penting.
Penyelesaian: Menggunakan Menangkap Kumpulan
Fungsi Python re.split menyediakan cara untuk menangkap pemisah dengan menggunakan menangkap kurungan dalam coraknya. Begini cara anda boleh melakukannya:
import re string = 'foo/bar spam\neggs' pattern = '(\W)' # Capture non-word characters in parentheses result = re.split(pattern, string) print(result)
Ini akan menghasilkan output berikut:
['foo', '/', 'bar', ' ', 'spam', '\n', 'eggs']
Seperti yang anda lihat, pemisah telah dikekalkan sebagai elemen berasingan dalam senarai yang terhasil.
Memahami Kumpulan Menangkap
Kunci kepada ini penyelesaian terletak pada penggunaan kumpulan penangkapan dalam corak ungkapan biasa. Menangkap kumpulan ditakrifkan menggunakan kurungan, dan mereka membenarkan anda menangkap teks yang dipadankan. Dalam kes ini, kumpulan penangkapan (W) sepadan dengan mana-mana aksara bukan perkataan dan teks yang dipadankan disertakan dalam senarai yang terhasil.
Dengan menggunakan teknik ini, anda boleh membelah rentetan dengan berkesan sambil mengekalkan pemisah. Keupayaan ini boleh berguna dalam pelbagai senario, seperti teks token, memanipulasi rentetan dan membina semula rentetan selepas menggunakan perubahan.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Memelihara Pemisah Apabila Memisahkan Rentetan dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!