Merakam Corak Berulang dengan Python Regex
Apabila memadankan corak kompleks seperti alamat e-mel, anda mungkin menghadapi keperluan untuk menangkap berbilang kejadian subcorak tertentu. Dalam modul ungkapan biasa Python, ini boleh memberikan cabaran.
Pertimbangkan contoh memadankan alamat e-mel seperti "yasar@webmail.something.edu.tr". Selepas memadankan bahagian awal e-mel, anda mungkin ingin menangkap satu atau lebih kejadian subcorak ".(w )".
Semasa cuba menggunakan ungkapan "(.w ) ", anda menyedari bahawa ia hanya menangkap perlawanan terakhir. Ini bermakna anda terlepas kumpulan ".something" dan ".edu".
Dalam modul ekspresi biasa Python, tangkapan berulang tidak disokong, walaupun ia berada dalam standard regex. Atas sebab ini, menangkap segala-galanya sekali gus dan kemudian memisahkan subcorak kemudian adalah pendekatan yang lebih berkesan.
Berikut ialah contoh cara anda boleh membahagikan subcorak selepas menangkap alamat e-mel menggunakan ungkapan mudah:
import re pattern = r'([.\w]+)@((\w+)(\.\w+)+)' match = re.match(pattern, 'yasar@webmail.something.edu.tr') # Split the subpatterns subpatterns = match.group(2).split('.') # Access the subpatterns print(subpatterns[0]) # 'webmail' print(subpatterns[1]) # 'something' print(subpatterns[2]) # 'edu'
Kaedah ini membolehkan anda menangkap dan mengakses subcorak berulang secara individu, memberikan penyelesaian yang mudah dan boleh dibaca.
Atas ialah kandungan terperinci Bagaimana untuk Menangkap Berbilang Kejadian Subcorak dalam Python Regex?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!