Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimana untuk Memadankan Blok Teks Berbilang Baris dengan Ungkapan Biasa dalam Python?

Bagaimana untuk Memadankan Blok Teks Berbilang Baris dengan Ungkapan Biasa dalam Python?

Mary-Kate Olsen
Lepaskan: 2024-10-25 10:25:17
asal
693 orang telah melayarinya

How to Match Multi-Line Text Blocks with Regular Expressions in Python?

Memadankan Blok Teks Berbilang Baris dengan Ungkapan Biasa dalam Python

Dalam Python, pemadanan regex boleh mencabar apabila berurusan dengan teks berbilang baris . Sebagai contoh, pertimbangkan teks berikut dengan "n" mewakili baris baharu:

some Varying TEXT

DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF
[more of the above, ending with a newline]
[yep, there is a variable number of lines here]
[repeat the above a few hundred times].
Salin selepas log masuk

Matlamatnya ialah untuk menangkap dua elemen:

  • "beberapa TEKS Berbeza-beza"
  • Semua baris teks huruf besar bermula dua baris di bawah elemen pertama, sebagai kumpulan tangkapan tunggal (pemutus baris boleh dilucutkan kemudian).

Percubaan sebelumnya menggunakan variasi ungkapan biasa berikut telah tidak berjaya:

re.compile(r"^>(\w+)$$(\[.$]+)^$", re.MULTILINE)
re.compile(r"(^[^>]\[\w\s]+)$", re.MULTILINE|re.DOTALL)
Salin selepas log masuk

Penyelesaian:

Untuk memadankan teks berbilang baris dengan betul, gunakan ungkapan biasa berikut:

re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)
Salin selepas log masuk

Ini corak sepadan dengan yang berikut:

  • Kumpulan 1: "sesetengah TEKS Pelbagai"
  • Kumpulan 2: Semua baris teks huruf besar bermula dua baris di bawah "beberapa TEKS Bervariasi"

Inti Utama:

  • ^ dan $ sauh sepadan dengan kedudukan sejurus selepas dan sebelum baris baharu, masing-masing.
  • Pengendali ?: menjadikan kumpulan baris baharu tidak menangkap.
  • Pengkuantiti .* menangkap satu atau lebih baris teks huruf besar.

Penyelesaian Alternatif:

Jika teks sasaran mungkin mengandungi jenis baris baharu yang lain selain suapan baris (n), gunakan versi yang lebih inklusif berikut:

re.compile(r"^(.+)(?:\n|\r\n?)((?:(?:\n|\r\n?).+)+)", re.MULTILINE)
Salin selepas log masuk

Atas ialah kandungan terperinci Bagaimana untuk Memadankan Blok Teks Berbilang Baris dengan Ungkapan Biasa dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan