如何使用 Python 正規表示式來匹配多行文字區塊：捕獲小寫和大寫元件？-Python教學-PHP中文網

如何使用 Python 正規表示式來匹配多行文字區塊：捕獲小寫和大寫元件？

DDD

發布： 2024-10-25 09:56:28

原創

536 人瀏覽過

How to Match Multiline Text Blocks with Python Regular Expressions: Capturing Lowercase and Uppercase Components?

使用Python 正規表示式匹配多行文字區塊

在這個程式設計問題中，我們的目標是符合跨多行的特定格式的文字。輸入文字由小寫和大寫文字交替區塊組成，其中小寫文字代表基本成分，大寫文字代表胺基酸序列。

問題陳述

任務是在Python中建立一個正規表示式，它可以從輸入文字中捕獲兩個元件：

基本小寫組件
出現兩個的大寫行序列下面的行

輸出應分為兩個捕獲組，基本小寫組件在組(1) 中，大寫序列在組(2) 中。

解

要解決這個問題，我們可以利用以下正規表示式：

re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)

登入後複製

此正規表示式以多行模式運行，這意味著^ 和$ 錨點將匹配分別是行的開頭和結尾。

解釋

^(. )$：單獨配對基本小寫組件line.
n((?:n. ) )：符合基本元件後面的連續大寫文字行。
- n：符合換行符。
- (?:n. ) ：非捕獲組，匹配一個或多個出現的換行符，後面跟著一個或多個非空白字元 ( )。

用法

要使用此正規表示式，您可以按照下列步驟操作：

import re

text = """
some Varying TEXT
...
[lines of uppercase text]
...
"""

regex = re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)

match = regex.search(text)
if match:
    lowercase_text = match.group(1)
    uppercase_text = match.group(2)
    # Process the captured text as needed

登入後複製

以上是如何使用 Python 正規表示式來匹配多行文字區塊：捕獲小寫和大寫元件？的詳細內容。更多資訊請關注PHP中文網其他相關文章！