마커 간 하위 가닥 추출
문자열과 마커 쌍이 주어지면 이 마커 사이의 하위 문자열을 추출하는 작업입니다. 예를 들어 'gfgfdAAA1234ZZZuijjk' 문자열을 생각해 보세요. 목표는 '1234' 부분을 얻는 것입니다.
Python에서 정규식은 이 문제에 대한 강력한 솔루션을 제공합니다. 다음 코드 조각을 고려하십시오.
import re text = 'gfgfdAAA1234ZZZuijjk' m = re.search('AAA(.+?)ZZZ', text) if m: found = m.group(1) # found: 1234
'AAA(. ?)ZZZ' 표현식은 'AAA'와 'ZZZ' 사이의 모든 하위 문자열과 일치합니다. 표현식의 괄호는 하위 문자열을 그룹으로 캡처하고 '. ?' 수량자는 탐욕스럽지 않게 임의 개수의 문자와 일치하는지 확인합니다.
re.search() 함수는 텍스트에서 첫 번째 패턴 발생을 찾고 캡처된 그룹이 포함된 일치 개체를 반환합니다. . group(1) 메서드는 마커 사이의 하위 문자열을 추출하여 발견된 변수에 할당합니다.
또는 try-Exception 블록이 잠재적인 오류를 처리할 수 있습니다.
import re text = 'gfgfdAAA1234ZZZuijjk' try: found = re.search('AAA(.+?)ZZZ', text).group(1) except AttributeError: # AAA, ZZZ not found in the original string found = '' # Your error handling here # found: 1234
이 접근 방식은 다음을 보장합니다. group(1) 메서드가 실패할 때 발생하는 AttributeError를 처리하므로 텍스트에 마커가 없어도 프로그램이 계속 실행됩니다.
위 내용은 정규식을 사용하여 Python에서 마커 사이의 하위 문자열을 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!