Python의 단어 경계 및 특수 문자
Python 정규 표현식에서 단어 경계 일치에 b 패턴을 사용할 때 다음과 같은 경우 예기치 않은 결과가 발생할 수 있습니다. 검색 패턴에는 대괄호나 중괄호와 같은 특수 문자가 포함되어 있습니다.
구체적으로 b는 다음 문자가 있는 단어 경계에서만 일치합니다. 단어 문자(영숫자 또는 밑줄)입니다. 즉, 예를 들어 bSortesindex[persons]{Sortes}는 Sortes 뒤에 특수 문자(}index)가 있기 때문에 테스트 Sortesindex[persons]{Sortes} 텍스트와 일치하지 않습니다.
적절하게 일치하는 경우 다음 솔루션을 고려하세요.
Adaptive Word 경계:
문자열의 시작이나 끝 또는 단어 문자 상태가 다른 문자 사이에서 일치하는 적응형 단어 경계를 사용합니다.
re.search(r'(?:(?!\w)|\b(?=\w)){}(?:(?<=\w)\b|(?<!\w))'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
명확한 단어 경계:
명확한 단어 경계를 사용하여 일치 양쪽에 단어 문자가 없도록 엄격히 요구합니다.
re.search(r'(?<!\w){}(?!\w)'.format(re.escape('Sortes\index[persons]{Sortes}')), 'test Sortes\index[persons]{Sortes} test')
단어가 아닌 단어를 명시적으로 처리 경계:
W 또는 $를 사용하여 비단어 경계를 명시적으로 처리합니다. 예:
re.search(r'\b' + re.escape('Sortes\index[persons]{Sortes}') + '(\W|$)', 'test Sortes\index[persons]{Sortes} test')
또한 단어 경계를 더 유연하게 정의하려면 부정 탐색을 사용하는 것이 좋습니다. 예를 들어, (?
위 내용은 Python의 단어 경계를 사용하여 문자열과 특수 문자를 어떻게 안정적으로 일치시킬 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!