re モジュールの正規表現は単語境界 (b) をサポートしますか?
正規表現を検討するとき、一般的な提案は、 b 単語の境界に一致する文字シーケンス。ただし、この手法を Python に適用すると、予期しない結果が生じる可能性があります。
次のシナリオを考えてみましょう:
x = 'one two three' y = re.search("\btwo\b", x)
パターンが何かに一致する場合、y が一致オブジェクトになることが期待されます。ただし、y は None のままで、一致しないことを示します。
問題の理解
この予期しない動作の理由は、生の文字列の使用にあります。生の文字列 (r プレフィックス付き) を使用すると、エスケープ シーケンスやバックスラッシュなどの特殊文字を文字通りに解釈できます。生の文字列がないと、Python は をエスケープ文字として解釈し、b の本来の使用を妨げます。
この問題を修正するには、生の文字列を使用する必要があります。
x = 'one two three' y = re.search(r"\btwo\b", x)
この変更により, y は一致オブジェクトになり、意図した単語境界一致を正確に反映します。
追加ヒント
さらに、別のアプローチを使用して単語の境界を効果的に一致させることもできます:
Byこれらのテクニックを適用すると、Python の正規表現による単語境界マッチングを効果的に使用できます。
以上がPython の「re」モジュールは正規表現内の単語境界 (「\b」) を適切に処理しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。