正規表現と平衡括弧: 難しい一致
正規表現は強力なツールですが、完全にバランスの取れた括弧を一致させるには大きなハードルがあります。基本的な正規表現は単純なケースを処理できますが、複雑な入れ子構造にはより高度なテクニックが必要です。 この課題と、高度な正規表現機能を使用した解決策を見てみましょう。
次の最初の試みを考えてみましょう:
<code>func([a-zA-Z_][a-zA-Z0-9_]*)\(.*\)</code>
この正規表現は関数呼び出しと一致することを目的としていますが、バランスの取れた括弧のみを正確に識別できません。 適切なネストに関係なく、見つかったすべての括弧がキャプチャされます。
この制限を克服するには、非キャプチャ グループ、先読みアサーション、ルックアラウンドなどの機能を活用する必要があります。 これらにより、コンテキストに基づいた条件付き一致とパターン検証が可能になります。
洗練された正規表現ソリューション:
<code>func([a-zA-Z_][a-zA-Z0-9_]*) # Function name \( # Opening parenthesis (?: # Non-capturing group [^()] # Match any character except parentheses | (?<open> \( ) # Match opening parenthesis, add to 'open' stack | (?<-open> \) ) # Match closing parenthesis, remove from 'open' stack )+ (?(open)(?!)) # Fails if 'open' stack is not empty \) # Closing parenthesis</code>
この改良された式では、バランシング グループ メカニズムが使用されています。 (?<open> ( )
および (?<-open> ) )
コンストラクトはスタックを管理します。 各開き括弧はスタックに追加し、各閉じ括弧はスタックを 1 つ削除します。 最後の (?(open)(?!))
アサーションは、最後にスタックが空でない場合に一致が失敗することを保証し、括弧のバランスを保証します。 このアプローチは、ネストされた構造を効果的に処理します。
したがって、高度な正規表現機能を戦略的に採用することで、バランスの取れた括弧構造を正確に識別して照合できる式を構築できます。
以上が正規表現はバランスの取れた括弧と確実に一致しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。