JavaScript 正規表現内の非 ASCII 文字と単語境界の一致
JavaScript では、単語境界 (b) 一致を持つ RegExp オブジェクトが発生する可能性があります。フィンランド語の母音 (ä、ö、および å) などの非 ASCII 文字を処理する場合の制限。これらの文字を正確に一致させるには、アプローチを調整する必要があります。
次のコードを考えてみましょう:
<code class="javascript">var title = "this is simple string with finnish word tämä on ääkköstesti älkää ihmetelkö"; var searchterm = "äl"; if (new RegExp("\b" + searchterm, "gi").test(title)) { // This does not work for "äl" }</code>
このコードは、b 境界を使用してタイトル内の用語「äl」と一致しようとします。 。ただし、 b は非 ASCII 文字を除き、標準の 256 バイト範囲に基づいて単語境界と一致するため、失敗します。
解決策: 単語境界を持つ非キャプチャ グループ
この問題を解決するには、 b を、文字列の先頭または空白文字のいずれかに明示的に一致する非キャプチャ グループに置き換えます:
<code class="javascript">if (new RegExp("(?:^|\s)" + searchterm, "gi").test(title)) { // Now it works for "äl" }</code>
内訳:
この変更されたコードは、非 ASCII 文字を含むより柔軟な語頭境界条件を定義しているため、タイトルの用語「äl」と一致します。
以上が非 ASCII 文字を JavaScript Regex の単語境界と一致させるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。