ホームページ > バックエンド開発 > C++ > 正規表現を使用してペルシア語文字を正確に検証するにはどうすればよいですか?

正規表現を使用してペルシア語文字を正確に検証するにはどうすればよいですか?

Susan Sarandon
リリース: 2025-01-04 04:36:40
オリジナル
966 人が閲覧しました

How Can I Accurately Validate Persian Characters Using Regex?

正規表現を使用したペルシア語文字の検証

問題:

正規表現パターン、提供されたコード^[u0600-u06FF] $ には、گ、چ、پ、ژ などの特定の文字が含まれない場合があります。

回答:

ペルシア語文字を正確に検証するには、次の文字の使用を検討してください。セット:

文字:

  • ^[آابپتثجچحخدذرزژسشصضطظعغفقکگلمنوهی] $
  • または同等の Unicode コードポイント:
^[\u0622\u0627\u0628\u067E\u062A-\u062C\u0686\u062D-\u0632\u0698\u0633-\u063A\u0641\u0642\u06A9\u06AF\u0644-\u0648\u06CC]+$
ログイン後にコピー

数値:

  • ^[۰۱۲۳۴۵۶۷۸۹] $
  • または同等のものUnicode コードポイント:
^[\u06F0-\u06F9]+$
ログイン後にコピー

母音:

  • [ ٌ ًّ َ ِ ُ ْ ]
  • または同等の Unicode codepoints:
[\u202C\u064B\u064C\u064E-\u0652]
ログイン後にコピー

ペルシア語入力のさまざまな側面に一致させるために、必要に応じてこれらの文字セットを組み合わせます。たとえば、文字のみの場合:

^[آابپتثجچحخدذرزژسشصضطظعغفقکگلمنوهی]+$
ログイン後にコピー

以前のパターンが失敗した理由:

^[u0600-u06FF] $ は包括的であるように見えますが、含まれていないさまざまな文字が含まれています。ペルシア語で数字や発音記号などに使用されます。同様に、[آ-ی] はペルシア語に固有ではない追加の文字をカバーします。

以上が正規表現を使用してペルシア語文字を正確に検証するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート