PHP 正規表現アプリケーションノート-PHPチュートリアル-php.cn

PHP 正規表現の使用上の注意

PHP 正規表現の使い方の詳しい説明

オペレーター説明
??? エスケープ文字
??? ()、(?:)、(?=)、[] 括弧と角括弧

??? *、+、?、{n}、{n,}、{n,m} 予選
??? ^、$、任意のメタ文字位置と順序
??? | 「」または」オペレーション
??? すべての記号の説明
??? キャラクター説明
??? は、次の文字を特殊文字、リテラル文字、またはとしてマークします。後方参照、または 8 進数のエスケープ文字。たとえば、「ん」キャラクターに一致「ん」。「ん」は改行文字と一致します。シーケンス '\' 一致 "" と "(" はと一致します "(" 。

???^ 入力文字列の先頭と一致します。が設定されている場合正規表現オブジェクト複数行プロパティ、 ^ こちらも一致します 'n' または 'r' の後の位置。

???$ 入力文字列の終了位置と一致します。が設定されている場合正規表現オブジェクト複数行プロパティ、 $ こちらも一致します 'n' または 'r' 前の場所。

??? * 直前の部分式と 0 回以上一致します。たとえば、ぞ* 一致する可能性があります「ズ」と「動物園」。 * はと同等です {0,} 。

???+ 直前の部分式と 1 回以上一致します。たとえば、「zo+」一致する可能性があります「ぞ」と「動物園」ですが、とは一致しません「ズ」。 + はと同等です {1,} 。

? 直前の部分式と 0 回または 1 回一致します。たとえば、「しますか?」一致する可能性があります「する」または「する」の「する」。 ? はと同等です {0,1} 。

??? {n} n は負ではない整数です。確かに一致しますと回。たとえば、 'o{2}' 一致しません「ボブ」の 'o' ただし、と一致する可能性があります「食べ物」の 2 つお。

??? {n,} n は負ではない整数です。少なくともと一致します n 回。たとえば、 'o{2,}' 一致しません「ボブ」の 'o' ただし、と一致する可能性があります「すごい」内のすべてのお。 'o{1,}' はと同等です 'o+' 。 'o{0,}' はと同等です 'o*' 。

??? {n,m} m ととはすべて負ではない整数です。 n 。最小一致と回、最大でと一致しましたも回。たとえば、「お{1,3}」はと一致します「すごい」の最初の 3 つのお。 'o{0,1}' はと同等です「え？」。カンマと 2 つの数字の間にスペースを入れることはできないことに注意してください。

? この文字の直後に他の修飾子が続く場合 (*, +, ?, {n}, {n,}, {n,m}) フォローすると、一致するパターンは貪欲ではありません。非貪欲モードは検索文字列の可能な限り少ない部分と一致しますが、デフォルトの貪欲モードは検索文字列の可能な限り多くの部分と一致します。たとえば、文字列の場合「おおお」、 'o+?' は単一のと一致します。「お」、および 'o+' はすべてのに一致します 'o' 。

??? 以外の一致「ん」を除く任意の 1 文字。一致するにはを含めます 'n' を含む文字はのように使用してください '[.n]' モード。

???(パターン) 一致パターンそしてこの試合を手に入れましょう。取得した一致はから生成できます。一致で集めて手に入れましょう VBScript でを使用しますサブマッチに集合 JScript でを使用します $0…$9 プロパティ。括弧文字と一致させるには、を使用します。 '(' または ')' 。

??? (?:パターン) 一致パターンしかし、マッチング結果が得られないため、非取得マッチングとなり、は実行されません。ストレージ将来の使用のために。これはを使用しています " または " キャラクター (|) パターンの一部を組み合わせるのに便利です。たとえば、 'industr(?:y|ies) あくまで比較です '業界|業界' よりシンプルな表現。

??? (?=パターン) 任意の一致に対する前方参照パターン文字列の先頭にある検索文字列と一致します。これは非フェッチ一致です。つまり、後で使用するために一致をフェッチする必要はありません。たとえば、 'Windows (?=95|98|NT|2000)' 一致する可能性があります「Windows 2000」の「Windows」ですが、とは一致しません「Windows 3.1」の「Windows」。プリフェッチでは文字は消費されません。つまり、一致が発生した後、次の一致の検索は、プリフェッチを含む文字の後に開始されるのではなく、最後の一致の直後に開始されます。

??? (?!パターン) 不一致に対する否定的な先読みパターン文字列の先頭にある検索文字列と一致します。これは非フェッチ一致です。つまり、後で使用するために一致をフェッチする必要はありません。たとえば 'Windows (?!95|98|NT|2000)' 一致する可能性があります「Windows 3.1」の「Windows」ですが、とは一致しません「Windows 2000」の「Windows」。プリフェッチは文字を消費しません。つまり、一致が発生した後、次の一致の検索は、プリフェッチを含む文字の後に開始されるのではなく、最後の一致の直後に開始されます。

???x|y 一致 × またはや。たとえば、 'z|食べ物' 一致する可能性があります「ズ」または「食べ物」。 '(z|f)ood' はと一致します「動物園」または「食べ物」。

???[xyz] キャラクターコレクション。含まれている文字のいずれかと一致します。たとえば、 '[abc]' 一致する可能性があります「プレーン」の「あ」。

???[^xyz] 負の値の文字のコレクション。含まれていない任意の文字と一致します。たとえば、 '[^abc]' 一致する可能性があります「プレーン」の「ぷっ」。

???[a-z] 文字範囲。指定された範囲内の任意の文字と一致します。たとえば、 '[a-z]' 一致する可能性があります「あ」へ 'z' の範囲内の任意の小文字の英字。

???[^a-z] 負の文字範囲。指定された範囲内にない任意の文字と一致します。たとえば、 '[^a-z]' は以外のものと一致します「あ」へ 'z' の範囲内の任意の文字。

??? b 単語とスペースの間の位置を指す単語境界に一致します。たとえば、「アーブ」一致する可能性があります「決して」の「えー」ですが、とは一致しません「動詞」の「えー」。

???B 単語以外の境界と一致します。 'erB' 一致する可能性があります「動詞」の「えー」ですが、とは一致しません「決して」の「えー」。

???cx はによって一致します × で指定された制御文字。たとえば、 cm 1 つと一致します Control-M または復帰文字。 x の値はである必要があります A ～ Z または a-z 1 つ。それ以外の場合は c リテラルとして扱われます 'c' キャラクター。

???d 数字と一致します。に相当 [0-9] 。

???D 数字以外の文字と一致します。に相当 [^0-9] 。

???f はフォームフィードに一致します。に相当 x0c と cL 。

???n は改行文字と一致します。に相当 x0a と cJ 。

???r は復帰文字と一致します。に相当 x0d と cm 。

? スペース、タブ、フォームフィードなどを含む任意の空白文字と一致します。に相当 [fnrtv] 。

???S は空白以外の任意の文字に一致します。に相当 [^ fnrtv] 。

???t はタブ文字と一致します。に相当 x09 と cI 。

???v 垂直タブ文字と一致します。に相当 x0b と CK 。

???w アンダースコアを含む任意の単語文字と一致します。に相当 '[A-Za-z0-9_]' 。

???W 単語以外の文字と一致します。に相当 '[^A-Za-z0-9_]' 。

???xn 一致ん、ここでとは 16 進数のエスケープ値です。 16 進数のエスケープ値は、正確に 2 桁の長さである必要があります。たとえば、 'x41' 一致「あ」。 'x041' はと同等です 'x04' & "1" 。正規表現ではを使用できますアスキーエンコーディング。 .
???番号一致番号、ここで番号は正の整数です。取得した一致への参照。たとえば、 '(.)1' 連続する 2 つの同一の文字と一致します。

???n 8 進エスケープ値または後方参照を識別します。の場合と少なくとも以前とで部分式を取得し、次にとは後方参照です。それ以外の場合、とは 8 進数です (0-7) 、次にとは 8 進数のエスケープ値です。

???んん 8 進エスケープ値または後方参照を識別します。の場合んん以前には少なくともがありましたんんは部分式を取得し、次にんんは後方参照です。の場合んん以前には少なくともがありましたとを取得し、次にとの後にはというテキストが続きますもの後方参照。前述の条件がいずれも満たされない場合、とともすべて 8 進数です (0-7) 、次にんん 8 進エスケープ値と一致しますんん。

???nml 場合とは 8 進数です (0-3) 、およびもと l すべて 8 進数です (0-7) 、8 進エスケープ値と一致します。 nml 。

???アン一致ん、ここでとは 4 桁の 16 進数で表されるですユニコードキャラクター。たとえば、 u00A9 著作権記号と一致します (?) 。

???VBScript 内で正規表現を使用する方法:

???関数 gfCheck(obj)

??? dim strCheck ' チェックする文字列
??? 薄暗いオブジェクト ' 正規表現オブジェクト
??? 薄暗い strRtn ' 正規表現の判定結果
??? strCheck = obj.value
??? set objRE = 新しい正規表現
??? objRE.Pattern = "^[A-Za-z0-9]{13}$" '13 英語の文字と数字の数字列
??? gfCheck = objRE.Test(strCheck) ' が正規表現に一致する場合、を返します。本当、そうでない場合はを返します偽
???objRE = 何も設定しない
??? 関数を終了します
??? 一般的に使用される正規表現
???1 、負でない整数: ”^d+$”

???2 、正の整数: ”^[0-9]*[1-9][0-9]*$”

???3 、正でない整数: ”^((-d+)|(0+))$”

???4 、負の整数: ”^-[0-9]*[1-9][0-9]*$”

???5 、整数: ”^-?d+$”

???6 、非負の浮動小数点数: ”^d+(.d+)?$”

???7 、正の浮動小数点数: ”^((0-9)+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]* .[0-9]+)|([0-9]*[1-9][0-9]*))$”

???8 、非正の浮動小数点数: ”^((-d+.d+)?)|(0+(.0+)?))$”

???9 、負の浮動小数点数: "^(-((( 正の浮動小数点数正規表現 )))$”

??? 10 、英語の文字列： ”^[A-Za-z]+$”

???11 、英語の大文字文字列： ”^[A-Z]+$”

???12 、英語の小文字文字列： ”^[a-z]+$”

???13 、英文字と数字の文字列： ”^[A-Za-z0-9]+$”

???14 、英数字と下線付きの文字列： ”^w+$”

???15 、電子メール住所： ”^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$”

??? 16 、 URL ： ”^[a-zA-Z]+://(w+(-w+)*)(.(w+(-w+)*))*(?s*)?$”

????17. 空白行: ns*r

1: 一致YYYY-MM-DD (([0-9]{3}[1-9]|[0-9]{2}[1-9][0-9]{1}|[0-9]{1}[1-9 ][0-9]{2}|[1-9][0-9]{3})-(((0[13578]|1[02])-(0[1-9]|[12] [0-9]|3[01]))|((0[469]|11)-(0[1-9]|[12][0-9]|30))|(02-(0[ 1-9]|[1][0-9]|2[0-8]))))|((([0-9]{2})(0[48]|[2468][048]| [13579][26])|((0[48]|[2468][048]|[3579][26])00))-02-29)

2 : DD/MM/YYYY に一致しますまたは D/M/YYYY と一致します

'/^(([0-9]{3}[1-9]|[0-9]{2}[1-9][0-9]{1}|'
??? ??? ??? |[1 -9][0-9]{3})/((([13578]|1[2])|(0[13578]|1[02])'
??? ??? ??? ??? 01]) |([1-9]|[12][0-9]|3[1])))|(((0[469]|11)|([469]|11))'
??? ??? ??? .'/(0[12][0-9]) |([ 1-9]|[12][0-9]|30)))|'
??? ??? ??? .'(0[1-9] -9] |2[0-8])|([1-9]|[1][0-9]|2[0-8]))'
??? ??? ??? .'))|(([0-9] ]|[ 2468][048]|[13579][26])|([48]|[2468][048]|[13579][26]))|'
??? ??? ??? .'((([48])) 048]| [3579][26])00))/(02|2)/29)$/';

3. 全幅を確認

$strCheckPatten = “/^[^x00-xff]+$/” ;

$input = “ 全角” ;

if(preg_match($strCheckPatten,$input) == 0){
??? 戻り値 false;
}
それ以外{
??? ??? true を返します;
}

=========================================== == =============================================== == =

JS での中国語の正規表現のマッチング [u4e00-u9fa5]
JS のドメイン名の中間部分 var patt = /^[a-zA-Z0-9u4e00-u9fa5]+(-[a-zA-Z0-9u4e00-u9fa5]+)*$/i;
url : var patt = /^([a-zA-z]+://)?([a-zA-Z0-9u4e00-u9fa5]+(-[a-zA-Z0-9u4e00-u9fa5]+)*)(.([ a-zA-Z0-9u4e00-u9fa5]+(-[a-zA-Z0-9u4e00-u9fa5]+)*))*(?S*)?$/i;
1. PHP の UTF-8 エンコーディングで正規表現を使用して中国語の文字と一致する最終的な正しい表現 -/^[x{4e00}-x{9fa5}]+$/u
2. PHP の GB2312 エンコーディングで中国語の文字と一致する正規表現を使用した最終的な正しい表現 -
  ? "/^[".chr(0xa1)."-".chr(0xff)."]+$/"または"/^[xa1-xff]+$/"または"/^[ x{a1}-x{ff}]+$/" ?
3. PHP の GB2312 に一致する URL
  $pattern =? ."/^([a-zA-z]+://)?"
  ???????."([a-zA-Z0-9".chr(0xa1)."-".chr(0xff)."]+(-[a-zA-Z0-9".chr(0xa1) )."-".chr(0xff)."]+)*)"
  ???????."(.([a-zA-Z0-9".chr(0xa1)."-".chr(0xff)."]+(-[a-zA-Z0-9".chr (0xa1)."-".chr(0xff)."]+)*))*"
  ???????."(?S*)?$/i";
  
  ? 4.正規表現の文字列または PHP の通常の "" は左から右にエスケープされます
  
  例: echo "\n"; Output "n";?? echo "\"" はエラーを報告します
  
  ?
  
  ?
  
  不適切または間違った言語表現がある場合は、修正してください。

PHP 正規表現アプリケーション ノート

PHP 正規表現アプリケーションノート