PHP 初心者にとって正規表現は、時間の経過とともにさまざまなシンボルの機能を忘れてしまう傾向にあります。しかし体系的にまとめれば、暗記の難しさはそれほど難しくないことがわかるでしょう。
Perl は一般的な互換性のある正規表現関数であり、一般的な形式は (preg_) であり、この記事では主にこれを紹介します。
規則性を学ぶことは、 1. パターンの書き方
2. 規則性 + 関数 = 強力な文字処理機能を学ぶことに他なりません。
まずは基本を理解しましょう。
1. アトムは、名前からわかるように、文字列の最小単位です。これには 2 つのタイプが含まれます:
①印刷可能な文字は、一般に特別な意味を持たない文字です。
②印刷不可能な文字、代表範囲:
d: 任意の10進数を表す
D: 数字以外の任意の文字を表す
s: 任意の空白文字を表す
S: 空白以外の任意の文字を表す
w: a -zA-Z0 -9
W: a-zA-Z0-9
を除く任意の文字 (ヒント: 通常はこれらのみです。各文字の英語の略語を覚えていれば簡単に覚えられます (d はデジタル、s は単語です) 、s はスペースであり、意味も非常に明確です)、大文字のものは常に小文字のものと競合します)
2. カスタマイズされたアトム テーブル ([])
[] 文字クラス、一致アトムの場合、角括弧は 1 つの文字にのみ一致します
逆に、[^] は文字を除外し、角括弧内の任意の文字も除外します
[-] は特定の範囲を表します。たとえば、[a-z] は a から z までの任意の文字を表します
いくつかの一般的な文字について詳しく学びましょう。
1. 区切り記号 (通常の文字列ではなく通常の文字列であるかどうかを決定する記号) (| /...)
定義: 文字、数字、スラッシュ以外の記号は次のとおりです。通常、/tm/
のようにバックスラッシュ (/)
で表されます。 2. ピリオド文字 (.)
は、改行文字を除く任意の文字と一致します。
s で始まり t で終わるいくつかの単語を質問で説明できます。
/^s**t$/ /^s*t/ ......
3. 修飾子 (?* + {n,m})
? : 前の文字と 0 回または 1 回一致します
+ : 前の文字と 1 回以上一致します
* : 前の文字と 0 回以上一致します
{n} : 前の文字と n 回一致します
{n,} : 前の文字と一致します前の文字と少なくとも n 回一致します
{n,m}: 前の文字と少なくとも n 回、最大で m 回一致します
4. 文字 (|) を選択します
例: /cat|dog/ は猫または犬と一致します
5 . 括弧文字 (())
() 関数と組み合わせて使用すると新しい関数が生成されるなど、多くの関数があります
1. 優先度を高くします
2. 大きなアトムとして使用します
3. 最もサブモードとして使用します(1 は最初のサブモードを取得し、2 は 2 番目のパターンを取得します...)
"\1" '1'