Perl は一般的な互換性のある正規表現関数であり、その一般的な形式は (preg_) であり、この記事では主にこれを紹介します。
規則的なルールを学ぶことは、1. 書き方のパターンを学ぶことに他なりません
2. 通常 + 機能 = 強力な文字処理機能。
まずは基本を理解しましょう。
1. アトムは、名前からわかるように、文字列の最小単位です。これには 2 つのタイプが含まれます:
①印刷可能文字とは、一般に特別な意味を持たない文字です。
②印刷できない文字、代表範囲:
d: 任意の 10 進数を表します
D: 数字以外の任意の文字を表します
s: 任意の空白文字を表します
S: 空白以外の文字を表します
w:a-zA-Z0-9
W: a-zA-Z0-9 を除く任意の文字
(ヒント: 通常、これらは唯一のものです。覚えるのは簡単です。それぞれに英語の略語があることを覚えておいてください (d はデジタルを表し、s はワードを表し、s はスペースを表します。意味も非常に明確です)。大文字は常に小文字と戦います)
2. カスタマイズされた原子テーブル ([])
[]文字クラス。アトムのいずれか 1 つに一致します。角括弧は 1 つの文字のみに一致します
反対の [^] は文字を除外し、角括弧内の文字も除外します
[-] は特定の範囲を表します。例: [a-z] は a から z までの任意の文字を表します
いくつかの一般的な文字について詳しく学びましょう。
1. 区切り文字 (通常の文字列ではなく、通常の文字列であることを確認するための記号) (| /...)
定義: 文字、数字、スラッシュ以外の記号は区切り記号であり、通常はバックスラッシュ (/) で表されます
次のような形状: /tm/
2. ピリオド文字 (.)
改行文字を除く任意の文字と一致します。
この効果をうまく説明できる質問は、s で始まり t で終わる単語をいくつか書くことです。
/^s**t$/ /^s*t/ ……
3. 修飾子 (?* + {n,m})
? : 前の文字と 0 回または 1 回一致します
+: 前の文字と 1 回以上一致します
* : 前の文字と 0 回以上一致します
{n}: 前の文字と n 回一致します
{n,}: 前の文字と少なくとも n 回一致します
{n,m}: 前の文字と少なくとも n 回、最大で m 回一致します
4. 文字 (|) を選択します
例: /cat|dog/ は猫または犬に一致します
5. 括弧文字 (())
() には多くの関数が含まれており、関数と併用することで生成される新しい関数も含まれます
1. 優先順位を上げます
2. 大きな原子として使用
3. サブモードとして使用します (1 は最初のサブモードを使用し、2 は 2 番目のモードを使用します...)
「\1」「1」