PHP での正規表現の検証
検証はどこのウェブマスターにとっても共通の関心事です。誰かがフォームに情報を入力した場合は、それを確認する必要があります。しかし、これを行う最も簡単な方法は何でしょうか?
そうですね、従う必要がある大量のテキスト パターンを扱うときは、私は常に正規表現を利用します。正規表現はパターンを定義する方法です。 Regex については教えませんが、PHP の正規表現については説明します。 PHP は主に Perl の正規表現を使用します。これが、PHP の正規表現に対して関数 preg_match を実行する理由です。 Perl 正規表現マッチングを実行するにはどうすればよいですか?いずれにしても、PHP のパターンに追加してパフォーマンスに影響を与える特定の修飾子が存在します。たとえば、「i」では大文字と小文字が区別されません。大文字と小文字を区別する正規表現パターンを使用すると、読みやすさが低下するため、電子メール アドレス パターンを使用してこれを行う必要がありました。次に、複数行の件名、実際には複数のライナーを処理する「m」修飾子があります。それ以外の場合、それらは無視され、改行 (N) とアンカー (^ と $) はトピック全体の始まりと終わりを意味するとみなされます。 「S」は、^ で始まらず、一貫した開始文字がない正規表現パターンを頻繁に使用する場合に便利です。念のため、ユーザー名、パスワード、確認用パスワードが正しければ、英数字のみが使用可能だと思いました。したがって、潜在的なバグの可能性のあるすべての文字を検索するのではなく、文字ではない文字を検索します。これは、文字クラスの文字 ^ で表されます。 [:^A-ZA-Z0-9]。その後、一致するものがあれば、フィールドに無効な文字があることがわかります。また、正規表現ではエスケープする必要があるメタ文字があることにも注意してください。 preg_quote の電子メールと URL の値に対する私の提案は、特にこれらの標準を定義するのが難しいため、より困難です。たとえば、正規表現.info では、電子メールの正規表現についてかなり長い議論が行われています。技術的には、有効な電子メール アドレスには一重引用符を含めることができます。ほとんどの電子メール アドレスのリストは有効です。 URL には同様の質問が含まれています。トップレベル ドメインは多数あり、リストを作成するのは困難です。また、「http://software8.co」ではなく「software8.co」とだけ言う傾向もあります。 「google.co.uk」のように、トップレベル ドメインに国の値も含まれる場合もありますが、できるだけ多くを含めることはお勧めしません。全員に会おうとすると、検証に多くの時間を費やしてしまい、それはもはや不可能です。ユーザーが入力する内容に基づいてではなく、便宜的に入力された内容に基づいて、コード内のユーザー入力を検証します。さらに、正規表現はすべての問題を解決できるわけではありません (ただし、ほとんどの問題は解決できます)。例外が多いものや非常に複雑なものを検証したい場合、それは大変な作業になります。日付と時刻の形式を設定しようとすることさえ想像できません。正午ですか、それとも真夜中ですか? 12:60は有効ですか? 17時くらいでしょうか? AMとPMを入力する必要がありますか? 3 ということは両方とも 3:00 ということですか?こうしたことは人間に任せるか、あるいはあなたが考案できる他の方法に任せるのが最善です。
<?php $un = $_POST["user"]; $pw = $_POST["pass"]; $pw2 = $_POST["pass2"]; $em = $_POST["email"]; $url = $_POST["url"]; $info = array($un, $pw, $pw2, $em, $url); foreach ($info as $idx => $unit) { switch ($idx) { case 4: $rgx = "/^((ftp|http|https)://(w+:{0,1}w*@)?)?(S+)(:[0-9]+)?(/|/([w#!:.?+=&%@!-/]))?$/"; break; case 3: $rgx = "/^[A-Z0-9._%+-]+@[A-Z0-9.-]+.[A-Z]{2,4}$/i"; break; case 2: //read below $rgx = "/[^A-Za-z0-9]+/"; break; case 1: //read below $rgx = "/[^A-Za-z0-9]+/"; break; case 0: //if characters are NOT normal $rgx = "/[^A-Za-z0-9]+/"; break; default: echo "???"; die("$unit ?"); break; } $n = preg_match($rgx, $unit, $matches); if ( ($idx == 0) || ($idx == 1) || ($idx == 2) ){ if ($n) { echo "Bad Characters in $unit; Alphanumeric only<br />"; } } else { if ($n == 0) { echo "Incorrect Format in $unit; Enter Valid Info<br />"; } } } ?>