<p>
Web開発においてHTMLは避けては通れない部分です。ただし、場合によっては、HTML タグを含めずに HTML ソース コードからテキスト コンテンツを抽出する必要がある場合があります。ここで PHP 正規表現が登場します。 </p>
<p>この記事では、PHP 正規表現を使用して HTML タグを削除し、HTML 文字列からプレーン テキスト コンテンツを抽出する方法を学習します。
HTML タグを削除する方法を示すために、まず HTML タグを含む文字列を定義しましょう。 </p><div class="code" style="position:relative; padding:0px; margin:0px;"><pre class="brush:php;toolbar:false">$html_string = "<div><h1>Hello World</h1><p>This is <strong>PHP</strong>.</p></div>";</pre><div class="contentsignin">ログイン後にコピー</div></div><p>上記のコードは、標準の HTML タグを使用して文字列を定義します。私たちの目標は、すべての HTML マークアップを削除し、プレーン テキスト コンテンツのみを残すことです。 </p><p>PHP 正規表現関数 preg_replace() は、HTML タグを削除する最も簡単な方法の 1 つです。 preg_replace() 関数を使用して、文字列からすべての HTML タグを削除しましょう。 </p><p>次のコードは、preg_replace() 関数を使用して HTML タグを削除する方法を示しています。 </p><div class="code" style="position:relative; padding:0px; margin:0px;"><pre class="brush:php;toolbar:false">$plain_text = preg_replace('/<[^<]+>/', '', $html_string);
echo $plain_text;</pre><div class="contentsignin">ログイン後にコピー</div></div><p>上記のコードでは、正規表現パターンを使用して preg_replace() 関数を定義します。正規表現パターン `<code>/<[^<] >/</code>` は、「<code><</code>」で始まり「<code>>##」で終わるものを検索することを意味します。 #" 部分文字列を削除し、空の文字列に置き換えます。これにより、すべての HTML タグが削除されます。 </code></p>最後に、HTMLタグを含まない文字列を画面に出力します。 <p></p>preg_replace() 関数に加えて、HTML タグを削除するために使用できる関数が他にもたくさんあります。たとえば、strip_tags() 関数を使用して HTML タグを削除することもできます。 <p></p>strip_tags() 関数の構文は次のとおりです。 <p><div class="code" style="position:relative; padding:0px; margin:0px;"><pre class="brush:php;toolbar:false">$plain_text = strip_tags($html_string);
echo $plain_text;</pre><div class="contentsignin">ログイン後にコピー</div></div>上記のコードは、strip_tags() 関数を使用してすべてのタグを削除し、テキスト文字列を画面に出力します。 <p></p>要約すると、PHP の正規表現は、さまざまな文字列操作の処理に使用できる非常に強力なツールです。この記事では、preg_replace() 関数とstrip_tags() 関数を使用して HTML 文字列からプレーン テキスト コンテンツを抽出する方法を学びました。正規表現を使用すると、HTML タグを簡単に削除し、プレーン テキスト コンテンツを提供できます。 <p></p>
以上が通常のマッチングを使用してphpでhtmlタグを削除する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。