PHP 正規表示式：如何匹配 HTML 中的所有鏈接-php教程-PHP中文網

PHP 正規表示式：如何匹配 HTML 中的所有鏈接

王林

發布： 2023-06-22 14:08:01

原創

1398 人瀏覽過

在網頁開發中，我們經常需要處理 HTML 頁面中的連結。如何使用 PHP 正規表示式來匹配 HTML 頁面中的所有連結呢？下面我們就來了解一下。

HTML 頁面中的連結一般都是透過標籤來實現的，我們可以根據這個標籤來匹配連結。首先，我們需要透過 PHP 的 file_get_contents() 函數來取得 HTML 頁面的原始碼，例如：

$html = file_get_contents('http://www.example.com');

登入後複製

接著，我們可以使用正規表示式來符合所有的連結。下面是一個符合連結的簡單正規表示式：

$pattern = '/<a href="//m.sbmmt.com/link/d28a3097fa7cf63ad01c4f328314e2f2">//m.sbmmt.com/link/d28a3097fa7cf63ad01c4f328314e2f2</a>/';

登入後複製

正規表示式中，符合了一個以開頭，以 href 屬性為開頭的連結標籤。 href="//m.sbmmt.com/link/2b9bd744f7c0d06123d9d9557310fa80" 匹配了連結位址，括號表示這是一個捕獲組，意味著我們可以在後面使用 $matches 變數存取這個匹配結果。 >(.?) 匹配了連結文本，也是一個捕獲組。

接下來，我們可以使用preg_match_all() 函數將正規表示式應用到HTML 頁面原始程式碼中，從而匹配所有連結：

preg_match_all($pattern, $html, $matches);

登入後複製

該函數傳回一個陣列$matches，其中$ matches[0] 包含所有符合的連結的完整字串，$matches[1] 對應捕獲組1，即連結位址，$matches[2] 對應捕獲組2，即連結文字。

最後，我們可以循環遍歷$matches[1] 數組，也就是連結位址數組，來取得所有連結的位址：

foreach ($matches[1] as $link) {
    echo $link . "
";
}

登入後複製

完整程式碼如下：

$html = file_get_contents('http://www.example.com');
$pattern = '/<a href="//m.sbmmt.com/link/d28a3097fa7cf63ad01c4f328314e2f2">//m.sbmmt.com/link/d28a3097fa7cf63ad01c4f328314e2f2</a>/';
preg_match_all($pattern, $html, $matches);

foreach ($matches[1] as $link) {
    echo $link . "
";
}

登入後複製

注意，這個正規表示式只能符合基本的連結格式，例如：

<a href="http://www.example.com">Example</a>

登入後複製

如果連結中含有其他屬性或是標籤格式不符合基本要求，則無法匹配。在實際應用中，可以根據需要修改正規表示式，以適應不同的連結格式。

總結來說，使用PHP 正規表示式來匹配HTML 頁面中的連結可以使用file_get_contents() 函數取得頁面原始碼，然後使用preg_match_all() 函數和適當的正規表示式來完成匹配，最後一個循環訪問匹配結果即可。

以上是PHP 正規表示式：如何匹配 HTML 中的所有鏈接的詳細內容。更多資訊請關注PHP中文網其他相關文章！