> 백엔드 개발 > PHP 튜토리얼 > PHP 하이퍼링크 크롤링 구현 코드란 무엇입니까?

PHP 하이퍼링크 크롤링 구현 코드란 무엇입니까?

WBOY
풀어 주다: 2016-07-29 08:40:11
원래의
1253명이 탐색했습니다.

일반적인 HTML 표준 하이퍼링크 매개변수를 얻기 위한 정규식 테스트
최근에 전문 검색 엔진과 유사한 것을 구축하고 싶기 때문에 웹 페이지의 모든 하이퍼링크를 크롤링해야 합니다.
다음 코드가 모든 표준 하이퍼링크를 대상으로 할 수 있는지 테스트하는 데 도움을 주세요.
테스트 코드는 다음과 같습니다.

코드 복사 코드는 다음과 같습니다.


// -- ------------------------------- ------ ----------
// 파일명: Noname1.php
// 설명: 유니버설 링크 매개변수 획득 정규식 테스트
// 요구 사항: PHP4 (http://www.php.net)
// Copyright(C), HonestQiao, 2005, All Rights Reserved
// 작성자: HonestQiao ( 정직qiao@hotmail.com)
// 매개변수 설명:
// $strSource: 표준 링크가 포함된 HTML 웹페이지
// $strResult: 결과 처리
// 추가 지침:
// 표준 링크, 포함된 링크
// 사용 ----------------- -- ----------------
$strSource = <t1
t2 href= "3.htm">t3
/a>
preg_match_all('/( ? )/sim', $strSource, $strResult, PREG_PATTERN_ORDER)
for($i = 0; $i < count($strResult[1]); )
{
printf("%d href=(%s) title=(%s) n", $i, $strResult[1][$i], $strResult[2][$i] );
}
?>


테스트 데이터가 표준 링크를 준수하지만 여기서 처리되지 않는 경우 테스트 데이터와 테스트 환경을 알려주십시오.

감사합니다.
위 내용은 하이퍼링크란 무엇인지를 포함하여 PHP 하이퍼링크 크롤링 구현 코드를 소개하고 있으며, PHP 튜토리얼에 관심이 있는 친구들에게 도움이 되기를 바랍니다.

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿