PHP에서 기사의 텍스트 콘텐츠만 가져오는 방법: 1. PHP 샘플 파일을 만듭니다. 2. "curl_request ( $url , $post = '' , $cookie = '' , $returnCookie = 0 함수를 정의합니다. ) {.. .}" 메서드는 웹페이지의 텍스트 콘텐츠만 캡처하고 해당 태그를 필터링할 수 있습니다.
이 튜토리얼의 운영 환경: Windows 7 시스템, PHP 버전 8.1, Dell G3 컴퓨터.
PHP에서 기사의 텍스트 내용만 가져오는 방법은 무엇입니까?
php는 웹페이지 본문의 텍스트 콘텐츠만 가져와 웹페이지 태그를 필터링합니다.
php는 웹페이지의 텍스트 콘텐츠만 가져와 해당 태그를 필터링합니다. 그냥 하고 시작하세요!
코드는 다음과 같습니다.
<?php function curl_request ( $url , $post = '' , $cookie = '' , $returnCookie = 0 ) { $ua = $ua==''?$_SERVER ['HTTP_USER_AGENT']:'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E; LBBROWSER)' ; $curl = curl_init ( ) ; curl_setopt ( $curl , CURLOPT_URL , $url ) ; curl_setopt ( $curl , CURLOPT_USERAGENT , $ua ) ; curl_setopt ( $curl , CURLOPT_FOLLOWLOCATION , 1 ) ; curl_setopt ( $curl , CURLOPT_AUTOREFERER , 1 ) ; curl_setopt ( $curl , CURLOPT_REFERER , "https://www.baidu.com" ) ; if ( $post ) { curl_setopt ( $curl , CURLOPT_POST , 1 ) ; curl_setopt ( $curl , CURLOPT_POSTFIELDS , http_build_query ( $post ) ) ; } if ( $cookie ) { curl_setopt ( $curl , CURLOPT_COOKIE , $cookie ) ; } curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false); curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false); curl_setopt ( $curl , CURLOPT_HEADER , $returnCookie ) ; curl_setopt ( $curl , CURLOPT_TIMEOUT , 10 ) ; curl_setopt ( $curl , CURLOPT_RETURNTRANSFER , 1 ) ; $data = curl_exec ( $curl ) ; if ( curl_errno ( $curl ) ) { return curl_error ( $curl ) ; } curl_close ( $curl ) ; if ( $returnCookie ) { list ( $header , $body ) = explode ( "\r\n\r\n" , $data , 2 ) ; preg_match_all ( "/Set\-Cookie:([^;]*);/" , $header , $matches ) ; $info [ 'cookie' ] = substr ( $matches [ 1 ] [ 0 ] , 1 ) ; $info [ 'content' ] = $body ; return $info ; } else { //return $data ; $data=mb_convert_encoding($data, 'UTF-8', 'UTF-8,GBK,GB2312,BIG5'); preg_match("/<body.*?>(.*?)<\/body>/is",$data,$match); $str= trim($match[1]); $html = strip_tags($str); $html_len = mb_strlen($html,'UTF-8'); $html = mb_substr($html, 0, strlen($html), 'UTF-8'); $search = array(" "," ","\n","\r","\t"); $replace = array("","","","",""); echo str_replace($search, $replace, $html); } } curl_request ( $url, $post = '' , $cookie = '' , $returnCookie = 0 ); ?>
추천 학습: "PHP Video Tutorial"
위 내용은 PHP에서 기사의 텍스트 내용만 얻는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!