• 技术文章 >后端开发 >php教程

    可否帮忙写一个单页页的PHP采集程序,并附上实例,该怎么解决

    2016-06-13 10:28:12原创486
    可否帮忙写一个单页页的PHP采集程序,并附上实例
    比方说,我要采集这个页面:http://news.163.com/12/0613/20/83TJ7PA700014JB6.html

    要求:
    采集标题
    采集正文

    谢谢!

    ------解决方案--------------------
    首先去http://simplehtmldom.sourceforge.net/index.htm(点击Download latest version form Sourceforge.)下载一个simple_html_dom.php,傻瓜式的正则,另官网上有详细教程,很容易看懂。

    PHP code
    header("Content-type: text/html; charset=gb2312");require dirname(__FILE__) . '/simple_html_dom.php';$ch = curl_init();curl_setopt($ch, CURLOPT_URL, 'http://news.163.com/12/0613/20/83TJ7PA700014JB6.html');curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5');$htmls = curl_exec($ch);curl_close($ch);$html = str_get_html($htmls);foreach($html->find('#h1title') as $title){        echo strip_tags($title).'
    ';//标题}foreach($html->find('#endText') as $content){ echo strip_tags($content);//正文}
    ------解决方案--------------------
    PHP获取QQ邮箱好友列表的方法:
    ------解决方案--------------------
    用抓取页面就可以,标题的话就是title标签之间的,正文是body之间的,用正则去掉一些不需要的内容
    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。
    专题推荐:html curl title Content CURLOPT
    Web大前端开发直播班

    相关文章推荐

    • PHP验证信用卡卡号是否正确函数_PHP• php微信公众平台开发类实例_PHP• PHP、Java des加密解密实例_PHP• php中session与cookie的比较_PHP• WampServer下安装多个版本的PHP、mysql、apache图文教程_PHP
    1/1

    PHP中文网