> 백엔드 개발 > PHP 튜토리얼 > 急问关于新闻采集的有关问题,难道现在新浪搜狐腾讯新闻都不让采集了

急问关于新闻采集的有关问题,难道现在新浪搜狐腾讯新闻都不让采集了

WBOY
풀어 주다: 2016-06-13 13:01:35
원래의
906명이 탐색했습니다.

急问关于新闻采集的问题,难道现在新浪搜狐腾讯新闻都不让采集了 ?
随便找一个新浪的页面进行采集,发现title部分能够获取,但正文部分(通过查看页面源码)不能获取,不知道为何?

function contents($preg,$con,$num=1) {
    
    preg_match($preg,$con,$arr);

        return $arr[$num];
}

$con=file_get_contents("http://mil.news.sina.com.cn/2012-12-14/1646709659.html");
$preg="#

(.*)#";     
echo  contents($preg,$con);  //获取title  ok的

//但获取正文部分不能,啥也没有返回,其中是页面正文的开头
//                                 是页面正文结束

echo contents("#(.*) #iUs",$con);
//这里返回为空


?>
------解决方案--------------------
为什么我这边正常返回正文~~~~~

想知道如果想采集新浪当天的新闻~~应该怎么样对URL处理



美国海军最后一架F-35C试验机完成试飞 
------解决方案--------------------
试验机
------解决方案--------------------
美国海军
------解决方案--------------------
弹射起飞_新浪军事 
  中新网12月14日电 据中国国防科技信息网报道,12月11日,编号为CF-5的美国海军F-35C“闪电Ⅱ”试验机在美国德克萨斯州福特沃斯试飞成功,该飞机是帕图森河海军航空站集成测试部队的最后一架F-35C试验机,试验机的主要作用是用来验证飞机和军舰的适配性以及进行大攻角测试。

  F-35C“闪电Ⅱ”战斗机与F-35A和F-35B有很大不同,该机拥有更大的翼面和增强型着陆装置,这使得飞机能够承受在航母上弹射起飞和在甲板降落时的影响。

  在正式交付舰队之前,F-35C一直在帕图森河海军航空站接受飞行测试和相关评估。(中国船舶工业综合技术经济研究院 宋磊)

   
관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿