> 백엔드 개발 > PHP 튜토리얼 > php怎么抓取网页中的数据

php怎么抓取网页中的数据

WBOY
풀어 주다: 2016-06-13 10:06:12
원래의
995명이 탐색했습니다.

php如何抓取网页中的数据?
比如,一个网站上有关于人名,地址,电话号码,掌握的语言等数据.
我想用程序去抓取 语言掌握情况 这类信息,但是掌握的语言不止一种,可能是两种、三种!并把它们存起来.  
 
请问各位高手,如何用PHP实现这一功能呢?最好直接给个代码看看!。

------解决方案--------------------
可用curl 或 file_get_contents
会读取目标网站的html代码 然后你要自己根据他的代码来写正则提取出你想要的
没有具体的网页不太好给例子
------解决方案--------------------
curl+正则
------解决方案--------------------
我记得你,之前问过火车头的。其实这段代码火车头可以截取的,当然,你利用crul+正则也可以,正则的参考4楼就可以了,不过好像------解决方案--------------------
用字符串截取
------解决方案--------------------
写正则!
------解决方案--------------------
curl取数据,htmldom解析
------解决方案--------------------

探讨

可不可以给个具体点儿的啊!说的这么简单,还是不明白!对php这方面基本上是一窍不通啊‘
能不能把用到的关于curl的代码写给俺看看!不胜感激!!!!!!!!!!
还有这个curl+正则可以直接用到火车头采集器的接口插件中把?

------解决方案--------------------
CURL,百度一下,资料用法很多,正则就和PHP没傻关系了,任何语言都有!
我建议楼主可以自己多研究下,自己研究获得的东西一辈子都受用,而且还能提高自我解决问题的能力,如果在实际操作中遇到什么代码故障,再发帖出来讨论,这样更符合一个学者的精神!仅供参考,我多嘴了。呵呵!
------解决方案--------------------
curl+正则
------解决方案--------------------
读取远程的url
然后用正则匹配
得到结果
你可以存到数据库,或者文件中
------解决方案--------------------
给你说思路了,你就要研究下去
上面已经给你说的很具体了!
研究下吧
------解决方案--------------------
一般都是Curl+正则,目前我在用java的一个开源的程序,楼主可以参考。
我的blog有关于这个使用的,是抓取火影忍者漫画的。
http://web-harvest.sourceforge.net/index.php
관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿