文章专题学习下载问答编程词典手游最近更新

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

首页 > 后端开发 > php教程 > 正文

抓取url和网页内容

WBOY

发布： 2016-06-23 14:38:32

原创

816 人浏览过

由于技术不够，整天在逛论坛。看到许多关于抓取网页内容（file_get_contents）和抓取url（这个不知道用什么）对这个听感兴趣。望大神指点下这是怎么回事？最好能帮我整个源码嘎嘎。叫我参考下。

回复讨论(解决方案)

自己百度先吧

我用 php socket 和 curl写过真实的例子，至于 file_get_contents更简单了，原理都一样，你看以看看
不足之处请指点，
http://blog.csdn.net/zkg510168343/article/details/12996699
http://blog.csdn.net/zkg510168343/article/details/16983161

curl
手册里有例子，必须要看手册阿

百度一下，可以找到很多的。

百度 php 采集

baidu下 file_get_contents()和curl 抓取采集

$url='http://www.iheima.com/';
$con=file_get_contents($url);
if ($con){

preg_match_all('/

(.+).*
(.+)/isU', $con, $temp,PREG_SET_ORDER);
foreach ($temp as $key=> $v){
$title=$v[2];
$v_url=$v[1];
$des=$v[3];
$con_url=file_get_contents($v_url);
if ($con_url){
$tags='';
preg_match('/keywords" content="(.+)"/isU', $con_url,$tags);
$tags=trim($tags[1],',');

preg_match('/class="txs_Content".*>(.+)/isU', $con_url,$txt);
$txt=$txt[1];
}

}
} 够清楚了吧

有个开源的simple_html_dom
$html = file_get_html('http://www.baidu.com');
可以根据各种抓取，如id,css等方法抓取网页内容

相关标签：

抓取url和网页内容

来源：php.cn

上一篇：请教会多种编程语言的朋友：当初是怎么克服对第一语言的依赖的？下一篇：CakePHP求救求救~

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

什么是 NullPointerException，如何修复它？

2024-10-22 09:46:29
从新手到程序员：您的旅程从 C 基础知识开始

2024-10-13 13:53:41
使用PHP解锁网络开发：初学者指南

2024-10-12 12:15:51
揭秘 C：为新程序员提供一条清晰简单的道路

2024-10-11 22:47:31
释放您的编码潜力：绝对初学者的 C 编程

2024-10-11 19:36:51
释放你内心的程序员：C 绝对初学者

2024-10-11 15:50:41
使用 C 自动化您的生活：适合初学者的脚本和工具

2024-10-11 15:07:41
PHP 变得简单：Web 开发的第一步

2024-10-11 14:21:21
使用 Python 构建任何东西：释放创造力的初学者指南

2024-10-11 12:59:11
编码的关键：为初学者释放 Python 的力量

2024-10-11 12:17:31

最新问题

返回（）；不适用于 1 条路线，但适用于几乎相同的路线我有2条路线，一条用于取消订阅，一条用于恢复，除非我遗漏了某些内容，否则两条路线除了名称/功能/网址之外都是相同的。当我取消恢复订阅时，我单击/resumeurl，它执行该功能，然...

来自于 2024-04-04 17:34:09

0

1

311

如何使用CSS选择器来定位包含特定属性或标签的div元素？我正在使用一个生成网站的POS系统。大部分代码是专有的，因此我无法编辑很多内容。我有一个输出的类别列表，其中一些图像作为类别浮动。我想隐藏主页上列出的前3个。我尝试使用div:nt...

来自于 2024-04-03 22:25:59

0

1

277

无法从我的 mySQL 数据库接收信息，尽管已经看到教程做了完全相同的事情所以我正在尝试制作一个读取和写入MySQL数据库的程序，这让我找到了YouTube教程。我的问题是，尽管经历了与教程中的人完全相同的过程，但我最终得到了一个空服务器，尽管应该弹出什...

来自于 2024-04-03 14:46:04

0

1

298

LESS string-set 的现代等价物是什么有关字符串集及其用途的示例，请参阅使用LESS字符串集属性和内容方法经过多次困惑，我发现这已经过时了，并且自Chrome版本39以来就没有实现过，尽管它显然在LESS中继续存在。教...

来自于 2024-04-02 13:29:36

0

1

361

提取关于Chrome扩展的相关信息我正在尝试构建一个Chrome扩展程序，当用户访问网站A时，从一系列网站中汇总信息。asyncfunctionfetchHTML(url){constresponse=awaitf...

来自于 2024-03-30 12:17:29

0

1

402

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1416667
php入门教程之一周学会PHP

4257168
JAVA 初级入门视频教程

2474752
小甲鱼零基础入门学习Python视频教程

503264
PHP 零基础入门教程

844015

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责声明 Sitemap: PHP中文网：公益在线PHP培训，帮助PHP学习者快速成长！