• 技术文章 >后端开发 >php教程

    抓取和分析_PHP教程

    2016-07-13 17:25:06原创452
    抓取和分析一个文件是非常简单的事。这个教程将通过一个例子带领你一步一步地去实现它。让我们开始吧!

      首先,我首必须决定我们将抓取的URL地址。可以通过在脚本中设定或通过$QUERY_STRING传递。为了简
    单起见,让我们将变量直接设在脚本中。

    $url = http://www.php.net;
    ?>

      第二步,我们抓取指定文件,并且通过file()函数将它存在一个数组里。

    $url = http://www.php.net;
    $lines_array = file($url);
    ?>

      好了,现在在数组里已经有了文件了。但是,我们想分析的文本可能不全在一行里面。为了解决这个文件,我们可以简单地将数组$lines_array转化成一个字符串。我们可以使用implode(x,y)函数来实现它。如果在后面你想用explode(将字符串变量数组),将x设成"|"或"!"或其它类似的分隔符可能会更好。但是出于我们的目的,最好将x设成空格。y是另一个必要的参数,因为它是你想用implode()处理的数组。

    $url = http://www.php.net;
    $lines_array = file($url);
    $lines_string = implode(, $lines_array);
    ?>

      现在,抓取工作就做完了,下面该进行分析了。出于这个例子的目的,我们想得到在到
    之间的所有东西。为了分析出字符串,我们还需要叫做正规表达式的东西。

    $url = http://www.php.net;
    $lines_array = file($url);
    $lines_string = implode(, $lines_array);
    eregi("(.*)
    ", $lines_string, $head);

    ?>

      让我们看一下代码。正如你所见,eregi()函数按下面的格式执行:

    eregi("(.*)
    ", $lines_string, $head);

      "(.*)"表示所有东西,可以解释为,"分析在和
    间的所以东西"。$lines_string是我们正在分析的字符串,$head是分析后的结果存放的数组。

      最后,我们可以输数据。因为仅在和
    间存在一个实例,我们可以安全的假设数组中仅存在着一个元素,而且就是我们想要的。让我们把它打印出来吧。

    $url = http://www.php.net;
    $lines_array = file($url);
    $lines_string = implode(, $lines_array);
    eregi("(.*)
    ", $lines_string, $head);
    echo $head[0];
    ?>

      这就是全部的代码了。

    转自WeberDev.com

    www.bkjia.comtruehttp://www.bkjia.com/PHPjc/532087.htmlTechArticle抓取和分析一个文件是非常简单的事。这个教程将通过一个例子带领你一步一步地去实现它。让我们开始吧! 首先,我首必须决定我们将抓...

    php入门到就业线上直播课:查看学习

    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。

    前端(VUE)零基础到就业课程:点击学习

    清晰的学习路线+老师随时辅导答疑

    自己动手写 PHP MVC 框架:点击学习

    快速了解MVC架构、了解框架底层运行原理

    专题推荐:抓取 分析 抓取 分析 一个 文件 非常 简单 这个 教程 通过 例子 带领 一步 地去
    上一篇:多版面论坛数据库表结构优化设计的讨论_PHP教程 下一篇:自己动手写 PHP MVC 框架(40节精讲/巨细/新人进阶必看)

    相关文章推荐

    • ❤️‍🔥共22门课程,总价3725元,会员免费学• ❤️‍🔥接口自动化测试不想写代码?• 工具包分享:PHP实现滑块验证图片• 请教QQ互联的代码是如何写的? • 没有上载的分数了,vip次数也用完了啊 • PHP登录跳转,该怎么处理 • 注册信息添加到数据库,该怎么处理
    1/1

    PHP中文网