• 技术文章 >后端开发 >php教程

    php 采集书并合成txt格式的实现代码_PHP教程

    2016-07-21 15:48:13原创384
    /**
    * @name 采集书.php
    * @date Sun Mar 01 22:48:02 CST 2009
    * @copyright 马永占(MyZ)
    * @author 马永占(MyZ)
    * @link http://blog.csdn.net/mayongzhan/
    */
    //header('Content-Type:text/html;charset=utf8');
    header('Content-Type:text/html;charset=gb2312');
    error_reporting(E_ALL);
    date_default_timezone_set('Asia/Shanghai');
    set_time_limit(0);
    function writer($content,$url)
    {
    $fp = fopen($url, 'ab');
    fwrite($fp, $content);
    fclose($fp);
    }
    $folder = '2'; //文件夹
    $book_base_url = 'xxxxxxxxxxxxxxxxxxxxx';
    $book_url = 'yyyyyyyyyyyyy.html';
    $main = file_get_contents($book_base_url.$book_url);
    preg_match_all('/chapter_.*?\.html/', $main, $pages);
    $pages = array_unique($pages[0]);
    foreach ($pages as $value) {
    writer(file_get_contents($book_base_url.$value), './'.$folder.'//m.sbmmt.com/m/'.$value.'.txt');
    $str = file_get_contents('./'.$folder.'//m.sbmmt.com/m/'.$value.'.txt');
    //print_r($str);
    preg_match("/(

    )(.*?)(<\/h1>)(.*?)(
    )(.*?)(<\/div>)/s",$str,$arr);
    //print_r($arr);die();
    $arr[6] = preg_replace("/(]+>.*?]+>)(.*?)(<\/a><\/span>)/s","$2",preg_replace("/

    |<\/p>/","\r\n",$arr[6]));
    $result = "\r\n------------------------------------------------\r\n------------------------------------------------\r\n------------------------------------------------\r\n----------------".$arr[2]."\r\n------------------------------------------------\r\n------------------------------------------------\r\n------------------------------------------------\r\n".$arr[6];
    writer($result, './'.$folder.'/new.txt');
    }
    ?>

    www.bkjia.comtruehttp://www.bkjia.com/PHPjc/319775.htmlTechArticle?php /** * @name 采集书.php * @date Sun Mar 01 22:48:02 CST 2009 * @copyright 马永占(MyZ) * @author 马永占(MyZ) * @link http://blog.csdn.net/mayongzhan/ */ //header('Conten...

    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。
    上一篇:简化php模板页面中分页代码的解析_PHP教程 下一篇:一周让你学会PHP 不错的学习资料_PHP教程

    相关文章推荐

    • PHP 文件操作函数(专题)• PHP控制网页过期时间的代码_PHP教程• [PHP]经常用到的实用函数集合第1/2页_PHP教程• php自定义大小验证码的实例代码 • php通用防注入程序 推荐_php技巧

    全部评论我要评论

  • 取消发布评论发送
  • 1/1

    PHP中文网