• 技术文章 >后端开发 >php教程

    php清除HTML格式的代码

    2016-05-22 18:41:08原创977
      在字符截取时常会因为HTML格式发生意外,ASP是,PHP也是,如果是可预见的简单HTML格式用replace就行了,对于文章正文这一类里面可能包含所有的HTML格式,想高效点还是用下面的的,已测试

    $search = array ("’]*?>.*?’si", // 去掉 javascript
             "’<[/!]*?[^<>]*?>’si",      // 去掉 HTML 标记
             "’([rn])[s]+’",         // 去掉空白字符
             "’&(quot|#34);’i",         // 替换 HTML 实体
             "’&(amp|#38);’i",
             "’&(lt|#60);’i",
             "’&(gt|#62);’i",
             "’&(nbsp|#160);’i",
             "’&(iexcl|#161);’i",
             "’&(cent|#162);’i",
             "’&(pound|#163);’i",
             "’&(copy|#169);’i",
             "’&#(d+);’e");          // 作为 PHP 代码运行

    $replace = array ("",
             "",
             "\1",
             "\"",
             "&",
             "<",
             ">",
             " ",
             chr(161),
             chr(162),
             chr(163),
             chr(169),
             "chr(\1)");
    //$document为需要处理字符串,如果来源为文件可以$document = file_get_contents($filename);
    //$text = preg_replace($search, $replace, $document);
    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。
    上一篇:PHP技巧:php过滤危险html代码 下一篇:自己动手写 PHP MVC 框架(40节精讲/巨细/新人进阶必看)

    相关文章推荐

    • php实现通过JSON RPC与go通讯(附代码)• 浅析怎么使用PHP做异步爬取数据• PHP8.3要有新函数了!(json_validate函数说明)• 设计API接口时,要注意这些地方!• PHP网站常见一些安全漏洞及防御方法
    1/1

    PHP中文网