数据过滤 - [ PHP编程之道 ] - 在线原生手册

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

目錄搜尋

前言入门指南代码风格指南语言亮点编程范式命名空间 PHP标准库命令行接口 Xdebug 依赖管理使用当前稳定版本的 PHP (7.1) Mac 系统安裝 PHP Windows 系统安裝 PHP 内置的 web 服务器 Composer 与 Packagist PEAR 介绍开发实践基础知识日期和时间设计模式使用 UTF-8 编码国际化 (i18n) 与本地化 (l10n) 一般的实现方法 Gettext 依赖注入基本概念复杂的问题容器数据库 MySQL 扩展 PDO 扩展数据库交互数据库抽象层使用模板好处原生 PHP 模板编译型模板错误与异常错误异常安全 Web 应用程序安全密码哈希数据过滤配置文件注册全局变量错误报告测试测试驱动开发其他测试工具服务器与部署虚拟或专用服务器共享主机构建及部署应用虚拟化技术 Vagrant 简介 Docker 简介缓存 Opcode 缓存对象缓存文档撰写 PHPDoc 资源 PHP 官方值得关注的大牛指导 PHP 的 Paas 提供商框架组件其他有用的资源书籍社区 PHP 用户组 PHP 会议 ElePHPants

文字

永远不要信任外部输入。请在使用外部输入前进行过滤和验证。filter_var()和 filter_input() 函数可以过滤文本并对格式进行校验（例如 email 地址）。

外部输入可以是任何东西：$_GET 和 $_POST 等表单输入数据，$_SERVER 超全局变量中的某些值，还有通过 fopen('php://input', 'r') 得到的 HTTP 请求体。记住，外部输入的定义并不局限于用户通过表单提交的数据。上传和下载的文档，session 值，cookie 数据，还有来自第三方 web 服务的数据，这些都是外服输入。

虽然外部输入可以被存储、组合并在以后继续使用，但它依旧是外部输入。每次你处理、输出、连结或在代码中包含时，请提醒自己检查数据是否已经安全地完成了过滤。

数据可以根据不同的目的进行不同的过滤。比如，当原始的外部输入被传入到了 HTML 页面的输出当中，它可以在你的站点上执行 HTML 和 JavaScript 脚本！这属于跨站脚本攻击（XSS），是一种很有杀伤力的攻击方式。一种避免 XSS 攻击的方法是在输出到页面前对所有用户生成的数据进行清理，使用 strip_tags() 函数来去除 HTML 标签或者使用 htmlentities() 或是 htmlspecialchars() 函数来对特殊字符分别进行转义从而得到各自的 HTML 实体。

另一个例子是传入能够在命令行中执行的选项。这是非常危险的（同时也是一个不好的做法），但是你可以使用自带的 escapeshellarg() 函数来过滤执行命令的参数。

最后的一个例子是接受外部输入来从文件系统中加载文件。这可以通过将文件名修改为文件路径来进行利用。你需要过滤掉"/", "../", null 字符或者其他文件路径的字符来确保不会去加载隐藏、私有或者敏感的文件。

数据清理

数据清理是指删除（或转义）外部输入中的非法和不安全的字符。

例如，你需要在将外部输入包含在 HTML 中或者插入到原始的 SQL 请求之前对它进行过滤。当你使用 PDO 中的限制参数功能时，它会自动为你完成过滤的工作。

有些时候你可能需要允许一些安全的 HTML 标签输入进来并被包含在输出的 HTML 页面中，但这实现起来并不容易。尽管有一些像 HTML Purifier 的白名单类库为了这个原因而出现，实际上更多的人通过使用其他更加严格的格式限制方式例如使用 Markdown 或 BBCode 来避免出现问题。

查看 Sanitization Filters

反序列化

将来自用户或非信任源的数据通过 unserialize() 进行反序列化是非常危险的。这样做将导致恶意用户的的对象被实例化（带有用户自定义属性），即便此对象本身并未被使用过在被销毁时析构函数（destructor）仍会被执行。因此，切记避免对不被信任的数据执行反序列化。

如果你确实需要反序列化不被信任的数据，请设置 PHP 7 的 allowed_classes配置项以限制能够被反序列化的对象类型。

有效性验证

验证是来确保外部输入的是你所想要的内容。比如，你也许需要在处理注册申请时验证 email 地址、手机号码或者年龄等信息的有效性。