标题重写为:"全程使用UTF-8编码"
P粉321676640
P粉321676640 2023-08-21 21:12:13
0
2
359
<p> 我正在设置一个新的服务器,并希望在我的Web应用程序中完全支持UTF-8。我曾经在现有服务器上尝试过这个,但总是不得不回退到ISO-8859-1。</p> <p>我需要在哪里设置编码/字符集?我知道我需要配置Apache,MySQL和PHP来实现这一点 - 是否有一些标准的检查清单可以遵循,或者可以排除不匹配的地方吗?</p> <p>这是一个运行MySQL 5,PHP 5和Apache 2的新Linux服务器。</p>
P粉321676640
P粉321676640

全部回复(2)
P粉790187507

我想在chazomaticus的出色回答中再补充一点:

也不要忘记META标签(像这样,或者它的HTML4或XHTML版本):

<meta charset="utf-8">

这看起来很琐碎,但IE7以前曾给我带来问题。

我做的一切都是正确的;数据库、数据库连接和Content-Type HTTP头都设置为UTF-8,在所有其他浏览器中都正常工作,但是Internet Explorer仍然坚持使用“西欧”编码。

结果发现页面缺少META标签。添加了之后问题解决了。

编辑:

W3C实际上有一个相当大的专门用于国际化(I18N)的部分。他们有很多与这个问题相关的文章 - 描述了HTTP、(X)HTML和CSS的方面:

他们建议同时使用HTTP头和HTML meta标签(或在作为XML提供的XHTML的情况下使用XML声明)。

P粉653045807

数据存储:

  • 在数据库中的所有表和文本列上指定utf8mb4字符集。这样,MySQL会以UTF-8的原生编码方式物理存储和检索值。请注意,如果指定了utf8mb4_*排序规则(而没有明确指定字符集),MySQL将隐式使用utf8mb4编码。

  • 在旧版本的MySQL(< 5.5.3)中,你只能使用仅支持Unicode字符子集的utf8。我希望我在开玩笑。

数据访问:

输出:

  • UTF-8应该在HTTP头中设置,例如Content-Type: text/html; charset=utf-8。你可以通过在php.ini中设置default_charset(首选)或手动使用header()函数来实现。
  • 如果你的应用程序将文本传输到其他系统,它们也需要知道字符编码。对于Web应用程序,浏览器必须知道以哪种编码方式发送数据(通过HTTP响应头或HTML元数据)。
  • 使用json_encode()编码输出时,将JSON_UNESCAPED_UNICODE作为第二个参数添加。

输入:

  • 浏览器将以文档指定的字符集提交数据,因此在输入上不需要特别处理。
  • 如果你对请求编码有疑问(以防它可能被篡改),在存储或使用任何数据之前,你可以验证每个接收到的字符串是否为有效的UTF-8。PHP的mb_check_encoding()可以解决这个问题,但你必须坚持使用它。没有任何绕过这个问题的方法,因为恶意客户端可以以任何他们想要的编码方式提交数据,而我还没有找到一个可靠地让PHP为你完成这个任务的技巧。

其他代码注意事项:

  • 显然,你将提供的所有文件(PHP、HTML、JavaScript等)都应该以有效的UTF-8进行编码。

  • 你需要确保每次处理UTF-8字符串时都能安全地进行。不幸的是,这是困难的部分。你可能会大量使用PHP的mbstring扩展。

  • PHP的内置字符串操作默认情况下不是UTF-8安全的。你可以使用普通的PHP字符串操作(如连接)来安全地执行某些操作,但对于大多数情况,你应该使用等效的mbstring函数。

  • 为了知道你在做什么(即不搞砸),你真的需要了解UTF-8以及它在最低级别上的工作方式。在utf8.com的链接中有一些很好的资源,可以学习你需要知道的一切。

最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!