标识符中的 Unicode 字符:G 中的限制
尽管启用了 -fextended-identifiers 选项,G 4.7 仍禁止使用某些 Unicode 字符,包括笑脸符号 (☺) 作为标识符。此限制源于标识符中缺乏对 UTF-8 字符的支持。
即使将标识符转换为其通用字符名称 (U0001F603),编译器仍然会失败。这是因为 G 仅支持基于 C99 和 C 98 标准的 ucnid.tab 中定义的一组有限的标识符字符。
此外,-fextended-identifiers 选项仍处于实验阶段,可能不会按预期发挥作用。为了解决这个限制,G 在 4.9.0 版本中引入了对 C11 字符集的支持。这允许使用 BMP 范围内的字符,包括 U0001F603。
但是,尽管使用 -finput-charset=UTF-8,但某些 Unicode 字符(例如 ☺)仍然存在问题。已提交错误报告来跟踪此问题。
相比之下,Clang 3.3 成功处理原始标识符 (☺) 和通用角色名称 (U0001F603),无需任何特殊选项。
以上是为什么即使使用 -fextended-identifiers,G 仍然限制标识符中的某些 Unicode 字符?的详细内容。更多信息请关注PHP中文网其他相关文章!