在 Unicode 字符串类型之间进行转换
在使用各种编程语言和平台时,可能会遇到在 Unicode 字符串类型之间进行转换的任务。虽然 mbstowcs() 和 wcstombs() 等函数看起来像是可行的转换选项,但它们的使用可能存在问题。
mbstowcs() 和 wcstombs() 的限制
这些函数不一定转换为 UTF-16 或 UTF-32,而是转换为 wchar_t,编码根据区域设置而变化。这给可移植性和 Unicode 支持带来了困难。
C 11 中引入的更好方法
C 11 引入了几种在 Unicode 字符串类型之间转换的改进方法:
1。 std::wstring_convert
此模板类提供了一种执行转换的便捷方法。创建后,它可用于轻松在字符串之间进行转换:
<code class="cpp">std::wstring_convert<..., char16_t> convert; std::string utf8_string = u8"This string has UTF-8 content"; std::u16string utf16_string = convert.from_bytes(utf8_string);</code>
2.新的 std::codecvt 专业化
std::codecvt 的新专业化也可用于特定的 Unicode 转换:
3。子类的定义
要绕过 std::codecvt 专业化中受保护析构函数的问题,可以定义自定义子类:
<code class="cpp">template <class internT, class externT, class stateT> struct codecvt : std::codecvt<internT, externT, stateT> { ~codecvt() {} }; std::wstring_convert<codecvt<char16_t, char, std::mbstate_t>, char16_t> convert16;</code>
4。 std::use_facet 模板函数
此函数可用于获取现有的 codecvt 实例,由于专业化限制,这对于 Visual Studio 2010 很有帮助:
<code class="cpp">std::wstring_convert<std::codecvt_utf8<char16_t>, char16_t> convert16;</code>
注意:直接 UTF-32 和 UTF-16 转换需要组合 std::wstring_convert 的两个实例。
对 Unicode 的 wchar_t 的批评
而 wchar_t存在用于表示 Unicode 代码点,其目的和实用性有一定的限制:
对于可移植代码,推荐的方法是使用 C 11 字符串转换或适当的特定于编码的库。
以上是为什么 mbstowcs() 和 wcstombs() 不是 Unicode 字符串转换的最佳选择?的详细内容。更多信息请关注PHP中文网其他相关文章!