Menukar Antara Jenis Rentetan Unikod
Tugas menukar antara jenis rentetan Unicode boleh dihadapi apabila bekerja dengan pelbagai bahasa pengaturcaraan dan platform. Walaupun fungsi seperti mbstowcs() dan wcstombs() mungkin kelihatan seperti pilihan yang berdaya maju untuk penukaran, penggunaannya boleh menjadi masalah.
Penghadan mbstowcs() dan wcstombs()
Fungsi ini tidak semestinya ditukar kepada UTF-16 atau UTF-32, tetapi sebaliknya kepada wchar_t, dengan pengekodan berbeza-beza berdasarkan tempat. Ini memperkenalkan kesukaran dengan mudah alih dan sokongan Unicode.
Kaedah Lebih Baik Diperkenalkan dalam C 11
C 11 memperkenalkan beberapa kaedah yang dipertingkatkan untuk menukar antara jenis rentetan Unikod:
1. std::wstring_convert
Kelas templat ini menyediakan cara yang mudah untuk melakukan penukaran. Setelah dibuat, ia boleh digunakan untuk menukar antara rentetan dengan mudah:
<code class="cpp">std::wstring_convert<..., char16_t> convert; std::string utf8_string = u8"This string has UTF-8 content"; std::u16string utf16_string = convert.from_bytes(utf8_string);</code>
2. Pengkhususan std::codecvt baharu
Pengkhususan baharu std::codecvt juga tersedia untuk penukaran Unicode tertentu:
3. Definisi Subkelas
Untuk memintas isu dengan pemusnah yang dilindungi dalam pengkhususan std::codecvt, subkelas tersuai boleh ditakrifkan:
<code class="cpp">template <class internT, class externT, class stateT> struct codecvt : std::codecvt<internT, externT, stateT> { ~codecvt() {} }; std::wstring_convert<codecvt<char16_t, char, std::mbstate_t>, char16_t> convert16;</code>
4. std::use_facet Fungsi Templat
Fungsi ini boleh digunakan untuk mendapatkan contoh codecvt sedia ada, yang boleh membantu dengan Visual Studio 2010 disebabkan oleh pengehadan pengkhususan:
<code class="cpp">std::wstring_convert<std::codecvt_utf8<char16_t>, char16_t> convert16;</code>
Nota: Penukaran langsung UTF-32 dan UTF-16 memerlukan gabungan dua kejadian std::wstring_convert.
Kritikan wchar_t untuk Unicode
Semasa wchar_t wujud untuk mewakili titik kod Unikod, tujuan dan kegunaannya mempunyai had tertentu:
Untuk kod mudah alih, pendekatan yang disyorkan ialah menggunakan penukaran rentetan C 11 atau perpustakaan khusus pengekodan yang sesuai.
Atas ialah kandungan terperinci Mengapakah mbstowcs() dan wcstombs() Bukan Pilihan Terbaik untuk Penukaran Rentetan Unikod?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!