Menentukan Mata Kod UCS-2 untuk Aksara UTF-8
Dalam pelbagai senario pengaturcaraan, mungkin perlu untuk mengekstrak UCS-2 titik kod yang dikaitkan dengan aksara dalam rentetan UTF-8. Untuk menangani keperluan ini, adalah bijak untuk memanfaatkan utiliti terbina dalam atau menyelidiki kerumitan format pengekodan UTF-8.
UTF-8 mengekod aksara menggunakan jujukan bait panjang pembolehubah. Setiap titik kod diwakili oleh 1 hingga 4 bait, bergantung pada nilainya. Julat berikut digunakan:
Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Mata Kod UCS-2 daripada Rentetan UTF-8?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!