社群學習工具庫休閒

繁体中文

首頁 > 後端開發 > php教程 > 如何從 UTF-8 字串中提取 UCS-2 代碼點？

如何從 UTF-8 字串中提取 UCS-2 代碼點？

Barbara Streisand

發布： 2024-11-01 17:45:30

原創

650 人瀏覽過

How to Extract UCS-2 Code Points from UTF-8 Strings?

確定UTF-8 字元的UCS-2 代碼點

在各種程式設計場景中，可能需要擷取UCS-2與UTF -8 字串中的字元關聯的代碼點。為了滿足此要求，明智的做法是利用內建實用程式或深入研究 UTF-8 編碼格式的複雜性。

UTF-8 使用可變長度位元組序列對字元進行編碼。每個代碼點由 1 到 4 個位元組表示，取決於其值。適用以下範圍：

U 0000 — U 007F：1 位元組(0xxxxxxx)
U 0080 — U 07FF：2 位元組(110xxx 10xxx) U 0800 — U FFFF: 3 位元組(1110xxxx 10xxxxxx 10xxxxxx)
U 10000 — U 10FFFF: 4 位元組(11110xxx 10xxxxxx 100xxx 10xxx)數點，檢查第一個位元組：
0x00：1 個位元組

0xC0：2 個位元組

0xF0：4 個位元組
0x10：連續位元組
0x11111：無效字元
一旦知道位元組數，就可以透過位元組數位元操作提取代碼點。請注意，UCS-2 的範圍有限，不能表示 U FFFF 以上的字元。

以上是如何從 UTF-8 字串中提取 UCS-2 代碼點？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

來源：php.cn

上一篇：如何在 PHP 中檢索視訊元資料？下一篇：為什麼我的 PDF 下載無法在 PHP 中運作？

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

最新問題

function_exists()無法判定自訂函數 function test() { return true; } if (function_exists('TEST')) { ech...

來自於 2024-04-29 11:01:01

0

3

2226

google 瀏覽器手機版顯示的怎麼實現老師您好，google 瀏覽器怎麼變成手機版樣式的？

來自於 2024-04-23 00:22:19

0

11

2372

子窗口操作父窗口，輸出沒反應前兩句可執行，最後一句沒辦法應

來自於 2024-04-19 15:37:47

0

1

1980

父視窗沒有輸出 document.onclick = function(){ window.opener.document.write('我是子視窗的輸出'); ...

來自於 2024-04-18 23:52:34

0

1

1868

關於CSS心智圖的課件在哪？課件

來自於 2024-04-16 10:10:18

0

0

1938

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1423220
php入門教程之一週學會PHP

4268777
JAVA 初級入門影片教學

2536637
小甲魚零基礎入門學習Python影片教學

507476
PHP 零基礎入門教學

862789

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板