Node.js中使用Buffer編碼、解碼二進位資料詳解-js教程-PHP中文網

JavaScript很擅長處理字串，但是因為它最初的設計是用來處理HTML文檔，因此它並不太擅長處理二進位資料。 JavaScript沒有byte類型，沒有結構化的型別（structured types），甚至沒有位元組數組，只有數字和字串。（原文：JavaScript doesn't have a byte type — it just has numbers — or structured types, or http://skylitecellars.com/ even byte arrays: It just has strings.）

因為Node基於JavaScript，它自然可以基於JavaScript，它自然可以基於JavaScript，它因為Node處理類似HTTP這樣的文字協議，但是你也可以用它來跟資料庫交互，處理圖片或檔案上傳等，可以想像，如果僅僅用字串來做這些事得有多困難。早些時候，Node透過將byte編碼成文字字元來處理二進位數據，但這種方式後來被證明並不可行，既浪費資源，又緩慢，又不靈活，而且難以維護。

Node有一個二進位緩衝實作Buffer，這個偽類別（pseudo-class）提供了一系列處理二進位資料的API，簡化了那些需要處理二進位資料的任務。緩衝的長度由位元組資料的長度決定，而且你可以隨機的設定和取得緩衝內的位元組資料。

注意：Buffer類別有一個特殊的地方，緩衝內的位元組資料所佔用的記憶體不是分配在JavaScrp

It VM記憶體堆上的，也就是說這些物件不會被JavaScript的垃圾回收演算法處理，取而代之的是一個不會被修改的永久記憶體位址，這也避免了緩衝內容的記憶體複製所造成的CPU浪費。

建立緩衝

你可以用一個UTF-8字串建立緩衝，像這樣：

var buf = new Buffer(‘Hello World!&#39;);

登入後複製

也可以用指定編碼的字串建立緩衝：

var buf = new Buffer(&#39;8b76fde713ce&#39;, &#39;base64&#39;);

登入後複製

可接受的字元編碼和識別如下：

1 .ascii——ASCI，僅適用於ASCII字元集。
2.utf8——UTF-8，這種可變寬編碼適用於Unicode字符集的任何字符，它已經成了Web世界的首選編碼，也是Node的預設編碼類型。
3.base64——Base64，這種編碼基於64個可列印ASCII字元來表示二進位數據，Base64通常用於在字元文件內嵌入可以被轉化成字串的二進位數據，在需要時又可以完整無損的轉換回原來的二進位格式。

如果沒有資料來初始化緩衝，可以用指定的容量大小來創建一個空緩衝：

var buf = new Buffer(1024); // 创建一个1024字节的缓冲

登入後複製

獲取和設定緩衝資料

創建或接收一個緩衝物件後，您可能要查看或修改它的內容，可以透過[]操作符來存取緩衝的某個位元組：

var buf = new Buffer(&#39;my buffer content&#39;);
// 访问缓冲内第10个字节
console.log(buf[10]); // -> 99

登入後複製

注意：當你（使用緩衝容量大小來）建立一個已初始化的緩衝時，一定要注意，緩衝的資料並沒有被初始化成0，而是隨機數據。

var buf = new Buffer(1024);
console.log(buf[100]); // -> 5 (某个随机值)

登入後複製

你可以這樣修改緩衝裡任何位置的資料：

buf[99] = 125; // 把第100个字节的值设置为125

登入後複製

注意：在某些情況下，一些緩衝操作並不會產生錯誤，例如：

1.緩衝內的位元組最大值為255，如果某個位元組被賦予大於256的數字，將會用256對其取模，然後將結果賦給這個位元組。
2.如果將緩衝的某個位元組賦值為256，它的實際值將會是0（譯者註：其實跟第一條重複，256%256=0）
3.如果用浮點數給緩衝內某個位元組賦值，例如100.7，實際值將會是浮點數的整數部分－100
4.如果你嘗試給一個超出緩衝容量的位置賦值，賦值操作將會失敗，緩衝不做任何修改。

你可以用length屬性取得緩衝的長度：

var buf = new Buffer(100);
console.log(buf.length); // -> 100

登入後複製

還可以使用緩衝長度迭代緩衝的內容，來讀取或設定每個位元組：

var buf = new Buffer(100);
for(var i = 0; i < buf.length; i++) {
    buf[i] = i;
}

登入後複製

上面程式碼新建了一個包含100個位元組的緩衝，並從0到99設定了緩衝內每個位元組。

切分緩衝資料

一旦創建或接收了一個緩衝，你可能需要提取緩衝資料的一部分，可以透過指定起始位置來切分現有的緩衝，從而創建另外一個較小的緩衝：

var buffer = new Buffer("this is the content of my buffer");

var smallerBuffer = buffer.slice(8, 19);
console.log(smallerBuffer.toString()); // -> "the content"

登入後複製

注意，當切分一個緩衝的時候並沒有新的內存被分配或複製，新的緩衝使用父緩衝的內存，它只是父緩衝某段數據（由起始位置指定）的引用。這段話含有幾個意思。

首先，如果你的程式修改了父緩衝的內容，這些修改也會影響相關的子緩衝，因為父緩衝和子緩衝是不同的JavaScript對象，因此很容易忽略這個問題，並導致一些潛在的bug。

其次，當你用這種方式從父緩衝創建一個較小的子緩衝時，父緩衝對像在操作結束後依然會被保留，並不會被垃圾回收，如果不注意的話，很容易會造成內存外洩。

注意：如果你擔心因此產生記憶體外洩問題，你可以使用copy方法來取代slice操作，以下將會介紹copy。

複製緩衝資料

你可以像這樣用copy將緩衝的一部分複製到另外一個緩衝：

var buffer1 = new Buffer("this is the content of my buffer");
var buffer2 = new Buffer(11);
var targetStart = 0;
var sourceStart = 8;
var sourceEnd = 19;
buffer1.copy(buffer2, targetStart, sourceStart, sourceEnd);
console.log(buffer2.toString()); // -> "the content"

登入後複製

上面程式碼，複製來源緩衝的第9到20個位元組到目標緩衝的開始位置。

解碼緩衝資料

緩衝資料可以這樣轉換成一個UTF-8字串：

var str = buf.toString();

登入後複製

还可以通过指定编码类型来将缓冲数据解码成任何编码类型的数据。比如，你想把一个缓冲解码成base64字符串，可以这么做：

var b64Str = buf.toString("base64");

登入後複製

使用toString函数，你还可以把一个UTF-8字符串转码成base64字符串：

var utf8String = &#39;my string&#39;;
var buf = new Buffer(utf8String);
var base64String = buf.toString(&#39;base64&#39;)

登入後複製

小结

有时候，你不得不跟二进制数据打交道，但是原生JavaScript又没有明确的方式来做这件事，于是Node提供了Buffer类，封装了一些针对连续内存块的操作。你可以在两个缓冲之间切分或复制内存数据。

你也可以把一个缓冲转换成某种编码的字符串，或者反过来，把一个字符串转化成缓冲，来访问或处理每个bit。

更多Node.js中使用Buffer编码、解码二进制数据详解相关文章请关注PHP中文网！