字串 是Redis 最基本的資料類型,不僅所有key 都是字串類型,其它幾種資料類型構成的元素也是字符串。注意字串的長度不能超過 512 M。
首先是誰規定不能超過 512 M?或為什麼不能超過 512 M?
// 源码定义(检查字符串长度) static int checkStringLength(redisClient *c, long long size) { if (size > 512*1024*1024) { addReplyError(c,"string exceeds maximum allowed size (512MB)"); return REDIS_ERR; } return REDIS_OK; }
由原始碼檢查固定不能超過 512 M。
來看redis 字串的結構體:
struct sdshdr{ // 记录 buf 数组中已使用字节的数量 // 等于 SDS 所保存字符串的长度 int len; // 记录 buf 数组中未使用字节的数量 int free; // 字节数组,用于保存字符串 char buf[]; }
由此可以直接看出,int 為32位,那麼最大應該可以支援4G 的字串,但是實際情況並非如此。
為了找出為什麼不能超過512 M,發現了一個官方的答案:
# #然後我才發現,我看過的redis 資料已經過時了!
看看,還有人也中招了。這個討論的版本都是3.2 之前的了。
#
话不多说,继续学习 redis5.0 版本的资料。不过之前学习了的也没事,我们可以一起来看下 redis 的字符串是怎么优化的。
用如下结构来存储长度小于32的短字符串:
struct __attribute__((__packed__)) sdshdr5 { unsigned char flags; /* 低3位存储类型,高5位存储长度*/ char buf[]; /* 柔性数组,存放实际内容*/ }
sdshdr5 结构中,flags占1个字节,其低3位(bit)表示type,高5位(bit)表示长度,能表示的长度区间为0~31(25-1), flags后面就是字符串的内容。
而对于长度大于31的字符串,这个结构就不够用了,所以对于不同长度的字符串,有不同的处理方式:
#define SDS_TYPE_5 0 #define SDS_TYPE_8 1 #define SDS_TYPE_16 2 #define SDS_TYPE_32 3 #define SDS_TYPE_64 4 struct __attribute__ ((__packed__)) sdshdr8 { uint8_t len; /* used */ uint8_t alloc; /* excluding the header and null terminator */ unsigned char flags; /* 3 lsb of type, 5 unused bits */ char buf[]; }; struct __attribute__ ((__packed__)) sdshdr16 { uint16_t len; /* used */ uint16_t alloc; /* excluding the header and null terminator */ unsigned char flags; /* 3 lsb of type, 5 unused bits */ char buf[]; }; struct __attribute__ ((__packed__)) sdshdr32 { uint32_t len; /* used */ uint32_t alloc; /* excluding the header and null terminator */ unsigned char flags; /* 3 lsb of type, 5 unused bits */ char buf[]; }; struct __attribute__ ((__packed__)) sdshdr64 { uint64_t len; /* used */ uint64_t alloc; /* excluding the header and null terminator */ unsigned char flags; /* 3 lsb of type, 5 unused bits */ char buf[]; };
可以看到,这4种结构的成员变量类似,唯一的区别是len和alloc的类型不同。
结构体中4个字段的具体含义分别如下:
1)len:表示buf中已占用字节数。
2)alloc:表示buf中已分配字节数,不同于free,记录的是为buf分配的总长度。
3)flags:标识当前结构体的类型,低3位用作标识位,高5位预留。
4)buf:柔性數組,真正儲存字串的資料空間。
Redis透過sdsnewlen函數建立SDS。在函數中會根據字串長度選擇適當的類型,初始化對應的統計值後,傳回指向字串內容的指針,根據字串長度選擇不同的類型。
對於sdshdr5類型,在建立空字串時會強制轉換為sdshdr8。原因可能是創建空字串後,其內容可能會頻繁更新而引發擴容,故創建時直接創建為sdshdr8。
sdscatsds是暴露給上層的方法,其最終呼叫的是sdscatlen。由於其中可能涉及SDS的擴容,sdscatlen中調用sdsMakeRoomFor對帶拼接的字符串s容量做檢查,若無須擴容則直接返回s;若需要擴容,則返回擴容好的新字符串s。函數中的len、curlen等長度值是不含結束符的,而拼接時用memcpy將兩個字串拼接在一起,指定了相關長度,故該過程保證了二進制安全。最後需要加上結束符號。
#若sds中剩餘空閒長度avail大於新增內容的長度addlen,直接在柔性數組buf末端追加即可,無須擴容。
若sds中剩餘空閒長度avail小於或等於新增內容的長度addlen,則分情況討論:新增後總長度len addlen<1MB的,按新長度的2倍擴容;新增後總長度len addlen>1MB的,以新長度加上1MB擴容。
最後根據新長度重新選取儲存類型,並指派空間。此處若無須更改類型,透過realloc擴大柔性數組即可;否則需要重新開闢內存,並將原字串的buf內容移至新位置。
字串大致上就這些內容了。
在5.0 的版本中,沒有什麼字串512M 的限制,對於字串的處理方式,根據不同型別處理方式不同,更加節約記憶體;
以上是redis 學習筆記-string 原理的詳細內容。更多資訊請關注PHP中文網其他相關文章!