数据结构 - 关于 Redis 字符串小于 39 字节的疑惑

Question

{代码...} 比如： {代码...} 为什么这段字符串小于 39 编码却是 raw？另外，小于 39 字节 embstr 编码，大于 39 raw 编码的缘由是什么？

ringa_lee · Answer

这个和redis的版本有关系。
查看redis-3.0和最新的版本的object.c文件，可以发现在创建StringObject的时候，会和REIDS_ENCODING_EMBSTR_SIZE_LIMIT比较，这个的默认值是39。
查看一下redis-2.8版本的源码，并没有发现比较，而是直接创建了。
所以我猜测这个embstr编码是3.0以上版本才出现的。

至于为什么是39，这个讲起来就比较复杂了，我就慢点说。
embstr是一块连续的内存区域，由redisObject和sdshdr组成。其中redisObject占16个字节，当buf内的字符串长度是39时，sdshdr的大小为8+39+1=48，那一个字节是'\0'。加起来刚好64。是不是发现了什么？

typedef struct redisObject {
    unsigned type:4;
    unsigned encoding:4;
    unsigned lru:REDIS_LRU_BITS; /* lru time (relative to server.lruclock) */
    int refcount;
    void *ptr;
} robj;
struct sdshdr {
    unsigned int len;
    unsigned int free;
    char buf[];
};

从2.4版本开始，redis开始使用jemalloc内存分配器。这个比glibc的malloc要好不少，还省内存。在这里可以简单理解，jemalloc会分配8，16，32，64等字节的内存。embstr最小为16+8+8+1=33，所以最小分配64字节。当字符数小于39时，都会分配64字节。
这个默认39就是这样来的。