Skip to content

Latest commit

 

History

History
286 lines (187 loc) · 17.6 KB

ch8.md

File metadata and controls

286 lines (187 loc) · 17.6 KB

Redis并没有使用SDS、双端链表、字典、压缩列表、整数集合来实现键值对数据库,而是基于这些数据结构创建了一个对象系统。这个系统包含字符串对象、列表对象、哈希对象、集合对象和有序集合对象。

通过这五种类型的对象,Redis可以在执行命令之前,根据对象的类型判断一个对象是否执行给定的命令。使用对象的好处是,可以针对不同的场景,为对象设置多种不同的数据结构的实现,从而优化使用效率。

除此之外,Redis还实现了引用计数的内存回收机制。当程序不再需要某个对象的时候,它所占用的内存会被自动释放。另外,Redis还用引用计数实现了对象共享,让多个数据库键共享同一个对象来节约内存。

最后,Redis的对象带有访问时间记录信息,空转时长较大的键可能被优先删除。

8.1 对象的类型和编码

Redis使用对象来表示数据库中的键和值。创建一个新键值对时,至少会创建两个对象,一个对象用作键,一个对象用作值。每个对象都由一个redisObject结构表示:

typedef struct redisObject {
  unsigned type: 4; // 类型
  unsigned encoding: 4; // 编码
  void *ptr; // 指向底层实现数据结构的指针
  // ...
} robj;

类型

对象的type记录了对象的类型,它的值可以使

type常量 对象的名称
REDIS_STRING 字符串对象
REDIS_LIST 列表对象
REDIS_HASH 哈希对象
REDIS_SET 集合对象
REDIS_ZSET 有序集合对象

键总是一个字符串对象,值可以是字符串对象、列表对象、哈希对象、集合对象、有序集合对象。

但数据库执行TYPE命令时,返回的结果为数据库键对应的值对象的类型,而不是键对象的类型。

编码和底层实现

对象的ptr指向对象的底层实现数据结构,而这些数据结构由对象的encoding决定,它可以是:

encoding常量 对应的底层数据结构
REDIS_ENCODING_INT long类型的整数
REDIS_ENCODING_EMBSTR embstr编码的SDS
REDIS_ENCODING_RAW SDS
REDIS_ENCODING_HT 字典
REDIS_ENCODING_LINKEDLIST 双端链表
REDIS_ENCODING_ZIPLIST 压缩列表
REDIS_ENCODING_INTSET 整数集合
REDIS_ENCODING_SKIPLIST 跳跃表和字典

每种类型的对象至少使用了两种编码。

使用OBJECT ENCODING命令可以查看一个数据库键的值对象的编码。

8.2 字符串对象

字符串对象的编码可以使int、raw或embstr。

  1. 如果字符串对象保存的是整数值,且可以用long类型表示,那么字符串对象会将整数值保存在ptr中(将void* 转换成 long),并将编码设置为int。
  2. 如果字符串对象保存到是一个字符串值,且长度大于32字节,那么字符串对象使用SDS来保存这个字符串值,并将编码设置为raw。
  3. 如果字符串对象保存到是一个字符串值,且长度小于等于32字节,那么字符串对象使用embstr编码的方式来存储这个字符串值。

embstr编码是专门用来保存短字符串的优化方式。和raw编码一样,都是用redisObject结构和sdshdr结构来表示字符串对象,但raw会调用两次内存分配函数分别创建redisObject结构和sdshdr结构,而embstr则通过一次内存分配一块连续空间,依次包含两个结构:

redisObject sdshdr
type | encoding | ptr | ... free | len | buf

embstr的好处:

  1. 内存分配次数降为一次。
  2. 释放字符串对象只要一次内存释放函数。
  3. 因为内存连续,可以更好地利用缓存。

PS. 用long double类型表示的浮点数在Redis中也是作为字符串值存储的。程序会先将浮点数转成字符串值,然后再保存转换的字符串值。

编码的转换

int编码和embstr编码的字符串对象可以被转换为raw编码的字符串对象。

  1. 对int编码的字符串对象执行一些命令,可使其不再是整数值,而是字符串值,那么编码也就变为raw了。如APPEND。
  2. 对embstr编码的字符串,执行修改命令,也会变成raw对象。如APPEND。

字符串命令的实现

用于字符串键的所有命令都是针对字符串对象来构建的。

命令 int编码的实现方法 embstr编码的实现方法 raw编码的实现方法
SET int编码保存值 embstr编码保存值 raw编码保存值
GET 拷贝对象所保存的整数值,将这个拷贝转换为字符串值,然后向客户端返回这个字符串值 直接向客户端返回字符串值 直接向客户端返回字符串值
APPEND 将对象转换为raw编码,然后按raw方式执行此操作 将对象转换为raw编码,然后按raw方式执行此操作 调用sdscatlen函数,将给定字符串追加到现有字符串的末尾
INCBYFLOAT 取出整数值并将其转换为long double的浮点数,对这个浮点数进行加法计算,然后将结果保存起来 取出整数值并将其转换为long double的浮点数,对这个浮点数进行加法计算,然后将结果保存起来。如果字符串值不能被转换为浮点数,那么客户端会报错 取出整数值并将其转换为long double的浮点数,对这个浮点数进行加法计算,然后将结果保存起来。如果字符串值不能被转换为浮点数,那么客户端会报错
INCBY 对整数值进行加法计算,得出的结果作为整数被保存起来 不能执行此命令,客户端报错 不能执行此命令,客户端报错
DECBY 对整数值进行减法计算,得出的结果作为整数被保存起来 不能执行此命令,客户端报错 不能执行此命令,客户端报错
STRLEN 拷贝对象保存的整数值,将这个拷贝转换为字符串值,计算并返回这个字符串值的长度 调用sdslen函数,返回字符串的长度 调用sdslen函数,返回字符串的长度
SETRANGE 将对象转换为raw编码,然后按raw方式执行此命令 将对象转换为raw编码,然后按raw方式执行此命令 将字符串特定索引上的值设置为给定的字符
GETRANGE 拷贝对象保存的整数值,将这个拷贝转换为字符串,然后取出返回字符串指定索引上的字符 直接取出并返回给定索引上的字符 直接取出并返回给定索引上的字符

8.3 列表对象

列表对象的编码是ziplist或linkedlist。

使用ziplist时,每个压缩列表的节点保存了一个列表元素。使用linkedlist时,每个链表节点保存了一个字符串对象,而每个字符串对象都保存了一个列表元素。(字符串对象是Redis五种类型的对象中唯一一种会被嵌套的对象。)

编码转换

当列表对象同时满足以下两个条件时,使用ziplist编码:

  1. 保存的字符串对象的长度都小于64字节。
  2. 保存的元素数量小于512个。

否则就是用linkedlist编码。

以上两个条件的上限可以修改,使用list-max-ziplist-value选项和list-max-ziplist-entries选项。

列表命令的实现

命令 ziplist编码的实现 linkedlist编码的实现
LPUSH 调用ziplistPush函数,将新元素压入表头 调用listAddNodeHead函数,将新元素压入表头
RPUSH 调用ziplistPush函数,将新元素压入表尾 调用listAddNodeTail函数,将新元素压入表尾
LPOP 调用ziplistIndex定位表头节点,返回节点保存的元素后,调用ziplistDelete删除表头结点 调用lsitFrist定位表头节点,返回节点保存的元素后,调用listDelNode删除表头结点
RPOP 调用ziplistIndex定位表尾节点,返回节点保存的元素后,调用ziplistDelete删除表尾结点 调用listLast定位表尾节点,返回节点保存的元素后,调用listDelNode删除表尾结点
LINDEX 调用ziplistIndex 调用listIndex
LLEN 调用ziplistLen 调用listLength
LINSERT 插入新节点到表头或表尾时,使用ziplistPush;其他位置使用ziplistInsert 调用listInsertNode
LREM 遍历节点,调用ziplistDelete删除包含给定元素的节点 遍历节点,调用listDelNode删除包含给定元素的节点
LTRIM 调用ziplistDeleteRange函数删除不再指定索引范围内的节点 遍历节点,调用listDelNode
LSET 调用ziplistDelete,先删除给定索引上的节点,然后调用ziplistInsert插入新节点 调用listIndex函数,定位给定索引上的节点,然后通过赋值操作更新节点的值

8.4 哈希对象

哈希对象的编码可以是ziplist或hashtable。

使用ziplist时,每当有新的键值对要加入哈希对象时,程序先保将存了的压缩列表对象推入到表尾,然后再将保存了的节点推入到表尾。因此:

  1. 保存了同一键值对的两个节点总是挨在一起。
  2. 先添加的键值对会被放在表头,后添加的在表尾。

使用hashtable时,哈希对象中的每个键值对都使用一个字典键值对来保存:

  • 字典的每个键都是一个字符串对象,对象中保存了键值对的键。
  • 字典的每个值都是一个字符串独显,对象中保存了键值对的值。

编码转换

当哈希对象同时满足以下两个条件时,使用ziplist编码:

  1. 哈希对象保存的所有键值对的键和值的字符串长度都小于64字节。
  2. 哈希对象保存的键值对数量小于512个。

否则就使用hashtable编码。

以上两个条件的上限可以修改,使用hash-max-ziplist-value选项和hah-max-ziplist-entries选项。

哈希命令的实现

命令 ziplist编码的实现 hashtable编码的实现
HSET ziplistPush将元素压入表尾,然后再ziplistPush将值压入表尾 dictAdd添加新节点
HGET ziplistFind查找指定键对应的节点,再ziplistNext将指针移动到键节点旁边的值节点,返回直值节点 dictFind查找给定键,然后dictGetVal返回对应的值
HEXISTS ziplistFind查找指定键对应的节点 dictFind
HDEL ziplistFind,然后删除键节点和值节点 dictDelete
HLEN ziplistLen,然后除以2 dictSize
HGETALL 遍历ziplist,ziplistGet返回所有的键和值 遍历字典,dictGetKey返回键,dictGetVal返回值

8.5 集合对象

集合对象的编码可以使intset或hashtable。

  1. inset编码,集合对象的所有元素都被保存在整数集合中。

  2. hashtable编码,字典的每个键都是一个字符串对象,每个字符串对象都包含了一个集合元素,字典的值全部为NULL。

编码的转换

当集合对象同时满足一下两个条件时,使用inset编码:

  1. 所有元素都是整数值。
  2. 元素数量不超过512个。

第二个的上限修改,查看set-max-intset-entries选项。

集合命令的实现

命令 intset编码的实现 hashtable编码的实现
SADD intsetAdd dictAdd
SCARD intsetLen dictSize
SISMEMBER intsetFind dictFind
SMEMBERS 遍历集合,使用intsetGet返回元素 遍历字典,使用dictGetKey返回元素
SRANDMEMBER intsetRandom随机返回一个元素 dictGetRandomKey
SPOP intsetRandom,然后intsetRemove dictGetRandomKey,然后dictDelete
SREM intsetRemove dictDelete

8.6 有序集合的对象

有序集合的编码是ziplist或skiplist。

  1. ziplist编码:每个集合元素使用两个紧挨在一起的ziplist节点来存储。第一个节点保存元素的成员(member),第二元素保存元素的分值(score)。元素按分值的从小到大排序。
  2. skiplist编码:一个zset结构同时包含一个字典和一个跳跃表。跳跃表按分值从小到大保存了所有集合元素,每个跳跃表节点都保存了一个集合元素,节点的object保存了元素的成员,score保存了元素的分值。字典为有序集合创建了一个从成员到分值的映射,字典中的每个键值对都保存了一个集合元素,键保存了元素的成员,值保存了元素的分值。

编码的转换

有序集合满足以下两个条件时,使用ziplist编码:

  1. 元素数量小于128。
  2. 元素成员的长度小于64个字节。

两个条件的上限参考zset-max-ziplist-entries和zset-max-ziplist-value选项。

有序集合命令的实现

命令 ziplist编码的实现 zset编码的实现
ZADD ziplistInsert将成员和分值两个节点分别插入 zslInsert,将新元素插入跳跃表,然后dictAdd将新元素关联到字典
ZCARD ziplistLen,然后除以2 访问跳跃表的length
ZCOUNT 遍历列表,统计分值在给定范围内的节点的数量 遍历跳跃表
ZRANGE 从头到尾遍历 从头到尾遍历跳跃表
ZREVRANGE 从尾向头遍历 从尾向头遍历
ZRANK 从头到尾遍历,查找给定成员,并记录经过节点的数量 从头到尾遍历,查找给定成员,并记录经过节点的数量
ZREVRANK 从尾向头遍历,查找给定成员,并记录经过节点的数量 从尾向头遍历,查找给定成员,并记录经过节点的数量
ZREM 遍历,删除包含给定成员的节点及旁边的分值节点 遍历跳跃表,删除节点,并在字典中解除被删除元素的成员和分值的关联
ZSCORE 遍历查找成员节点,返回旁边的分值节点 从字典中取出给定成员的分值

8.7 类型检查与命令多态

在执行一个类型特定的命令之前,Redis会先检查输入键的类型是否正确,然后再决定是否执行。类型检查是通过redisObject的type属性来的。

除此之外,Redis还会根据值对象的编码方式,选择正确的实现命令来执行。这就是多态。

LLEN命令的执行过程:

8.8 内存回收

Redis为对象系统构建了一个引用计数垃圾回收。每个对象的引用计数由redisObject结构的refcount保存。

操作 引用计数的变化
创建一个新对象 初始化为1
对象被一个新程序使用 +1
对象不再被一个程序使用 -1

当计数变为0时,对象占用的内存就会被释放。

8.9 对象共享

refcount还可用于对象共享:

  1. 将数据库键的值指向现有的值对象。
  2. refcount++。

Redis在初始化服务器时,创建了10000个字符串对象,包含0 ~ 9999的所有整数值,用于共享。

数量通过redis.h/REDIS_SHARED_INTSETGERS常量控制。

使用OBJECT REFCOUNT可查看值对象的引用计数。

但Redis只对包含整数值的字符串对象共享。即只有共享对象和目标对象完全相同的情况下。一个共享对象保存的值越复杂,验证共享对象和目标对象是否相同的操作也就越复杂。

8.10 对象的空转时长

redisObject最后一个属性lru,记录了对象最后一次被访问的时间,用OBJECT IDLETIME可查看。

如果服务器打开了maxmemory属性,lru对象可用于回收内存。

导航

目录

上一章:7. 压缩列表

下一章:9. 数据库