intset 是 Redis 实现 Set 的底层实现之一,当集合元素不大于设定值并且元素都是整数时,就会用 intset 作为 Set 的底层数据结构。
它有如下几个特点:
- 元素类型只能为数字
- 元素有三种类型:int16_t、int32_t、int64_t
- 元素有序且不可重复
- 和 SDS 一样,intset 也是内存连续的,就像数组一样
下面是数据结构的定义:
typedef struct intset {
// 编码类型 int16_t、int32_t、int64_t
uint32_t encoding;
// 长度 最大长度:2^32
uint32_t length;
// 数组,元素
int8_t contents[];
} intset;
- encoding:为 intset 的编码方式,一共有三种类型,分别对应不同的范围:
编码方式 | 范围 |
---|---|
int16_t | -32768~32767 |
int32_t | -2147483648~2147483647 |
int64_t | -2^63 ~ 2^63-1 |
intset的编码由最大的那个数决定,如果有一个数是 int64_t,那么整个 intset 的编码都是 int64_t。在向 intset 中添加元素时,会存在一个元素升级的过程。
- length:intset 中整数的个数。
- contents[]:整数数组。intset 中的每个元素都是 contents 数组的一个数组项,各个项在数据中都是按照值从小到大有序的排列且不存在重复项。虽然 contents[] 声明为 int8_t,但 contents 数组并不保存任何 int8_t 类型的值,contents 数组真正的类型由 encoding 决定。
intset 内存是连续的,所有数据的增删改查操作都是在内存地址偏移的基础上进行的,并且整数的保存也是有序的,下图是一个包含有 5 个元素的 intset:
每当我们要将一个新元素添加到 intset 里面时,如果新元素的类型比集合里面所有元素的类型都要长时,那么 intset 需要新进行升级,然后才能将新元素添加到 intset 中。例如有一个 intset 里面的元素都是 int16_t 类型,这时新添加一个元素的类型为 int32_t,那么这个时候需要先将 intset 里面所有的元素全部升级为 int32_t 然后再添加元素。
升级 intset 并添加新元素共分为三个步骤进行:
- 根据新元素的类型,扩展 intset 底层数组的空间大小,并为新元素分配空间
- 将底层数组现有的所有元素都转换成与新元素相同的类型,并将类型转换后的元素放置在正确的位上,而且在放置元素的过程中,需要继续维持底层数据的有序性
- 将新元素添加到底层数组里面
以上面的图为例。开始是 int16_t,各元素位置如下:
现在我们增加一个元素 65535,这是一个 int32_t 的元素,所以需要扩展空间大小。一个 int32_t 占用 32 位空间,6 个元素一共占用 192 位空间,所以需要扩展的空间大小为 112,如下图:
已经重新扩展了空间,然后需要将员原来元素放在正确的位上,得到下图:
最后添加新元素:
然后程序将 encoding 属性的值从 INTSET_ENC_INT16 改成 INTSET_ENC_INT32,length 从 5 该为 6 ,如下:
intset 的升级会带来两个好处:
- 提升 intset 的灵活性
- 尽可能地节约内存
intset 不支持降级操作,一旦进行升级,编码就会一直保持升级后的状态。
关于 intset 的源码就不多做阐述了,有兴趣的小伙伴可以自己查看。
参考
- 《Redis 设计与实现》
Java 面试宝典是大明哥全力打造的 Java 精品面试题,它是一份靠谱、强大、详细、经典的 Java 后端面试宝典。它不仅仅只是一道道面试题,而是一套完整的 Java 知识体系,一套你 Java 知识点的扫盲贴。
它的内容包括:
- 大厂真题:Java 面试宝典里面的题目都是最近几年的高频的大厂面试真题。
- 原创内容:Java 面试宝典内容全部都是大明哥原创,内容全面且通俗易懂,回答部分可以直接作为面试回答内容。
- 持续更新:一次购买,永久有效。大明哥会持续更新 3+ 年,累计更新 1000+,宝典会不断迭代更新,保证最新、最全面。
- 覆盖全面:本宝典累计更新 1000+,从 Java 入门到 Java 架构的高频面试题,实现 360° 全覆盖。
- 不止面试:内容包含面试题解析、内容详解、知识扩展,它不仅仅只是一份面试题,更是一套完整的 Java 知识体系。
- 宝典详情:https://www.yuque.com/chenssy/sike-java/xvlo920axlp7sf4k
- 宝典总览:https://www.yuque.com/chenssy/sike-java/yogsehzntzgp4ly1
- 宝典进展:https://www.yuque.com/chenssy/sike-java/en9ned7loo47z5aw
目前 Java 面试宝典累计更新 400+ 道,总字数 42w+。大明哥还在持续更新中,下图是大明哥在 2024-12 月份的更新情况:
想了解详情的小伙伴,扫描下面二维码加大明哥微信【daming091】咨询
同时,大明哥也整理一套目前市面最常见的热点面试题。微信搜[大明哥聊 Java]或扫描下方二维码关注大明哥的原创公众号[大明哥聊 Java] ,回复【面试题】 即可免费领取。