回答
正如图书的目录用于检索,数据库索引是为了提高数据查询效率。
MySQL 的默认存储引擎是 InnoDB,它支持两种索引结构:B+ 树索引和 HASH 索引。
在 InnoDB 中, B+ 树作为默认的索引结构。
- 数据结构上,B+ 树是二叉树的升级版,它是一颗多路平衡查找树。
- 数据存储上,B+ 树非叶子节点只存放键,不存放值;叶子节点同时存放键和值。
- B+ 树叶子节点间通过链表相连。
- 相较于 B 树,B+ 树由于只有叶子节点存储数据,其他节点仅保存索引键和指针,那么相同磁盘块大小下,B+ 树可以存储更多的节点数据,树的高度也就降低了,对应查询效率就快。
- 由于 B+ 树所有数据都存放在叶子节点,且它是一颗自平衡树,故其数据的整体查询会更稳定,接近于二分查找。
扩展
B+树索引
B+ 树是多路平衡查找树,也就是树的每个节点有多个子节点,子节点之间的大小保证从左到右递增,并且各个子树间高度差不超过1,它是 B 树的升级版。
在 MySQL 中,索引是在存储引擎层实现,不同的存储引擎中相同类型的索引底层实现也可能不同。在InnoDB 引擎中, B+ 树索引的非叶子节点仅存储键值,而叶子节点存储键值和数据。并且叶子节点间使用双向指针连接,形成一个双向有序链表。
Hash 索引
哈希表是一种以键-值(key-value)存储数据的结构,当输入键(key),就可以找到对应的值(value)。哈希的底层实现是将值放在数组里,通过哈希函数把 key 换算成一个确定位置,然后把 value 放在数组的这个位置。
对于哈希冲突,即多个 key 值经过哈希函数换算出现同一个值的情况,MySQL 采用拉链表来解决
对比
- Hash 索引在等值查询上效率比 B+ 树索引高
- B+ 树支持范围查询,Hash 索引不能
- B+ 树索引支持 order by 排序,Hash 索引不能
- B+ 树支持最左前缀原则(联合索引的最左 N 个字段或字符串索引的最左 M 个字符),Hash 索引不能
- 在索引维护场景,B+ 树索引(插入、更新和删除数据可能导致页分裂或页合并)效率不及 Hash 索引
- 相比二叉树,B+ 树是多叉树,对磁盘访问模式适配更优(表数据存储在磁盘,相同磁盘数据块大小存储数据,B+ 树层数更低,搜索查找时可大大减少磁盘 IO 开销)
总体来看, B+ 索引在等值查询性能上低于 Hash 索引,前者的时间复杂度为 O(log(N)),而后者的时间复杂度为 O(1)。但其支持范围查询、排序、联合索引等丰富场景以及保证更为稳定的查询性能,是一个合适的索引结构。在 InnoDB 引擎中,B+ 树索引作为默认的索引结构。
Java 面试宝典是大明哥全力打造的 Java 精品面试题,它是一份靠谱、强大、详细、经典的 Java 后端面试宝典。它不仅仅只是一道道面试题,而是一套完整的 Java 知识体系,一套你 Java 知识点的扫盲贴。
它的内容包括:
- 大厂真题:Java 面试宝典里面的题目都是最近几年的高频的大厂面试真题。
- 原创内容:Java 面试宝典内容全部都是大明哥原创,内容全面且通俗易懂,回答部分可以直接作为面试回答内容。
- 持续更新:一次购买,永久有效。大明哥会持续更新 3+ 年,累计更新 1000+,宝典会不断迭代更新,保证最新、最全面。
- 覆盖全面:本宝典累计更新 1000+,从 Java 入门到 Java 架构的高频面试题,实现 360° 全覆盖。
- 不止面试:内容包含面试题解析、内容详解、知识扩展,它不仅仅只是一份面试题,更是一套完整的 Java 知识体系。
- 宝典详情:https://www.yuque.com/chenssy/sike-java/xvlo920axlp7sf4k
- 宝典总览:https://www.yuque.com/chenssy/sike-java/yogsehzntzgp4ly1
- 宝典进展:https://www.yuque.com/chenssy/sike-java/en9ned7loo47z5aw
目前 Java 面试宝典累计更新 400+ 道,总字数 42w+。大明哥还在持续更新中,下图是大明哥在 2024-12 月份的更新情况:
想了解详情的小伙伴,扫描下面二维码加大明哥微信【daming091】咨询
同时,大明哥也整理一套目前市面最常见的热点面试题。微信搜[大明哥聊 Java]或扫描下方二维码关注大明哥的原创公众号[大明哥聊 Java] ,回复【面试题】 即可免费领取。