千家信息网

MySQL索引底层数据结构怎么理解

发表于:2025-01-20 作者:千家信息网编辑
千家信息网最后更新 2025年01月20日,这篇文章主要介绍"MySQL索引底层数据结构怎么理解",在日常操作中,相信很多人在MySQL索引底层数据结构怎么理解问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"MyS
千家信息网最后更新 2025年01月20日MySQL索引底层数据结构怎么理解

这篇文章主要介绍"MySQL索引底层数据结构怎么理解",在日常操作中,相信很多人在MySQL索引底层数据结构怎么理解问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"MySQL索引底层数据结构怎么理解"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

一、索引类型

1.B+树

为什么是B+树而不是B树?

首先看看B树和B+树在结构上的区别

B树结构:

B+树:

可以看到:

  • B树在每个节点上都有卫星数据(数据表中的一行数据),而B+树只在叶子节点上有卫星数据。这意味着相同大小的磁盘扇区,B+树可以存储的叶子节点更多,磁盘IO次数更少;同样也意味着B+树的查找效率更稳定,而B树数据查询的最快时间复杂度是O(1)。

  • B树的每个节点只出现一次,B+树的所有节点都会出现在叶子节点中。B+树的所有叶子节点形成一个升序链表,适合区间范围查找,而B树则不适合。

2.MyISAM和InnoDB的B+树索引实现方式的区别(聚簇索引和非聚簇索引)?

首先需要了解聚簇索引和非聚簇索引。

聚簇索引:

在聚簇索引中,叶子页包含了行的全部数据,节点页值包含索引列。InnoDB通过主键聚集数据,如果没有定义主键则选择一个唯一的非空索引列代替;如果没有这样的索引,InnoDB会隐式定义一个主键来作为聚簇索引。

聚簇索引的数据分布:

在聚簇索引中,除了主键索引,还有二级索引。二级索引中的叶子节点存储的不是"行指针",而是主键值,并以此作为指向行的"指针"。这意味着通过二级索引查找行,存储引擎需要找到二级索引的叶子节点获得对应的主键值,然后根据这个值去聚簇索引中查找对应的行,也称为"回表"。当然,可以通过覆盖索引避免回表或者InnoDB的自适应索引能够减少这样的重复工作。

注意:聚簇索引中每一个叶子节点不止包含完整的数据行,还包括事务ID、用于事务和MVCC的回滚指针。

3.非聚簇索引

非聚簇索引的主键索引和二级索引在结构上没有什么不同,都在叶子节点上存储指向数据的物理地址的"行指针"。

聚簇索引的主键索引和二级索引:

非聚簇索引的主键索引和二级索引:

4.聚簇索引的优缺点

优点:

把相关数据保存在一起(比如用用户ID把用户的全部邮件聚集在一起),否则每次数据读取就可能导致一次磁盘IO
数据访问更快,把索引和数据保存在同一个B+树中,通常在聚簇索引中获取数据比在非聚簇索引中查找更快
使用覆盖查询可以直接利用页节点中的主键值

缺点:

如果所有数据都可以放在内存中,顺序访问不再那么必要,聚簇索引没有优势
插入速度依赖于插入顺序,随机插入会导致页分裂,造成空洞,使用OPTIMIZE TABLE重建表
每次插入、更新、删除都需要维护索引的变化,代价很高
二级索引可能比想象中大,因为在节点中包含了引用行的主键列

5.哈希索引

哈希索引基于哈希表实现,只有精确匹配索引所有列的查询才有效,这意味着,哈希索引适用于等值查询。

具体实现:对于每一行数据,存储引擎都会对所有的索引列计算一个哈希码,哈希索引将所有的哈希码存储在索引中,同时在哈希表中保存指向每个数据行的指针。

在MySQL中,只有Memory引擎显式支持哈希索引,当然Memory引擎也支持B树索引。

注意:Memory引擎支持非唯一哈希索引,解决冲突的方式是以链表的形式存放多个哈希值相同的记录指针。

6.自适应哈希索引

InnoDB注意到某些索引值被使用得非常频繁时,会在内存中基于B+树索引之上再创建一个哈希索引,这样就让B+树索引也具有哈希索引的一些优点,比如快速的哈希查找。

到此,关于"MySQL索引底层数据结构怎么理解"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!

索引 数据 哈希 节点 叶子 结构 指针 存储 引擎 底层 数据结构 意味 学习 查询 指向 更多 磁盘 支持 相同 一行 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 海南网络技术学校 我国主要全文数据库有哪些 常见车型的技术数据库 中国网络安全法几个原因促成 网络安全漂亮绘画 网龙虚拟实验室软件开发 成都网络安全签约项目 万律法律数据库 前端页面访问数据库的过程 数据库查询1000万条数据 中国中小学生网络安全教育 在国内弄服务器给国外 科幻刀片服务器 车辆打印后显示数据库连接失败 网吧服务器可以搬回家吗 软件维护属于软件开发阶段吗 公安网络安全标语 天津易狐网络技术有限公司 网络安全为人民相关的歌曲 计算机网络技术教学课程视频 服务器主要做什么用 网络安全文明家园 阿里云海量数据库 甘肃东塔安全学院网络安全培训 长宁区会计网络技术要多少钱 惠普DS25服务器网络抓包 网络安全的毕业论文10000字 推特网络安全分享 网络安全周法制日活动 黄浦区媒体软件开发服务大概费用
0