MySQ中索引的实现方式
这篇文章主要介绍"MySQ中索引的实现方式",在日常操作中,相信很多人在MySQ中索引的实现方式问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"MySQ中索引的实现方式"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
首先,需要对相关背景知识进行了解:B-Tree & B+Tree、折半查找(Binary Search)、 数据库的性能问题和数据的基本存储结构。下面做简要分析:
1.B-Tree & B+Tree
http://en.wikipedia.org/wiki/B%2B_tree
http://en.wikipedia.org/wiki/B-tree
2.半查找(Binary Search)
http://en.wikipedia.org/wiki/Binary_search_algorithm
3.数据库的性能问题
① 磁盘IO性能非常低,严重的影响数据库系统的性能。
② 磁盘顺序读写比随机读写的性能高很多。
4.数据的基本存储结构
①磁盘空间被划分为许多大小相同的块(Block)或者页(Page).
② 一个表的这些数据块以链表的方式串联在一起。
③ 数据是以行(Row)为单位一行一行的存放在磁盘上的块中,如图所示.
④ 在访问数据时,一次从磁盘中读出或者写入至少一个完整的Block。
数据基本操作的实现
基本操作包括:INSERT、UPDATE、DELETE、SELECT。
1.SELECT
①定位数据
② 读出数据所在的块,对数据加工
③ 返回数据给用户
2.UPDATE、DELETE
①定位数据
②读出数据所在的块,修改数据
③写回磁盘
3.INSERT
①定位数据要插入的页(如果数据需要排序)
②读出要插入的数据页,插入数据.
③ 写回磁盘
如何定位数据?
4.表扫描(Table Scan)
从磁盘中依次读出所有的数据块,一行一行的进行数据匹配。
时间复杂度 是O(n), 如果所有的数据占用了100个块。尽管只查询一行数据,也需要读出所有100个块的数据。
需要大量的磁盘IO操作,极大的影响了数据定位的性能。
因为数据定位操作是所有数据操作必须的操作,数据定位操作的效率会直接影响所有的数据操作的效率。
因此我们开始思考,如何来减少磁盘的IO?
5.减少磁盘IO
减少数据占用的磁盘空间:压缩算法、优化数据存储结构
减少访问数据的总量:读出或写入的数据中,有一部分是数据操作所必须的,这部分称作有效数据。剩余的部分则不是数据操作必须的数据,称为无效数据。例如,查询姓名是‘张三’的记录。那么这条记录是有效记录,其他记录则是无效记录。我们要努力减少无效数据的访问。
到此,关于"MySQ中索引的实现方式"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!