mysql 索引底层详解

mysql三层架构

+--------------+
| 客户端 |
+--------------+
↓
+--------------+
| 服务端 |
+--------------+
↓
+--------------+
| 存储引擎 |
+--------------+

mysql server层结构

当客户端需要查询一条sql时，在server端内部走了以下4步

+--------------+
| 连接器 |
+--------------+
↓
+--------------+
| 分析器 |
+--------------+
↓
+--------------+
| 优化器 |
+--------------+
↓
+--------------+
| 执行器 |
+--------------+

索引的作用

加快数据的访问将随机io变成顺序io大大减少了服务器需要扫描的数据量帮助服务器避免排序和临时表减少io次数，提高磁盘寿命

索引缺点

加了索引之后查询会更快，但是当数据量大的时候，增删改就会变慢；因为每次修改数据时除了数据本身，数据库还需要维护索引的那颗B+树；

一张表最多能建多少个列和索引

innoDB: 最多创建1017列, 最多64个二级索引,加上主键有65个，单个索引最多包含16列, 索引最大长度767字节(其实行格式为REDUNDANT,COMPACT最高为767字节,但行格式为DYNAMIC,COMPRESSED最高可达为3072字节), 行大小最大65536字节mysiam: 最多4096列, 最多64个二级索引, 单个索引最多包含16列, 索引最大长度1000字节, 行大小最大65536字节

一级索引和二级索引

一级索引：索引和数据存储在一起，都存储在同一个B+tree中的叶子节点。一般主键索引都是一级索引。主键就是聚簇索引，一个表就一个主键，一个表也就一个聚簇索引，所以综上所述，主键 = 一级索引 = 聚簇索引二级索引：二级索引树的叶子节点存储的是主键而不是数据。也就是说，在找到索引后，得到对应的主键，再回到一级索引中找主键对应的数据记录。在innodb中，所有的二级索引B+树都指向一级索引的key值，所以查询二级索引时需要回表才能查到一整行数据；

索引是存储在内存还是磁盘的

索引都是存储在磁盘里面的，因为需要持久化存储，内存里也有，但都是每次查询时从磁盘加载到内存里的

有或者无索引的情况下是怎么查找数据的？

无索引：没有索引的情况下，都会全表扫描，就是一条条地找，这无疑效率不高，又费io；
有索引：有索引的情况下，会为这个索引生成一颗B+树，有了这颗树的帮助，查询数据的效率会提升几千倍；

查询比较慢，一般卡在哪？

卡在io上，就是input和output，解决方案是提高io效率，减少io的次数，减少io的量：尽可能地查询减少查询的数据，尽量避免用select * from xxx

去磁盘读取数据的时候，是用多少读取多少吗？

肯定不是啦，mysql和磁盘交互的时候是以页为单位进行传输的，默认情况下，每页大小为16K，，就像我们在电脑上新建一个txt文件，里面什么内容都没有，但它还是占用了4KB，mysql也一样，有自己的最小页大小，可通过 innodb_page_size 参数观看数据页大小

mysql> show variables like 'innodb_page_size';
+------------------+-------+
| Variable_name | Value |
+------------------+-------+
| innodb_page_size | 16384 |
+------------------+-------+

很重要的概念：局部性原理

数据和程序都有狙击成群的倾向，同时之前被访问过的数据很可能再次被查询，空间局部性、时间局部性磁盘预读内存跟磁盘交互时，一般情况下有一个最小的逻辑单元，称之为页（datapage），页的大小由系统决定，一般是4k或8k，并且一定是整数倍的，4、8、16、32、64、128… 数据交互时，可以去页的整数倍来进行读取，innodb存储引擎，每次读取数据都是16k

索引为什么能加快查询

要解决这个问题，我们就得先知道索引是怎么存储的

索引是怎么存储的？

一个索引对应一个B+树，如果一张表建了10个索引，那就会有10个B+树，

OLAP联机分析处理—数据仓库–hive
对海量历史数据进行分析，产生决策性的影响

OLTP联机事务处理–关系型数据库
要求在很短的时效内返回对用的数据

为什么用B+树来存储索引？

hash索引不适合用来做数据库的结构，

如果是单个等值值查询（通过key查找value），那么就会非常快，不支持范围查询，进行范围查询时，必须要挨个遍历对内存的要求比较高，哈希冲突会造成数据散列不均匀，会产生大量的线性查询，很浪费时间

在mysql中有没有hash索引

答：有

memory存储引擎使用的是hash索引innodb支持自适应hash，就是由mysql来决定使用hash还是树来存储，人工无法干预

存储引擎的分类

innodb ：持久化 + 内存memory ：只存储在内存，不支持持久化，断电就没了，结构是hash表myisam ：持久化
可以在建表是自己指定存储引擎，就像这样create table (id bigint(20) primary key ,name varchar(10)) engine='innodb';

MySQL5.5版本之前，默认内置存储引擎是Myisam，
MySQL5.5版本之后，MySQL的默认内置存储引擎已经是InnoDB，

树的分类

二叉树BST树（binary search tree）必须保证顺序AVL树平衡二叉树，有序红黑树B树B+树在很早很早很早很早以前，索引是用用二叉树实现的，大概是2点几版本的二叉树本身是无序的，所以发展出了有序的BST树，BST在插入数据的时候必须保证有序，左子树必须小于根节点，右子树必须大于根节点；bst树插入时如果是连续递增或递减顺序的话，就会退化成链表，所以衍生出了会旋转的平衡二叉树avl，avl树插入慢，查询快，因为插入的时候为了保证平衡，需要进行旋转操作，平衡二叉树有一个条件，为了保证平衡，最短子树和最长子树的长度差不能超过1，所以会经常要旋转，旋转也是需要性能开销的。所以平衡二叉树只能用于插入少、查询多的数据，当我们的查询和插入一样多情况下，使用平衡二叉树就不合适了，所以这时候又衍生出了一种新的数据结构：红黑树红黑树最长子树只要不超过最短子树的2倍即可，但是随着数据的插入，发现树的深度会变深，树的深度越深，意味着io次数越多，就会影响数据读取的效率；所以为了解决这个问题，就需要把有序的二叉树，变成有序的多叉树，这就是B树B树中每层都存储数据，但是每个磁盘块能存储的内容是有限的，除了索引之外，还要存储数据，而数据占用的空间更多，这就使得能存储的索引变少了，如果想要插入更多的数据，就得在加一层，变成四层，但是这样会增加io量，所以为了解决这个问题，衍生出了B+树；B+树只在叶子节点储存数据，非叶子层只存储索引，并且B+树不但可以从上往下查找，还可以从下往上查找数据；

聚簇索引和非聚簇索引的区别

innodb只能有一个聚簇索引，但是有很多的非聚簇索引

聚簇索引：数据和索引是放在一起的，就是聚簇索引，就像这样+----------+
| 索引值 |
+----------+
| 数据 |
+----------+
非聚簇索引：数据和索引是分开存放的，在B+树中索引值对应的是文件地址，就是非聚簇索引，可以肯定的是，所有的非聚簇索引都指向了聚簇索引，就像这样+------------+
| 索引值 |
+------------+
|数据文件地址|
+------------+

innodb中，如果id是主键，后面我把name字段添加为索引，这棵树是怎么样存储的？

一开始我的主键是id字段，那么在B+树中叶子节点的结构是这样的

+----------+
|主键索引值|
+----------+
| 数据 |
+----------+

这时候我又把name字段设置为索引了，这时候mysql为这个name索引也创建一颗B+树，这颗树的叶子节点存的就不是数据了，如果存数据的话会造成冗余，所以这个name索引树存的是主键id，就像这样

+----------+
| ye |
+----------+
/ \
+----------+ +----------+
| xin | | dong |
+----------+ +----------+
| 主键id | | 主键id |
+----------+ +----------+

innodb插入数据时必须要包含一个索引的key值

向innodb插入数据的时候，必须要包含一个索引的key值，这个索引的key值，可以是主键，如果没有主键，就是唯一键，如果没有唯一键，那么就是一个自生成的6字节的rowid；

myisam用的都是非聚簇索引；innodb只有一个聚簇索引，有多个非聚簇索引；

什么是存储引擎

索引的创建跟存储引擎是挂钩的，存储引擎表示不同的数据在磁盘存储的文件格式也是不同的。
mysql常用的存储引擎有三个

memory ：内存级别的存储引擎，不支持持久化，断电丢失数据，hash索引myisam ： mysql 5.5之前默认的存储引擎，每次修改数据都会锁表，不支持事务innodb ： mysql 5.5之后默认的存储引擎，支持事务、行锁；

mysql会自动创建索引嘛

innodb只能有一个聚簇索引，但是有很多的非聚簇索引，向innodb插入数据的时候，必须要包含一个索引的key值，这个索引的key值，可以使主见，如果没有主键，就是唯一键，域名交易平台如果没有唯一键，那么就是一个自生成的6字节的rowid；

为什么只能有一个聚簇索引

因为主键只有一个，聚簇索引对应的就是主键字段，只有主键的索引B+树才会存储数据，其他的二级索引存储的都是主键的值；

如果每个二级索引树都存储数据的话，就会造成数据的冗余；

myisam和innodb区别

myisam支持表锁，innodb支持表锁和行锁myisam不支持外键，innodb支持外键myisam不支持事务，innodb支持事务在计算机内存足够的情况下，innodb效率比myisam高，因为innodb是优先读缓存， myisam是直接从磁盘读取数据

数据存储在哪个目录

数据存储在：你的mysql目录/data/db1/ 目录下，

其中，

后缀为.opt的文件是一个配置文件，指定该数据库的字符集编码后缀为.frm的文件就是表结构后缀为.idb表示当前表用的存储引擎是innodb后缀为.myd是数据文件。使用的存储引擎是myisam后缀为.myi是索引文件，使用的存储引擎是myisam

索引监控

查询语句为：show status like ‘Handler_read%’;

结果说明：

Handler_read_first 代表读取索引头的次数，如果这个值很高，说明全索引扫描很多。

Handler_read_key：代表一个索引被使用的次数，如果我们新增加一个索引，然后通过这个索引来查询数据，，可以查看Handler_read_key是否有增加，如果有增加，说明sql用到索引。这个数量越大越好，大表示索引查询使用的比较多；

Handler_read_next：代表读取索引的下列，按(主)键顺序依次读取之后的N行

Handler_read_last : 从(主)键的最后位置开始读取

Handler_read_prev：代表读取索引的上列，一般发生在ORDER BY … DESC。

Handler_read_rnd：代表在固定位置读取行，如果这个值很高，说明对大量结果集进行了排序、进行了全表扫描、关联查询没有用到合适的KEY。

Handler_read_rnd_next：代表进行了很多表扫描，查询性能低下。

MySQL索引之底层结构学习

2020-08-18

541

本文是MySQL索引之底层结构学习，希望帮助到大家。

MySQL进阶学习：详解创建高效且合适索引的方法

2021-09-30

本篇文章是MySQL的进阶学习，带大家详细了解一下创建更合适索引的方法，希望对大家有所帮助！

ps如何解锁索引图层

2020-06-17

1780

ps解锁索引图层的方法是：1、点击顶部工具栏中的【图像】选项；2、在弹出的选项列表中，点击【模式】选项；3、在弹出的菜单中，点击【RGB颜色】选项即可。

详解MySQL索引的底层实现原理

2021-04-27

382

MySQL支持诸多存储引擎，而各种存储引擎对索引的支持也各有不同，因此MySQL数据库支持多种索引类型，如BTree索引，B+Tree索引，Hash索引，全文索引等等。

深入了解MySQL中的索引（用处、分类、匹配方式）

2021-09-28

本篇文章带大家深入了解MySQL中的索引，介绍一下索引的优点、用处、分类、技术名词以及匹配方式，希望对大家有所帮助！

hive和mysql的区别是什么

2021-03-01

区别：1、Mysql采用了SQL语言，Hive采用了类SQL的查询语言HQL。2、Hive不支持数据的改写和添加，Mysql支持。3、Hive无索引，MySQL有索引。

解决Mysql 5.6 "隐式转换"导致的索引失效和数据不准确的问题

2020-12-07

834

这篇文章主要介绍了Mysql 5.6 “隐式转换”导致的索引失效和数据不准确的问题,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下

详解MySQL 索引+explain

2020-11-27

2147

本栏目今天着重介绍索引+explain，为需要面试的准备。

整理MySQL的索引

2021-04-13

253

MySQL索引的建立对于MySQL的高效运行是很重要的，索引可以大大提高MySQL的检索速度。本栏目将详细整理介绍MySQL的索引，有需要的朋友可以看看。

一篇文章让你搞懂MYSQL底层原理

2020-11-10

716

MYSQL底层内容丰富多彩，本文详细介绍相关内容。

介绍重要知识点：InnoDB的插入缓冲

2020-10-30

787

今天我们的主题就是插入缓冲（Insert Buffer）,由于InnoDB引擎底层数据存储结构式B+树，而对于索引我们又有聚集索引和非聚集索引。

详解MySql 整体结构

2021-04-08

635

MySQL 由连接池、SQL 接口、解析器、优化器、缓存、存储引擎等组成，可以分为三层，即 MySQL Server 层、存储引擎层和文件系统层；本栏目详细介绍MySql的整体结构，有需要的朋友可以看看

详解MySQL如何创建索引（案例）

2021-03-24

mysql数据库栏目介绍如何练习创建索引，有需要的朋友可以看看，方法简明，还有几个注意的点提供给大家，希望可以帮助到大家。

新鲜出炉的PHP高级面试题来啦！【附答案】

2020-07-22

2005

2.你刚才一直在提索引，把你知道的关于索引的一些技巧说下？3.索引底层是什么数据结构？4.为什么用的是B+树，不能使用红黑树或者其他的？5.你知道索引下推吗？

实例介绍MySQL索引的使用

2020-12-11

1298

mysql教程栏目实例讲解MySQL索引的使用，讲解案例多，有需要的朋友可以看看。

mysql怎么显示无效了

2020-11-03

217

mysql显示无效的原因及解决办法：1、将or条件中的所有列都加上索引；2、like查询以“％”开头用不上索引；3、隐式转换会使索引失效；4、查询条件使用函数在索引列表上或者在索引列上使用“＋－”等运算符

我所理解的MySQL之二：索引

2020-10-21

965

mysql教程栏目今天介绍相关索引知识。

详解PHP底层运行机制与工作原理

2020-08-04

1045

这篇文章主要介绍了PHP底层运行机制与工作原理，文中通过图文介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧。

深入理解MySQL索引原理及实现，快速检索数据库

2021-02-07

361

索引是一个排序的列表，在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址 (类似于C语言的链表通过指针指向数据记录的内存地址)

Python 异常处理机制详解

2020-07-23

948

这篇文章主要介绍了通过实例了解Python异常处理机制底层实现,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

全部评论

关注公众号QQ交流群