您现在的位置是：网站首页> 编程资料编程资料

图文并茂地讲解Mysql索引(index)_Mysql_

2023-05-26 504人已围观

简介图文并茂地讲解Mysql索引(index)_Mysql_

本篇文章相对来说篇幅较长，不是一会半会能看完的，建议您收藏起来慢慢看，关于索引的相关知识基本上都记录全了，通过这一篇文章足以让您的Mysql知识更上一层楼！

索引（index）是帮助MySQL高效获取数据的数据结构(有序)。在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查找算法，这种数据结构就是索引。

想要学习好索引，那么就一定要掌握mysql的数据结构，其实在一提到数据结构，对于基础较差的来说，有时候是非常头疼的，不过在这里大家完全不用担心，接下来也会重点讲解数据结构，尽量会以白话文的形式叙述每一个数据结构！！！

在这里我们主要演示不使用索引和使用索引的区别到底有多大。

表结构及其数据如下：

假如我们要执行的SQL语句为： select * from user where age = 45;

（1）无索引情况

在无索引情况下，就需要从第一行开始扫描，一直扫描到最后一行，我们称之为全表扫描，性能很低。可能有的人该说了，明明在id为7的数据已经找到age为45的数据，为什么还是全表扫描呢？

因为对于mysql当中他并不知道后面是否还存在age为45的数据，所以他会不落下任何一条数据！

（2）有索引情况

如果我们针对于这张表的age字段建立了索引，假设索引结构就是二叉树，那么也就意味着，会对age这个字段建立一个二叉树的索引结构。而这个二叉树当中每个节点存储了真正数据的位置，我们只要在树当中找到了对应的age就意味着找到了真正的数据！

如下图：当查找age为45的时候，这时候会从根节点开始判断，根节点为36，比36大所以开始走右边的节点，光这一下子直接排除掉树的左边数据，然后又进行判断比48小，这时候走左边节点，然后就找到了，只需要扫描三次就可以找到数据了，极大的提高的查询的效率。

不管是二叉树还是B+树，一定都是有顺序的，他都是在新增数据的时候，根据数据的大小进行了排序然后分叉。也正因为如此，所以提高了查询速度！

备注：这里我们只是假设索引的结构是二叉树，介绍一下索引的大概原理，只是一个示意图，并不是索引的真实结构，索引的真实结构，后面会详细介绍。

降低数据库的IO，什么是IO？

IO就是所谓的流，流又分为了读和写，当我们想要从文件当中找数据就需要读，当需要修改文件的时候就需要写，Mysql最终存储的数据都是在磁盘文件当中，那么我们想要找一条数据，怎么办呢？

先想想我们现实当中想要在一个文件找有没有哪个数据是怎么找的呢，直接打开文件，然后全局搜索，假如文件比较大的话，搜索也会有点卡顿。mysql他跟我们可不一样，我们那属于是人家windows系统给我们提供了这种便捷，我们可以直接打开文件，然后进行搜索。

mysql假如是全表扫描，首先需要从数据文件当中将这张表的数据给全部读取到内存，然后再进行判断哪个数据是符合条件的。其中这也考验到了我们电脑的读的能力，当然越高配置的电脑读取速度越快。

假如加了索引，我们只需要将索引给读取出来，因为索引他指向了数据在文件上的地址。所以只需要找到对应数据的索引，然后通过索引获取到数据的位置，再从数据文件当中将这条数据给读取出来即可，也因此降低了IO成本。

如果数据集都读取到内存，假如电脑内存只有16G，而这张表有200G，一旦全表扫描，电脑岂不是直接挂掉了？

实际上，服务端并不需要保存一个完整的结果集。取数据和发数据的流程是这样的：

获取一行，写到 net_buffer 中。这块内存的大小是由参数 net_buffer_length 定义的，默认是 16k。
重复获取行，直到 net_buffer 写满，调用网络接口发出去。
如果发送成功，就清空 net_buffer，然后继续取下一行，并写入 net_buffer。
如果发送函数返回 EAGAIN 或 WSAEWOULDBLOCK，就表示本地网络栈（socket send buffer）写满了，进入等待。直到网络栈重新可写，再继续发送。

所以我们在使用过程，基本上不可能会因为mysql查询数据而导致服务器内存爆满，mysql主要是占用我们服务器的IO。