2022-10-27 379
面试官说:工作这么久了,应该知道sql执行计划吧,讲讲Sql的执行计划吧!看了看面试官手臂上纹的大花臂和一串看不懂的韩文,吞了吞口水,暗示自己镇定点,整理了一下思绪缓缓的对面试官说:我不会面试官:。。。。,回去等通知吧我:%^&%$!@#
当我们工作到了一定的年限之后,一些应该掌握的知识点,我们是必须需要去了解的,比如今天面试官问的SQL执行计划当我们执行一条SQL的时候,可以直接对应的结果,但是你并不晓得,它会经历多深远黑暗的隧道,通过连接器、查询缓存、分析器、优化器、执行器重重筛选,才有可能展示到我们面前,有时候当你等待N长时间,但是展现的却是 timeout,这个时候想砸电脑的心都有了,不过当你看了今天的SQL执行计划后,你再也不用砸电脑了,看懂了这篇文章你就会知道这都不是事,让我们一起来揭晓这里面的奥妙
在实际的应用场景中,为了知道优化SQL语句的执行,需要查看SQL语句的具体执行过程,以加快SQL语句的执行效率。通常会使用explain+SQL语句来模拟优化器执行SQL查询语句,从而知道mysql是如何处理sql语句的。
官网地址: https://dev.mysql.com/doc/refman/5.5/en/explain-output.html
首先我们来下面的一条sql语句,其中会有 id、select_type、table等等这些列,这些就是我们执行计划中所包含的信息,我们要弄明白的就是这些列是用来干嘛的,以及每个列可能存在多少个值。
explainselect*fromemp;
贴心的小农已经把sql复制出来了,只需要放到数据库中执行即可,方便简单快捷 ——牧小农
SETFOREIGN_KEY_CHECKS=0; DROPTABLEIFEXISTS`dept`; CREATETABLE`dept`( `DEPTNO`intNOTNULL, `DNAME`varchar(14)DEFAULTNULL, `LOC`varchar(13)DEFAULTNULL, PRIMARYKEY(`DEPTNO`) )ENGINE=InnoDBDEFAULTCHARSET=utf8; INSERTINTO`dept`VALUES('10','ACCOUNTING','NEWYORK'); INSERTINTO`dept`VALUES('20','RESEARCH','DALLAS'); INSERTINTO`dept`VALUES('30','SALES','CHICAGO'); INSERTINTO`dept`VALUES('40','OPERATIONS','BOSTON'); DROPTABLEIFEXISTS`emp`; CREATETABLE`emp`( `EMPNO`intNOTNULL, `ENAME`varchar(10)DEFAULTNULL, `JOB`varchar(9)DEFAULTNULL, `MGR`intDEFAULTNULL, `HIREDATE`dateDEFAULTNULL, `SAL`double(7,2)DEFAULTNULL, `COMM`double(7,2)DEFAULTNULL, `DEPTNO`intDEFAULTNULL, PRIMARYKEY(`EMPNO`), KEY`idx_job`(`JOB`), KEY`jdx_mgr`(`MGR`), KEY`jdx_3`(`DEPTNO`), KEY`idx_3`(`DEPTNO`) )ENGINE=InnoDBDEFAULTCHARSET=utf8; INSERTINTO`emp`VALUES('7369','SMITH','CLERK','7902','1980-12-17','800.00',null,'20'); INSERTINTO`emp`VALUES('7499','ALLEN','SALESMAN','7698','1981-02-20','1600.00','300.00','30'); INSERTINTO`emp`VALUES('7521','WARD','SALESMAN','7698','1981-02-22','1250.00','500.00','30'); INSERTINTO`emp`VALUES('7566','JONES','MANAGER','7839','1981-02-02','2975.00',null,'20'); INSERTINTO`emp`VALUES('7654','MARTIN','SALESMAN','7698','1981-09-28','1250.00','1400.00','30'); INSERTINTO`emp`VALUES('7698','BLAKE','MANAGER','7839','1981-01-05','2850.00',null,'30'); INSERTINTO`emp`VALUES('7782','CLARK','MANAGER','7839','1981-09-06','2450.00',null,'10'); INSERTINTO`emp`VALUES('7839','KING','PRESIDENT',null,'1981-11-17','5000.00',null,'10'); INSERTINTO`emp`VALUES('7844','TURNER','SALESMAN','7698','1981-09-08','1500.00','0.00','30'); INSERTINTO`emp`VALUES('7900','JAMES','CLERK','7698','1981-12-03','950.00',null,'30'); INSERTINTO`emp`VALUES('7902','FORD','ANALYST','7566','1981-12-03','3000.00',null,'20'); INSERTINTO`emp`VALUES('7934','MILLER','CLERK','7782','1982-01-23','1300.00',null,'10'); DROPTABLEIFEXISTS`emp2`; CREATETABLE`emp2`( `id`intNOTNULLAUTO_INCREMENT, `empno`intDEFAULTNULL, PRIMARYKEY(`id`) )ENGINE=InnoDBAUTO_INCREMENT=3DEFAULTCHARSET=utf8; INSERTINTO`emp2`VALUES('1','111'); INSERTINTO`emp2`VALUES('2','222'); DROPTABLEIFEXISTS`salgrade`; CREATETABLE`salgrade`( `GRADE`intNOTNULL, `LOSAL`doubleDEFAULTNULL, `HISAL`doubleDEFAULTNULL, PRIMARYKEY(`GRADE`) )ENGINE=InnoDBDEFAULTCHARSET=utf8; INSERTINTO`salgrade`VALUES('1','700','1200'); INSERTINTO`salgrade`VALUES('2','1201','1400'); INSERTINTO`salgrade`VALUES('3','1401','2000'); INSERTINTO`salgrade`VALUES('4','2001','3000'); INSERTINTO`salgrade`VALUES('5','3001','9999'); DROPTABLEIFEXISTS`t_job`; CREATETABLE`t_job`( `id`intNOTNULLAUTO_INCREMENT, `job`varchar(9)CHARACTERSETutf8COLLATEutf8_general_ciDEFAULTNULL, PRIMARYKEY(`id`), KEY`j`(`job`) )ENGINE=InnoDBDEFAULTCHARSET=utf8;
select查询的序列号,包含一组数字,表示查询中执行select子句或者操作表的顺序
id号分为三种情况:
--左关联 explainselect*fromempeleftjoindeptdone.deptno=d.deptno; --右关联e explainselect*fromemperightjoindeptdone.deptno=d.deptno;
通过left join 和 right join 验证;id一样(注意执行计划的table列),left join 先扫描e表,再扫描d表;right join 先扫描d表,再扫描e表
explainselect*fromempewheree.deptno=(selectd.deptnofromdeptdwhered.dname='SALES');
在下面的表中回先查询 id 为 2的数据 也就是我们的 d表(注意:我们可以看到d表中select_type为 SUBQUERY 也就是子查询的 意思),然后根据d表中的deptno去查询 e表中的数据
3、id相同和不同的,同时存在:相同的可以认为是一组,从上往下顺序执行,在所有组中,id值越大,优先级越高,越先执行
explainselect*fromempejoindeptdone.deptno=d.deptnojoinsalgradesgone.salbetweensg.losalandsg.hisalwheree.deptno=(selectd.deptnofromdeptdwhered.dname='SALES');
在这里先从id为2的执行,如果id是一样的,就按照顺序执行
主要用来分辨查询的类型,是普通查询还是联合查询还是子查询
--simple:简单的查询,不包含子查询和union explainselect*fromemp;
--primary:查询中若包含任何复杂的子查询,最外层查询则被标记为Primary explainselect*fromempewheree.deptno=(selectd.deptnofromdeptdwhered.dname='SALES');
--union:若第二个select出现在union之后,则被标记为union explainselect*fromempwheredeptno=10unionselect*fromempwheresal>2000;
--dependentunion:跟union类似,此处的depentent表示union或unionall联合而成的结果会受外部表影响 explainselect*fromempewheree.empnoin(selectempnofromempwheredeptno=10unionselectempnofromempwheresal>2000);
--unionresult:从union表获取结果的select explainselect*fromempwheredeptno=10unionselect*fromempwheresal>2000;
--subquery:在select或者where列表中包含子查询 explainselect*fromempwheresal>(selectavg(sal)fromemp);
--dependentsubquery:subquery的子查询要受到外部表查询的影响 explainselect*fromempewheree.deptno=(selectdistinctdeptnofromdeptwheredeptno=e.deptno);
--DERIVED:from子句中出现的子查询,也叫做派生类, explainselect*from(selectenamestaname,mgrfromempwhereename='W'unionselectename,mgrfromempwhereename='E')a;
--UNCACHEABLESUBQUERY:表示使用子查询的结果不能被缓存 explainselect*fromempwhereempno=(selectempnofromempwheredeptno=@@sort_buffer_size);
--uncacheableunion:表示union的查询结果不能被缓存 explainselect*fromempwhereexists(select1fromdeptwhereemp.deptno=dept.deptnounionselect1fromdeptwheredeptno=10);
对应行正在访问哪一个表,表名或者别名,可能是临时表或者union合并结果集 1、如果是具体的表名,则表明从实际的物理表中获取数据,也可以是表的别名
explainselect*fromempwheresal>(selectavg(sal)fromemp);
2、表名是derivedN的形式,表示使用了id为N的查询产生的衍生表
explainselect*from(selectenamestaname,mgrfromempwhereename='WARD'unionselectenamestaname,mgrfromempwhereename='SMITH')a;
derived2 :表明我们需要从衍生表2中取数据
3、当有union result的时候,表名是union n1,n2等的形式,n1,n2表示参与union的id
explainselect*fromempwheredeptno=10unionselect*fromempwheresal>2000;
type显示的是访问类型,访问类型表示我是以何种方式去访问我们的数据,最容易想的是全表扫描,直接暴力的遍历一张表去寻找需要的数据,效率非常低下,访问的类型有很多,效率从最好到最坏依次是:
system>const>eqref>ref>fulltext>refornull>indexmerge>uniquesubquery>indexsubquery>range>index>ALL
一般情况下,得保证查询至少达到range级别,最好能达到ref
--all:全表扫描,一般情况下出现这样的sql语句而且数据量比较大的话那么就需要进行优化。 explainselect*fromemp;
--index:全索引扫描这个比all的效率要好,主要有两种情况,一种是当前的查询时覆盖索引,即我们需要的数据在索引中就可以索取,或者是使用了索引进行排序,这样就避免数据的重排序 explainselectempnofromemp;
--range:表示利用索引查询的时候限制了范围,在指定范围内进行查询,这样避免了index的全索引扫描,适用的操作符:=,<>,>,>=,<,<=,ISNULL,BETWEEN,LIKE,orIN() explainselect*fromempwhereempnobetween7000and7500;
--index_subquery:利用索引来关联子查询,不再扫描全表 explainselect*fromempwhereemp.jobin(selectjobfromt_job); --unique_subquery:该连接类型类似与index_subquery,使用的是唯一索引 explainselect*fromempewheree.deptnoin(selectdistinctdeptnofromdept); --ref_or_null:对于某个字段即需要关联条件,也需要null值的情况下,查询优化器会选择这种访问方式 explainselect*fromempewheree.mgrisnullore.mgr=7369;
--ref:使用了非唯一性索引进行数据的查找 createindexidx_3onemp(deptno); explainselect*fromempe,deptdwheree.deptno=d.deptno;
--eq_ref:使用唯一性索引进行数据查找 explainselect*fromemp,emp2whereemp.empno=emp2.empno;
--const:这个表至多有一个匹配行, explainselect*fromempwhereempno=7369;
--system:表只有一行记录(等于系统表),这是const类型的特例,平时不会出现
显示可能应用在这张表中的索引,一个或多个,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用
explainselect*fromemp,deptwhereemp.deptno=dept.deptnoandemp.deptno=10;
实际使用的索引,如果为null,则没有使用索引,查询中若使用了覆盖索引,则该索引和查询的select字段重叠。
explainselect*fromemp,deptwhereemp.deptno=dept.deptnoandemp.deptno=10;
表示索引中使用的字节数,可以通过keylen计算查询中使用的索引长度,在不损失精度的情况下长度越短越好。
1、一般地,keylen 等于索引列类型字节长度,例如int类型为4 bytes,bigint为8 bytes;
2、如果是字符串类型,还需要同时考虑字符集因素,例如utf8字符集1个字符占3个字节,gbk字符集1个字符占2个字节
3、若该列类型定义时允许NULL,其keylen还需要再加 1 bytes
4、若该列类型为变长类型,例如 VARCHAR(TEXT\BLOB不允许整列创建索引,如果创建部分索引也被视为动态列类型),其keylen还需要再加 2 bytes 字符集会影响索引长度、数据的存储空间,为列选择合适的字符集;变长字段需要额外的2个字节,固定长度字段不需要额外的字节。而null都需要1个字节的额外空间,所以以前有个说法:索引字段最好不要为NULL,因为NULL让统计更加复杂,并且需要额外一个字节的存储空间。
explainselect*fromemp,deptwhereemp.deptno=dept.deptnoandemp.deptno=10;
显示索引的哪一列被使用了,如果可能的话,是一个常数
explainselect*fromemp,deptwhereemp.deptno=dept.deptnoandemp.deptno=10;
根据表的统计信息及索引使用情况,大致估算出找出所需记录需要读取的行数,此参数很重要,直接反应的sql找了多少数据,在完成目的的情况下越少越好
explainselect*fromemp;
包含额外的信息。
--usingfilesort:说明mysql无法利用索引进行排序,只能利用排序算法进行排序,会消耗额外的位置 explainselect*fromemporderbysal;
--usingtemporary:建立临时表来保存中间结果,查询完成之后把临时表删除 explainselectename,count(*)fromempwheredeptno=10groupbyename;
--usingindex:这个表示当前的查询时覆盖索引的,直接从索引中读取数据,而不用访问数据表。如果同时出现usingwhere表名索引被用来执行索引键值的查找,如果没有,表面索引被用来读取数据,而不是真的查找 explainselectdeptno,count(*)fromempgroupbydeptnolimit10;
--usingwhere:使用where进行条件过滤 explainselect*fromemp2whereempno=1;
到这里执行计划就讲完了,sql的执行计划并不是很难,主要是记住每个列代表的意思和如何进行优化,这个是需要大量的训练和实操实现的, 有兴趣的小伙伴可以自行去试试,还是很有趣的,本文只是简单介绍一下MySQL执行计划,想全面深入了解MySQL,可优先阅读MySQL官方手册,大家加油~
原文链接:https://77isp.com/post/10365.html
=========================================
https://77isp.com/ 为 “云服务器技术网” 唯一官方服务平台,请勿相信其他任何渠道。
数据库技术 2022-03-28
网站技术 2022-11-26
网站技术 2023-01-07
网站技术 2022-11-17
Windows相关 2022-02-23
网站技术 2023-01-14
Windows相关 2022-02-16
Windows相关 2022-02-16
Linux相关 2022-02-27
数据库技术 2022-02-20
抠敌 2023年10月23日
嚼餐 2023年10月23日
男忌 2023年10月22日
瓮仆 2023年10月22日
簿偌 2023年10月22日
扫码二维码
获取最新动态