MySQL は、優れたパフォーマンス、低コスト、豊富なリソースにより、ほとんどのインターネット企業にとって推奨されるリレーショナル データベースとなっています。性能は優れていますが、いわゆる「良い馬には良い鞍が付く」のですが、それをより良く使うには「MySQLに精通する」「SQL文の最適化」といったものが開発エンジニアの必修科目になっているのをよく見かけます。職務内容、「データベースの原則を理解する」およびその他の要件から。一般的なアプリケーション システムでは、読み取りと書き込みの比率は約 10:1 であり、挿入操作や一般的な更新操作でパフォーマンスの問題が発生することはほとんどありませんが、最も問題が発生する可能性が高いのは、複雑なクエリであることがわかっています。したがって、クエリ ステートメントの最適化が最優先事項であることは明らかです。
2013 年 7 月から、Meituan の基幹業務システム部門でスロークエリの最適化に取り組んでおり、システム数は合計 10 を超え、これまでに数百件のスロークエリ事例を解決し蓄積してきました。ビジネスの複雑さが増すにつれて、遭遇する問題はあらゆる種類の奇妙で多様で信じられないものになります。この記事は、データベースのインデックス作成の原理と、開発エンジニアの観点から遅いクエリを最適化する方法を説明することを目的としています。
select count(*) from task where status=2 and operator_id=20839 and operate_time>1371169729 and operate_time<1371174603 and type=2;
システム ユーザーは、ある関数がどんどん遅くなっていると報告したため、エンジニアは上記の SQL を見つけました。
そして、「この SQL を最適化する必要があります。各フィールドにインデックスを追加してください。」と興奮しながら私を見つけました
私は驚いて、「なぜ各フィールドにインデックスを追加する必要があるのですか?」と尋ねました
「すべてのクエリフィールドにインデックスを追加した方が速いでしょう。」エンジニアは自信満々です
「この場合、結合インデックスを構築できます。左端のプレフィックス一致であるため、operate_time を最後に配置する必要があり、他の関連クエリも含める必要があります。総合的な評価を行う必要があります。」
「結合インデックス? 左端のプレフィックス一致? 総合評価?」 エンジニアは考え込んでしまいました。
ほとんどの場合、インデックスによってクエリ効率が向上することはわかっていますが、どのようにインデックスを構築すればよいのでしょうか?インデックスの順序は何ですか?大まかにしか知らない人も多いでしょう。実際、これらの概念を理解するのは難しくなく、インデックス作成の原理は想像よりはるかに複雑ではありません。
インデックスの目的は、クエリの効率を向上させることです。これは辞書に似ています。「mysql」という単語を検索したい場合は、必ず文字 m を見つけてから、文字 y を下から順に見つける必要があります。そして残りの SQL を見つけます。インデックスがない場合、目的の単語を見つけるためにすべての単語を調べる必要がある場合があります。m で始まる単語を見つけたい場合はどうすればよいでしょうか。あるいは「ぜ」で始まる言葉はどうでしょうか?指標がなければこの問題は全く終わらないというふうにお考えですか。
辞書以外にも、駅の時刻表や書籍のカタログなど、索引の例は身の回りのいたるところで見ることができます。それらの原理は同じです。取得したいデータの範囲を常に絞り込むことで、最終的に必要な結果を除外することができ、同時にランダムなイベントを連続したイベントに変えることができます。つまり、常に同じ検索を使用します。データをロックする方法。
同じことがデータベースにも当てはまりますが、同等のクエリだけでなく、範囲クエリ (>、<、between、in)、ファジー クエリ (like)、union クエリ (または)など。データベースはすべての問題に対処するためにどのように選択すべきでしょうか?辞書の例を考えてみましょう。データをセグメントに分割して、セグメントごとにクエリを実行できますか?最も簡単な方法は、データが 1,000 個ある場合、1 ~ 100 を第 1 セクションに分割し、101 ~ 200 を第 2 セクションに分割し、201 ~ 300 を第 3 セクションに分割して確認します。 250 番目のデータの場合は、3 番目のセクションを見つけるだけで、無効なデータの 90% が削除されます。しかし、1,000 万件の記録の場合、いくつのセグメントに分割する必要があるでしょうか?アルゴリズムの基礎を少しだけ知っている学生は、平均複雑度が lgN でクエリ パフォーマンスが優れている検索ツリーについて考えるでしょう。しかし、ここでは重要な問題を見落としています。データベースの実装は毎回同じ運用コストに基づいており、データの一部はパフォーマンスを向上させるためにディスクに保存されます。ディスクにアクセスするコストはメモリにアクセスするコストの約 100,000 倍であることがわかっているため、単純な検索ツリーでは複雑なアプリケーション シナリオに対応できないため、メモリを使用して計算します。
ディスクへのアクセスについては前述したので、ここではディスク IO と事前読み取りについて簡単に説明します。データの読み取りにかかる時間は、シーク時間、回転遅延の 3 つのカテゴリに分類できます。送信時間は、磁気アームが指定されたトラックに移動するのにかかる時間を指します。たとえば、回転遅延は、よく使われるディスク速度です。 7200 rpm のディスクは 1 分間に 7200 回回転できることを意味します。つまり、1 秒間に 120 回回転でき、回転遅延は 1/120/2 = 4.17 ミリ秒になります。ディスクからの読み取りまたはディスクへのデータの書き込みは、通常は 10 分の数ミリ秒で、最初の 2 回は無視できます。この場合、ディスクにアクセスする時間、つまりディスク IO の時間は、5+4.17 = 9ms にほぼ等しくなります。これはかなり良いように思えますが、500 MIPS のマシンは 1 秒あたり 5 億の命令を実行できることを知っておく必要があります。命令は電気の性質に依存しているため、1 回の IO を実行するのに 400,000 の命令が実行される可能性があり、そのたびにデータベースには数十万、数百万、さらには数千万のデータが含まれることもあります。 9 ミリ秒かかるので、明らかに大惨事です。下の図は、参考のためのコンピューターのハードウェア遅延の比較表です:
ディスク IO は非常に高価な操作であることを考慮して、コンピュータのオペレーティング システムは、IO を実行するときに、ローカルの原理により、現在のディスク アドレスにあるデータだけでなく、隣接するデータもメモリ バッファに読み込まれます。先読みは、コンピューターがあるアドレスのデータにアクセスすると、隣接するデータにもすぐにアクセスされることを示します。 IOで毎回読み出されるデータをページと呼びます。ページ上のデータの具体的なサイズはオペレーティング システムによって異なります (通常は 4k または 8k)。つまり、ページ内のデータを読み取るときに実際に発生する IO は 1 回だけです。この理論はインデックスのデータ構造設計に非常に役立ちます。 。
日常生活におけるインデックスの例、インデックスの基本原理、データベースの複雑さ、オペレーティング システムに関する関連知識について説明してきましたが、その目的は、データ構造は何もないところから作成されるものではなく、必ず存在するものであることを誰もが理解できるようにすることです。背景と使用シナリオについて、このデータ構造で何ができるようにする必要があるかをまとめてみましょう。それは実際には非常に簡単です。つまり、検索するたびにディスク IO の数を非常に小さい桁に制御します。データ、好ましくは一定の大きさである。それでは、高度に制御可能なマルチパス探索ツリーがニーズを満たすことができるかどうかを考えてみます。このようにして、b+ ツリーが誕生しました。
上に示したように、これは b+ ツリーです。b+ ツリーの定義については、いくつかの重要な点を参照してください。各ディスク ブロックには複数のデータが含まれていることがわかります。たとえば、ディスク ブロック 1 にはデータ項目 17 と 35、ポインタ P1、P2、および P3 が含まれています。P1 は 17 未満のディスク ブロックを表し、P2 はデータ項目を表します。 17 ~ 35 の間。ディスク ブロック、P3 は 35 より大きいディスク ブロックを表します。実際のデータはリーフ ノード、つまり 3、5、9、10、13、15、28、29、36、60、75、79、90、99 に存在します。非リーフ ノードには実際のデータは格納されませんが、検索方向をガイドするデータ項目のみが格納されます。たとえば、17 と 35 は実際にはデータ テーブルに存在しません。
図に示すように、データ項目 29 を見つけたい場合は、まずディスク ブロック 1 をディスクからメモリにロードします。このとき、メモリ内で IO が発生し、29 が間にあることが確認されます。 17 と 35 を使用し、ディスク ブロック 1 をロックします。P2 ポインタ、メモリ時間は (ディスク IO と比較して) 非常に短いため無視できます。ディスク ブロック 3 は、P2 ポインタのディスク アドレスを介してディスクからメモリにロードされます。ディスク ブロック 1 の 2 番目の IO が発生し、26 と 30 でディスク ブロック 3 の P2 ポインタがロックされ、ディスク ブロック 8 がポインタを介してメモリにロードされます。同時に 3 番目の IO が発生します。メモリ内でバイナリ検索が実行されて 29 が見つかり、合計 3 回の IO が終了します。実際の状況では、3 層の b+ ツリーは数百万のデータを表すことができ、数百万のデータ検索に必要な IO が 3 つだけであれば、データ項目ごとに 1 つの IO が発生し、パフォーマンスが大幅に向上します。その場合、合計数百万の IO が必要となり、明らかに非常にコストがかかります。
1.通过上面的分析,我们知道IO次数取决于b+数的高度h,假设当前数据表的数据为N,每个磁盘块的数据项的数量是m,则有h=㏒(m+1)N,当数据量N一定的情况下,m越大,h越小;而m = 磁盘块的大小 / 数据项的大小,磁盘块的大小也就是一个数据页的大小,是固定的,如果数据项占的空间越小,数据项的数量越多,树的高度越低。这就是为什么每个数据项,即索引字段要尽量的小,比如int占4字节,要比bigint8字节少一半。这也是为什么b+树要求把真实的数据放到叶子节点而不是内层节点,一旦放到内层节点,磁盘块的数据项会大幅度下降,导致树增高。当数据项等于1时将会退化成线性表。
2.当b+树的数据项是复合的数据结构,比如(name,age,sex)的时候,b+数是按照从左到右的顺序来建立搜索树的,比如当(张三,20,F)这样的数据来检索的时候,b+树会优先比较name来确定下一步的所搜方向,如果name相同再依次比较age和sex,最后得到检索的数据;但当(20,F)这样的没有name的数据来的时候,b+树就不知道下一步该查哪个节点,因为建立搜索树的时候name就是第一个比较因子,必须要先根据name来搜索才能知道下一步去哪里查询。比如当(张三,F)这样的数据来检索时,b+树可以用name来指定搜索方向,但下一个字段age的缺失,所以只能把名字等于张三的数据都找到,然后再匹配性别是F的数据了, 这个是非常重要的性质,即索引的最左匹配特性。
关于MySQL索引原理是比较枯燥的东西,大家只需要有一个感性的认识,并不需要理解得非常透彻和深入。我们回头来看看一开始我们说的慢查询,了解完索引原理之后,大家是不是有什么想法呢?先总结一下索引的几大基本原则
1.最左前缀匹配原则,非常重要的原则,mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配,比如a = 1 and b = 2 and c > 3 and d = 4 如果建立(a,b,c,d)顺序的索引,d是用不到索引的,如果建立(a,b,d,c)的索引则都可以用到,a,b,d的顺序可以任意调整。
2.=和in可以乱序,比如a = 1 and b = 2 and c = 3 建立(a,b,c)索引可以任意顺序,mysql的查询优化器会帮你优化成索引可以识别的形式
3.尽量选择区分度高的列作为索引,区分度的公式是count(distinct col)/count(*),表示字段不重复的比例,比例越大我们扫描的记录数越少,唯一键的区分度是1,而一些状态、性别字段可能在大数据面前区分度就是0,那可能有人会问,这个比例有什么经验值吗?使用场景不同,这个值也很难确定,一般需要join的字段我们都要求是0.1以上,即平均1条扫描10条记录
4.索引列不能参与计算,保持列“干净”,比如from_unixtime(create_time) = ’2014-05-29’就不能使用到索引,原因很简单,b+树中存的都是数据表中的字段值,但进行检索时,需要把所有元素都应用函数才能比较,显然成本太大。所以语句应该写成create_time = unix_timestamp(’2014-05-29’);
5.尽量的扩展索引,不要新建索引。比如表中已经有a的索引,现在要加(a,b)的索引,那么只需要修改原来的索引即可
根据最左匹配原则,最开始的sql语句的索引应该是status、operator_id、type、operate_time的联合索引;其中status、operator_id、type的顺序可以颠倒,所以我才会说,把这个表的所有相关查询都找到,会综合分析;
比如还有如下查询
select * from task where status = 0 and type = 12 limit 10; select count(*) from task where status = 0 ;
那么索引建立成(status,type,operator_id,operate_time)就是非常正确的,因为可以覆盖到所有情况。这个就是利用了索引的最左匹配的原则
关于explain命令相信大家并不陌生,具体用法和字段含义可以参考官网explain-output,这里需要强调rows是核心指标,绝大部分rows小的语句执行一定很快(有例外,下面会讲到)。所以优化语句基本上都是在优化rows。
0.先运行看看是否真的很慢,注意设置SQL_NO_CACHE
1.where条件单表查,锁定最小返回记录表。这句话的意思是把查询语句的where都应用到表中返回的记录数最小的表开始查起,单表每个字段分别查询,看哪个字段的区分度最高
2.explain查看执行计划,是否与1预期一致(从锁定记录较少的表开始查询)
3.order by limit 形式的sql语句让排序的表优先查
4.了解业务方使用场景
5.加索引时参照建索引的几大原则
6.观察结果,不符合预期继续从0分析
下面几个例子详细解释了如何分析和优化慢查询
很多情况下,我们写SQL只是为了实现功能,这只是第一步,不同的语句书写方式对于效率往往有本质的差别,这要求我们对mysql的执行计划和索引原则有非常清楚的认识,请看下面的语句
select distinct cert.emp_id from cm_log cl inner join ( select emp.id as emp_id, emp_cert.id as cert_id from employee emp left join emp_certificate emp_cert on emp.id = emp_cert.emp_id where emp.is_deleted=0 ) cert on ( cl.ref_table='Employee' and cl.ref_oid= cert.emp_id ) or ( cl.ref_table='EmpCertificate' and cl.ref_oid= cert.cert_id ) where cl.last_upd_date >='2013-11-07 15:03:00' and cl.last_upd_date<='2013-11-08 16:00:00';
0.先运行一下,53条记录 1.87秒,又没有用聚合语句,比较慢
53 rows in set (1.87 sec)
1.explain
+----+-------------+------------+-------+---------------------------------+-----------------------+---------+-------------------+-------+--------------------------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+------------+-------+---------------------------------+-----------------------+---------+-------------------+-------+--------------------------------+ | 1 | PRIMARY | cl | range | cm_log_cls_id,idx_last_upd_date | idx_last_upd_date | 8 | NULL | 379 | Using where; Using temporary | | 1 | PRIMARY | <derived2> | ALL | NULL | NULL | NULL | NULL | 63727 | Using where; Using join buffer | | 2 | DERIVED | emp | ALL | NULL | NULL | NULL | NULL | 13317 | Using where | | 2 | DERIVED | emp_cert | ref | emp_certificate_empid | emp_certificate_empid | 4 | meituanorg.emp.id | 1 | Using index | +----+-------------+------------+-------+---------------------------------+-----------------------+---------+-------------------+-------+--------------------------------+
简述一下执行计划,首先mysql根据idx_last_upd_date索引扫描cm_log表获得379条记录;然后查表扫描了63727条记录,分为两部分,derived表示构造表,也就是不存在的表,可以简单理解成是一个语句形成的结果集,后面的数字表示语句的ID。derived2表示的是ID = 2的查询构造了虚拟表,并且返回了63727条记录。我们再来看看ID = 2的语句究竟做了写什么返回了这么大量的数据,首先全表扫描employee表13317条记录,然后根据索引emp_certificate_empid关联emp_certificate表,rows = 1表示,每个关联都只锁定了一条记录,效率比较高。获得后,再和cm_log的379条记录根据规则关联。从执行过程上可以看出返回了太多的数据,返回的数据绝大部分cm_log都用不到,因为cm_log只锁定了379条记录。
如何优化呢?可以看到我们在运行完后还是要和cm_log做join,那么我们能不能之前和cm_log做join呢?仔细分析语句不难发现,其基本思想是如果cm_log的ref_table是EmpCertificate就关联emp_certificate表,如果ref_table是Employee就关联employee表,我们完全可以拆成两部分,并用union连接起来,注意这里用union,而不用union all是因为原语句有“distinct”来得到唯一的记录,而union恰好具备了这种功能。如果原语句中没有distinct不需要去重,我们就可以直接使用union all了,因为使用union需要去重的动作,会影响SQL性能。
优化过的语句如下
select emp.id from cm_log cl inner join employee emp on cl.ref_table = 'Employee' and cl.ref_oid = emp.id where cl.last_upd_date >='2013-11-07 15:03:00' and cl.last_upd_date<='2013-11-08 16:00:00' and emp.is_deleted = 0 union select emp.id from cm_log cl inner join emp_certificate ec on cl.ref_table = 'EmpCertificate' and cl.ref_oid = ec.id inner join employee emp on emp.id = ec.emp_id where cl.last_upd_date >='2013-11-07 15:03:00' and cl.last_upd_date<='2013-11-08 16:00:00' and emp.is_deleted = 0
4.不需要了解业务场景,只需要改造的语句和改造之前的语句保持结果一致
5.现有索引可以满足,不需要建索引
6.用改造后的语句实验一下,只需要10ms 降低了近200倍!
+----+--------------+------------+--------+---------------------------------+-------------------+---------+-----------------------+------+-------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+--------------+------------+--------+---------------------------------+-------------------+---------+-----------------------+------+-------------+ | 1 | PRIMARY | cl | range | cm_log_cls_id,idx_last_upd_date | idx_last_upd_date | 8 | NULL | 379 | Using where | | 1 | PRIMARY | emp | eq_ref | PRIMARY | PRIMARY | 4 | meituanorg.cl.ref_oid | 1 | Using where | | 2 | UNION | cl | range | cm_log_cls_id,idx_last_upd_date | idx_last_upd_date | 8 | NULL | 379 | Using where | | 2 | UNION | ec | eq_ref | PRIMARY,emp_certificate_empid | PRIMARY | 4 | meituanorg.cl.ref_oid | 1 | | | 2 | UNION | emp | eq_ref | PRIMARY | PRIMARY | 4 | meituanorg.ec.emp_id | 1 | Using where | | NULL | UNION RESULT | <union1,2> | ALL | NULL | NULL | NULL | NULL | NULL | | +----+--------------+------------+--------+---------------------------------+-------------------+---------+-----------------------+------+-------------+
举这个例子的目的在于颠覆我们对列的区分度的认知,一般上我们认为区分度越高的列,越容易锁定更少的记录,但在一些特殊的情况下,这种理论是有局限性的
select * from stage_poi sp where sp.accurate_result=1 and ( sp.sync_status=0 or sp.sync_status=2 or sp.sync_status=4 );
0.先看看运行多长时间,951条数据6.22秒,真的很慢
951 rows in set (6.22 sec)
1.先explain,rows达到了361万,type = ALL表明是全表扫描
+----+-------------+-------+------+---------------+------+---------+------+---------+-------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-------+------+---------------+------+---------+------+---------+-------------+ | 1 | SIMPLE | sp | ALL | NULL | NULL | NULL | NULL | 3613155 | Using where | +----+-------------+-------+------+---------------+------+---------+------+---------+-------------+
2.所有字段都应用查询返回记录数,因为是单表查询 0已经做过了951条
3.让explain的rows 尽量逼近951
看一下accurate_result = 1的记录数
select count(*),accurate_result from stage_poi group by accurate_result; +----------+-----------------+ | count(*) | accurate_result | +----------+-----------------+ | 1023 | -1 | | 2114655 | 0 | | 972815 | 1 | +----------+-----------------+
我们看到accurate_result这个字段的区分度非常低,整个表只有-1,0,1三个值,加上索引也无法锁定特别少量的数据
再看一下sync_status字段的情况
select count(*),sync_status from stage_poi group by sync_status; +----------+-------------+ | count(*) | sync_status | +----------+-------------+ | 3080 | 0 | | 3085413 | 3 | +----------+-------------+
同样的区分度也很低,根据理论,也不适合建立索引
问题分析到这,好像得出了这个表无法优化的结论,两个列的区分度都很低,即便加上索引也只能适应这种情况,很难做普遍性的优化,比如当sync_status 0、3分布的很平均,那么锁定记录也是百万级别的
4.找业务方去沟通,看看使用场景。业务方是这么来使用这个SQL语句的,每隔五分钟会扫描符合条件的数据,处理完成后把sync_status这个字段变成1,五分钟符合条件的记录数并不会太多,1000个左右。了解了业务方的使用场景后,优化这个SQL就变得简单了,因为业务方保证了数据的不平衡,如果加上索引可以过滤掉绝大部分不需要的数据
5.根据建立索引规则,使用如下语句建立索引
alter table stage_poi add index idx_acc_status(accurate_result,sync_status);
6.观察预期结果,发现只需要200ms,快了30多倍。
952 rows in set (0.20 sec)
我们再来回顾一下分析问题的过程,单表查询相对来说比较好优化,大部分时候只需要把where条件里面的字段依照规则加上索引就好,如果只是这种“无脑”优化的话,显然一些区分度非常低的列,不应该加索引的列也会被加上索引,这样会对插入、更新性能造成严重的影响,同时也有可能影响其它的查询语句。所以我们第4步调差SQL的使用场景非常关键,我们只有知道这个业务场景,才能更好地辅助我们更好的分析和优化查询语句。
select c.id, c.name, c.position, c.sex, c.phone, c.office_phone, c.feature_info, c.birthday, c.creator_id, c.is_keyperson, c.giveup_reason, c.status, c.data_source, from_unixtime(c.created_time) as created_time, from_unixtime(c.last_modified) as last_modified, c.last_modified_user_id from contact c inner join contact_branch cb on c.id = cb.contact_id inner join branch_user bu on cb.branch_id = bu.branch_id and bu.status in ( 1, 2) inner join org_emp_info oei on oei.data_id = bu.user_id and oei.node_left >= 2875 and oei.node_right <= 10802 and oei.org_category = - 1 order by c.created_time desc limit 0 , 10;
还是几个步骤
0.先看语句运行多长时间,10条记录用了13秒,已经不可忍受
10 rows in set (13.06 sec)
1.explain
+----+-------------+-------+--------+-------------------------------------+-------------------------+---------+--------------------------+------+----------------------------------------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-------+--------+-------------------------------------+-------------------------+---------+--------------------------+------+----------------------------------------------+ | 1 | SIMPLE | oei | ref | idx_category_left_right,idx_data_id | idx_category_left_right | 5 | const | 8849 | Using where; Using temporary; Using filesort | | 1 | SIMPLE | bu | ref | PRIMARY,idx_userid_status | idx_userid_status | 4 | meituancrm.oei.data_id | 76 | Using where; Using index | | 1 | SIMPLE | cb | ref | idx_branch_id,idx_contact_branch_id | idx_branch_id | 4 | meituancrm.bu.branch_id | 1 | | | 1 | SIMPLE | c | eq_ref | PRIMARY | PRIMARY | 108 | meituancrm.cb.contact_id | 1 | | +----+-------------+-------+--------+-------------------------------------+-------------------------+---------+--------------------------+------+----------------------------------------------+
从执行计划上看,mysql先查org_emp_info表扫描8849记录,再用索引idx_userid_status关联branch_user表,再用索引idx_branch_id关联contact_branch表,最后主键关联contact表。
rows返回的都非常少,看不到有什么异常情况。我们在看一下语句,发现后面有order by + limit组合,会不会是排序量太大搞的?于是我们简化SQL,去掉后面的order by 和 limit,看看到底用了多少记录来排序
select count(*) from contact c inner join contact_branch cb on c.id = cb.contact_id inner join branch_user bu on cb.branch_id = bu.branch_id and bu.status in ( 1, 2) inner join org_emp_info oei on oei.data_id = bu.user_id and oei.node_left >= 2875 and oei.node_right <= 10802 and oei.org_category = - 1 +----------+ | count(*) | +----------+ | 778878 | +----------+ 1 row in set (5.19 sec)
发现排序之前居然锁定了778878条记录,如果针对70万的结果集排序,将是灾难性的,怪不得这么慢,那我们能不能换个思路,先根据contact的created_time排序,再来join会不会比较快呢?
于是改造成下面的语句,也可以用straight_join来优化
select c.id, c.name, c.position, c.sex, c.phone, c.office_phone, c.feature_info, c.birthday, c.creator_id, c.is_keyperson, c.giveup_reason, c.status, c.data_source, from_unixtime(c.created_time) as created_time, from_unixtime(c.last_modified) as last_modified, c.last_modified_user_id from contact c where exists ( select 1 from contact_branch cb inner join branch_user bu on cb.branch_id = bu.branch_id and bu.status in ( 1, 2) inner join org_emp_info oei on oei.data_id = bu.user_id and oei.node_left >= 2875 and oei.node_right <= 10802 and oei.org_category = - 1 where c.id = cb.contact_id ) order by c.created_time desc limit 0 , 10;
验证一下效果 预计在1ms内,提升了13000多倍!
10 rows in set (0.00 sec)
本以为至此大工告成,但我们在前面的分析中漏了一个细节,先排序再join和先join再排序理论上开销是一样的,为何提升这么多是因为有一个limit!大致执行过程是:mysql先按索引排序得到前10条记录,然后再去join过滤,当发现不够10条的时候,再次去10条,再次join,这显然在内层join过滤的数据非常多的时候,将是灾难的,极端情况,内层一条数据都找不到,mysql还傻乎乎的每次取10条,几乎遍历了这个数据表!
用不同参数的SQL试验下
select sql_no_cache c.id, c.name, c.position, c.sex, c.phone, c.office_phone, c.feature_info, c.birthday, c.creator_id, c.is_keyperson, c.giveup_reason, c.status, c.data_source, from_unixtime(c.created_time) as created_time, from_unixtime(c.last_modified) as last_modified, c.last_modified_user_id from contact c where exists ( select 1 from contact_branch cb inner join branch_user bu on cb.branch_id = bu.branch_id and bu.status in ( 1, 2) inner join org_emp_info oei on oei.data_id = bu.user_id and oei.node_left >= 2875 and oei.node_right <= 2875 and oei.org_category = - 1 where c.id = cb.contact_id ) order by c.created_time desc limit 0 , 10; Empty set (2 min 18.99 sec)
2 min 18.99 sec!比之前的情况还糟糕很多。由于mysql的nested loop机制,遇到这种情况,基本是无法优化的。这条语句最终也只能交给应用系统去优化自己的逻辑了。
通过这个例子我们可以看到,并不是所有语句都能优化,而往往我们优化时,由于SQL用例回归时落掉一些极端情况,会造成比原来还严重的后果。所以,第一:不要指望所有语句都能通过SQL优化,第二:不要过于自信,只针对具体case来优化,而忽略了更复杂的情况。
慢查询的案例就分析到这儿,以上只是一些比较典型的案例。我们在优化过程中遇到过超过1000行,涉及到16个表join的“垃圾SQL”,也遇到过线上线下数据库差异导致应用直接被慢查询拖死,也遇到过varchar等值比较没有写单引号,还遇到过笛卡尔积查询直接把从库搞死。再多的案例其实也只是一些经验的积累,如果我们熟悉查询优化器、索引的内部原理,那么分析这些案例就变得特别简单了。
本文以一个慢查询案例引入了MySQL索引原理、优化慢查询的一些方法论;并针对遇到的典型案例做了详细的分析。其实做了这么长时间的语句优化后才发现,任何数据库层面的优化都抵不上应用系统的优化,同样是MySQL,可以用来支撑Google/FaceBook/Taobao应用,但可能连你的个人网站都撑不住。套用最近比较流行的话:“查询容易,优化不易,且写且珍惜!”
参考文献如下:
1.《高性能MySQL》
2.《数据结构与算法分析》
以上がMySQL インデックスの原則と遅いクエリの最適化の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。