mysqlクエリ中にパフォーマンスに影響を与える過剰なオフセットの理由と最適化方法の詳細な説明-mysql チュートリアル-php.cn

mysqlクエリ中にパフォーマンスに影響を与える過剰なオフセットの理由と最適化方法の詳細な説明

jacklove

リリース： 2018-06-08 17:17:01

オリジナル

2087 人が閲覧しました

mysql クエリは、select コマンドを limit パラメータと offset パラメータと組み合わせて使用し、指定された範囲内のレコードを読み取ります。この記事では、MySQL クエリ中にパフォーマンスに影響を与える過剰なオフセットの理由と最適化方法を紹介します。

テストデータのテーブルとデータを準備します

1. テーブルを作成します

2. 1000000レコードを挿入します

CREATE TABLE `member` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT, `name` varchar(10) NOT NULL COMMENT &#39;姓名&#39;, `gender` tinyint(3) unsigned NOT NULL COMMENT &#39;性别&#39;, PRIMARY KEY (`id`), KEY `gender` (`gender`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

ログイン後にコピー

分析する過剰なオフセットがパフォーマンスに影響を与える理由

1. オフセットが小さい場合

<?php
$pdo = new PDO("mysql:host=localhost;dbname=user","root",&#39;&#39;);for($i=0; $i<1000000; $i++){    $name = substr(md5(time().mt_rand(000,999)),0,10);    $gender = mt_rand(1,2);    $sqlstr = "insert into member(name,gender) values(&#39;".$name."&#39;,&#39;".$gender."&#39;)";    $stmt = $pdo->prepare($sqlstr);    $stmt->execute();}
?>mysql> select count(*) from member;
+----------+| count(*) |
+----------+|  1000000 |
+----------+1 row in set (0.23 sec)

ログイン後にコピー

オフセットが小さい場合、クエリ速度が速く、効率が高くなります。 2. オフセットが大きい場合

mysql> select version();
+-----------+| version() |
+-----------+| 5.6.24    |
+-----------+1 row in set (0.01 sec)

ログイン後にコピー

オフセットが大きいと、実行効率が低下します。

パフォーマンスに影響を与える理由を分析する

mysql> select * from member where gender=1 limit 10,1;
+----+------------+--------+| id | name       | gender |
+----+------------+--------+| 26 | 509e279687 |      1 |
+----+------------+--------+1 row in set (0.00 sec)mysql> select * from member where gender=1 limit 100,1;
+-----+------------+--------+| id  | name       | gender |
+-----+------------+--------+| 211 | 07c4cbca3a |      1 |
+-----+------------+--------+1 row in set (0.00 sec)mysql> select * from member where gender=1 limit 1000,1;
+------+------------+--------+| id   | name       | gender |
+------+------------+--------+| 1975 | e95b8b6ca1 |      1 |
+------+------------+--------+1 row in set (0.00 sec)

ログイン後にコピー

データテーブルは InnoDB であるため、InnoDB インデックスの構造に従って、クエリプロセスは次のようになります:

セカンダリインデックス (すべての性別 =1 ID を検索)。

しかし、セカンダリインデックスで主キー値が見つかっているのに、なぜ主キーインデックスを使用して最初にデータブロックを見つけてから、そのオフセット値に基づいてオフセット処理を実行する必要があるのでしょうか?

主キーインデックスを見つけた後、最初にオフセット処理を実行し、300000レコードをスキップし、300001番目のレコードの主キーインデックスを通してデータブロックを読み取ると、効率が向上します。

主キーのみをクエリする場合は、違いを確認してください

mysql> select * from member where gender=1 limit 100000,1;
+--------+------------+--------+| id     | name       | gender |
+--------+------------+--------+| 199798 | 540db8c5bc |      1 |
+--------+------------+--------+1 row in set (0.12 sec)mysql> select * from member where gender=1 limit 200000,1;
+--------+------------+--------+| id     | name       | gender |
+--------+------------+--------+| 399649 | 0b21fec4c6 |      1 |
+--------+------------+--------+1 row in set (0.23 sec)mysql> select * from member where gender=1 limit 300000,1;
+--------+------------+--------+| id     | name       | gender |
+--------+------------+--------+| 599465 | f48375bdb8 |      1 |
+--------+------------+--------+1 row in set (0.31 sec)

ログイン後にコピー

明らかに、主キーのみをクエリすると、すべてのフィールドをクエリする場合に比べて、実行効率が大幅に向上します。

は主キーのみをクエリすると推測されますセカンダリインデックスは既に主キー値を見つけており、クエリは主キーを読み取るだけでよいため、mysql は最初にオフセット操作を実行し、後続の主キーインデックスに基づいてデータブロックを読み取ります。

すべてのフィールドをクエリする必要がありますセカンダリインデックスは主キー値のみを検索しますが、他のフィールドの値を取得するにはデータブロックで読み取る必要があるためです。したがって、mysql は最初にデータブロックの内容を読み取り、次にオフセット操作を実行し、最後にスキップする必要がある前のデータを破棄して、後続のデータを返します。

確認済み

InnoDB には、データページやインデックスページなど、最近アクセスされたデータページを保存するバッファプールがあります。テストするには、まず mysql を再起動してから、バッファープールの内容を確認します。

select * from member where gender=1 limit 300000,1;

ログイン後にコピー

再起動後、データページにアクセスしていないことがわかります。

すべてのフィールドをクエリし、バッファプールの内容を確認します

mysql> select id from member where gender=1 limit 300000,1;
+--------+| id     |
+--------+| 599465 |
+--------+1 row in set (0.09 sec)

ログイン後にコピー

この時点でバッファプール内のメンバーテーブルに1385データページと261インデックスページがあることがわかります時間。

mysqlを再起動してバッファプールをクリアし、主キーのみをクエリするテストを続行します

mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in(&#39;primary&#39;,&#39;gender&#39;) and TABLE_NAME like &#39;%member%&#39; group by index_name;
Empty set (0.04 sec)

ログイン後にコピー

メンバーテーブルには13データページと263インデックスページしかないことがわかります現時点ではバッファプールにあります。したがって、主キーインデックスを介してデータブロックにアクセスするための複数の I/O 操作が削減され、実行効率が向上します。

したがって、mysql クエリの際に、過剰なオフセットがパフォーマンスに影響を与える理由は、主キーインデックスを介してデータブロックにアクセスする複数の I/O 操作によるものであることが確認できます。 (この問題があるのは InnoDB だけであり、MYISAM インデックス構造は InnoDB とは異なることに注意してください。セカンダリインデックスはデータブロックを直接ポイントしているため、そのような問題はありません)。

InnoDB エンジンと MyISAM エンジンのインデックス構造の比較表

最適化方法 mysqlクエリ中にパフォーマンスに影響を与える過剰なオフセットの理由と最適化方法の詳細な説明

上記の分析によると、すべてのフィールドをクエリすると、プライマリエンジンによる I/O が発生することがわかります。データブロックに複数回アクセスするキーインデックス O 操作。

そのため、最初にオフセット主キーを見つけてから、主キーインデックスに基づいてデータブロックのすべての内容をクエリして最適化します。

mysql> select * from member where gender=1 limit 300000,1;
+--------+------------+--------+| id     | name       | gender |
+--------+------------+--------+| 599465 | f48375bdb8 |      1 |
+--------+------------+--------+1 row in set (0.38 sec)mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in(&#39;primary&#39;,&#39;gender&#39;) and TABLE_NAME like &#39;%member%&#39; group by index_name;
+------------+----------+| index_name | count(*) |
+------------+----------+| gender     |      261 || PRIMARY    |     1385 |
+------------+----------+2 rows in set (0.06 sec)

ログイン後にコピー

この記事では、MySQL のクエリ時にパフォーマンスに影響を与える過度のオフセットの理由と最適化方法について説明します。関連コンテンツについては、PHP 中国語 Web サイトを参照してください。