MySQL はサブクエリをどのように最適化しますか?-mysql チュートリアル-php.cn

MySQL はサブクエリをどのように最適化しますか?

PHPz

リリース： 2023-04-21 14:04:40

オリジナル

5420 人が閲覧しました

実際の開発では、指定されたフィールドに一致する値のセットに相当する in サブクエリをよく使用します。これにより、フィルタリングとクエリがより便利になります。ただし、このサブクエリ方法は、データ量が大きい場合にパフォーマンスに大きな問題を引き起こします。この記事では、MySQL が in サブクエリを最適化する方法を紹介します。

1. subquery での使用を避ける

実際のプロジェクトでは、このような書き方をよく見かけます:

SELECT *
FROM table
WHERE col1 IN (SELECT col1 FROM table2 WHERE condition);

ログイン後にコピー

このステートメントは、 subquery の条件に従って、最も単純です。 table2では、複数行のcol1の値を取り出し、テーブル内の値と照合し、一致した行を返します。ただし、MySQL が内部的に in サブクエリを実行する方法では、サブクエリの結果セットがメモリ (またはディスク) にキャッシュされるため、この方法で記述するとパフォーマンスのボトルネックが発生します。その後、in 判定が実行されるたびに、メモリ (またはディスク)ディスク) がキャッシュされます。)、これにより大量の I/O 操作が発生し、サブクエリの結果セットが大きい場合は、大量のメモリも占有します。

したがって、実際の開発ではサブクエリでの使用を避け、代わりに join を使用するようにしてください。

2. join を使用して in サブクエリを置き換えます

Use join を使用して in サブクエリを置き換えます。サブクエリの記述とサブクエリの記述方法に違いはありません。変換するだけです。オリジナルの in サブクエリを結合して SQL 構文を最適化するだけで、実行効率は in サブクエリよりもはるかに高くなります。以下に示すように、col1 を検索し、table1 のcol1 と結合します。

SELECT table.*
FROM table
JOIN table2 ON table.col1 = table2.col1
WHERE table2.condition;

ログイン後にコピー

in サブクエリと比較して、結合を使用すると、サブクエリの結果セットをテーブルに接続できるため、メモリ (ディスク) が大幅に削減されます。 ) 読み取り操作。

3. サブクエリの代わりに存在を使用します。

サブクエリの代わりに存在を使用することは、実際には結合を使用することになります。 in サブクエリとは異なり、exists サブクエリは結果セットのサイズに関係なく、単純な判定を実行するだけで済みます。以下は、exists サブクエリの構文例です。

SELECT *
FROM table
WHERE EXISTS (SELECT 1 FROM table2 WHERE table.col1 = table2.col1 AND table2.condition);

ログイン後にコピー

サブクエリの代わりにexistsを使用すると、効率が大幅に向上し、大量のI/Oとメモリ消費を節約できます。

4. インデックスを使用して in ステートメントを最適化する

インデックスを使用してクエリ中のサブクエリを高速化できれば、クエリの効率も大幅に向上します。 MySQL のインデックスは主キーインデックス、ユニークインデックス、通常のインデックスの 3 種類に分かれており、適切なインデックスを作成できれば、MySQL によるフルテーブルスキャンの実行を回避し、クエリ効率を向上させることができます。

CREATE INDEX idx_col1 ON table (col1);

ログイン後にコピー

col1 値が大きい場合、インデックスを使用するとクエリ効率が大幅に最適化され、サブクエリでの使用によって発生する効率の問題が軽減されます。

5. サブクエリで最適化するには、limit とexistes を使用します。

サブクエリの結果セットが非常に大きい場合は、limit とexistes を使用して、テーブル全体のスキャンを回避しながらページングクエリを実行できます。、クエリ効率を最適化するという目的を達成するために。

SELECT *
FROM table
WHERE EXISTS (SELECT 1 FROM table2 WHERE table.col1 = table2.col1 AND table2.condition LIMIT 1000, 20);

ログイン後にコピー

この SQL ステートメントの機能は、table2 の結果セットを検索し、col1 と table を使用して、exists を実行することです。クエリ結果セットを 20 項目に制限し、1000 行目からクエリを実行します。

6. ステートメントでのメモリ最適化の適切な使用

クエリで使用される in サブクエリ結果の数が多くない場合は、in の代わりに set を使用できます。 set は、後続のクエリ照合のために in サブクエリの結果セットをメモリに保存します。メモリを使用して in ステートメントを最適化すると、パフォーマンスも大幅に向上します。

SET @col1 = (SELECT GROUP_CONCAT(DISTINCT col1) FROM table2 WHERE condition);
SELECT *
FROM table
WHERE FIND_IN_SET(table.col1, @col1);

ログイン後にコピー

このステートメントは、最初にデータ照合に select を使用し、次に GROUP_CONCAT を使用して、col1 値リストを文字列に接続し、文字列は @col1 に保存されます。後続のクエリでは、FIND_IN_SET が照合に使用され、メモリキャッシュがクエリ効率を最適化するために使用されます。

7. 概要

in サブクエリを使用するときは、特にデータ量が多い場合にはテーブル全体のスキャンを必ず避けてください。そうしないと、深刻なパフォーマンスの問題が発生します。結合、存在、インデックスの最適化、リミットの適切な使用、メモリやその他のメソッドの使用により、クエリの効率を向上させ、サブクエリのパフォーマンスを最適化できます。実際のプロジェクトでは、最高のパフォーマンス最適化効果を達成するために、特定の状況に応じて最適なソリューションを選択する必要があります。

以上がMySQL はサブクエリをどのように最適化しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。