ドキュメント テーブルがあります (これは簡略化されたバージョンです):
<テーブルクラス="s-テーブル"> <頭>ID ごとに 1 行を選択し、最大のリビジョンのみを選択するにはどうすればよいですか?
上記のデータに基づくと、結果には [1, 3, ...]
および [2, 1, ..]
の 2 つの行が含まれるはずです。 ;。私は MySQL を使用しています。
現在、while
ループ内のチェックを使用して、結果セット内の古い Rev を検出して上書きしています。しかし、これが結果を達成する唯一の方法でしょうか? SQL の解決策はありませんか?
使用するコードはできるだけ少なくしたいと思っています...
私の意見では、これはよりシンプルで、読みやすく、保守しやすいです。IN
を使用して達成できます これを試して:### リーリー###一目見ただけで...###
GROUP BY句で
contentMAX
集計関数を使用するだけで済みます。リーリー
物事は決して単純ではありませんね。列も必要であることに今気づきました。
これは SQL で非常に一般的な問題です。特定のグループ化識別子に基づいて、列内の最大値に対応する完全なデータを見つけます。私のキャリアの中で、この質問をよく聞いてきました。実際、私は現在の職場での技術面接中にこれらの質問の 1 つに答えました。
この質問は実際に非常に一般的であるため、Stack Overflow コミュニティは特にこのタイプの問題に対処するためのタグ
greatest-n-per-groupを作成しました。基本的に、この問題を解決するには 2 つの方法があります:
単純な
グループ識別子、グループ内の最大値を使用しますサブクエリを使用して接続します
group-identifier, max-value-in-groupこのアプローチでは、最初にサブクエリで
(上ですでに解決済み) を見つけます。次に、等結合に
このアプローチでは、テーブルをそれ自体に結合したままにします。group-identifier
とmax-value-in-group
を使用して、テーブルをサブクエリと結合します。 リーリー左結合に自己結合を使用し、接続条件とフィルタリング条件を調整します
グループ識別子
での等結合。次に、2 つの賢いステップがあります:2 番目の接続条件は、左側の値が右側の値より小さいことです。
ステップ 1 を実行すると、実際に最大値を持つ行の右側に- NULL
が表示されます (これは
- LEFT JOIN
リーリー ###結論は###
これら 2 つの方法で得られる結果はまったく同じです。 同じであることに注意してください)。次に、結合結果をフィルタリングして、右側に
NULLを持つ行のみを表示します。
つまり、最終的には次のようになります:
group-identifier
とmax-value-in-group
を持つ 2 つの行がある場合、両方のメソッドの結果に両方の行が含まれます。
を使用してください。そして、自分にとって最も合理的な方法を必ず選択してください。どちらの方法も SQL ANSI と互換性があるため、使用している RDBMS に関係なく、その「スタイル」に関係なく両方の方法を使用できます。
どちらの方法も非常に効率的ですが、具体的な効果は異なる場合があります (RDBMS、データベース構造、インデックスなど)。したがって、これらの方法のいずれかを選択する場合は、
ベンチマーク