SQL sélectionne uniquement les lignes avec la valeur maximale sur la colonne
P粉9373822302023-08-23 11:08:57
0
2
361
J'ai ce formulaire de document (voici une version simplifiée) :
id
Transfert
Contenu
≪/tr> ≪/tête>
1
1
...
≪/tr>
2
1
...
≪/tr>
1
2
...
≪/tr>
1
3
...
≪/tr>
Comment sélectionner une ligne par ID et uniquement le RPM le plus élevé ?
En utilisant les données ci-dessus, le résultat doit contenir deux lignes : [1, 3, ...] et [2, 1, ..] . J'utilise MySQL.
Actuellement, j'utilise une vérification dans une boucle while pour détecter et écraser les anciennes versions dans le jeu de résultats. Mais est-ce le seul moyen d’arriver à ce résultat ? Vous n'avez pas de solution SQL
Tout ce dont vous avez besoin est une clause avecMAX聚合函数的GROUP BY:
SELECT id, MAX(rev) FROM YourTable GROUP BY id
Les choses ne sont jamais aussi simples, n'est-ce pas ?
Je viens de remarquer qu'il faut aussicontentcolonnes.
Il s'agit d'un problème très courant en SQL : rechercher toutes les données d'une ligne avec une valeur maximale dans chaque colonne d'identifiant de groupe. J’entends souvent cette affirmation au cours de ma carrière. En fait, c'est l'une des questions auxquelles j'ai répondu lors d'un entretien technique dans le cadre de mon emploi actuel.
En fait, la communauté Stack Overflow a créé une balise pour gérer des questions comme celle-ci :greatest-n-per-group.
En gros, vous avez deux manières de résoudre ce problème :
Utilisez une simplegroup-identifier, max-value-in-groupjointure de sous-requête
Dans cette approche, vous trouvez d'abordgroup-identifier, max-value-in-group(上面已解决)。然后,将表连接到子查询,并在group-identifier和max-value-in-groupdans la sous-requête (résolue ci-dessus). Ensuite, joignez la table à la sous-requête et rendez-la égale sur
et
max-value-in-group:
SELECT a.id, a.rev, a.contents FROM YourTable a INNER JOIN ( SELECT id, MAX(rev) rev FROM YourTable GROUP BY id ) b ON a.id = b.id AND a.rev = b.rev
Rejoignez-vous à gauche, ajustez les conditions de participation et les filtres
group-identifierDans cette méthode, vous rejoignez la table avec elle-même. L'égalité existe en
. Ensuite, 2 gestes intelligents :
La deuxième condition de connexion est que la valeur de gauche est inférieure à la valeur de droite
NULL(这是一个LEFT JOINLorsque vous effectuez l'étape 1, la ligne qui a réellement la plus grande valeur apparaîtra à droite
, vous vous souvenez ? ). Nous filtrons ensuite les résultats de la jointure pour afficher uniquement les lignes avec NULL sur le côté droit.
Vous vous retrouvez donc avec :
SELECT a.* FROM YourTable a LEFT OUTER JOIN YourTable b ON a.id = b.id AND a.rev < b.rev WHERE b.id IS NULL;
Conclusion
Les deux méthodes apporteront exactement les mêmes résultats.
group-identifier具有max-value-in-groupSi vous avez deux lignes
avec
max-value-in-group, les deux lignes apparaîtront dans les résultats des deux méthodes.
Les deux méthodes sont compatibles SQL ANSI, elles fonctionneront donc avec votre SGBDR préféré quelle que soit sa « saveur ».
Les deux approches sont également favorables aux performances, mais votre situation peut différer (SGBDR, structure de base de données, index, etc.). Ainsi, lorsque vous choisissez une méthode plutôt qu'une autre,Benchmark
. Et assurez-vous de choisir celui qui vous convient le mieux.
Ma préférence est d'utiliser le moins de code possible...
Vous pouvez le faire en utilisant
IN
Essayez ceci :À mon avis, c'est moins complexe... plus facile à lire et à maintenir.
À première vue...
Tout ce dont vous avez besoin est une clause avec
MAX
聚合函数的GROUP BY
:Les choses ne sont jamais aussi simples, n'est-ce pas ?
Je viens de remarquer qu'il faut aussi
content
colonnes.Il s'agit d'un problème très courant en SQL : rechercher toutes les données d'une ligne avec une valeur maximale dans chaque colonne d'identifiant de groupe. J’entends souvent cette affirmation au cours de ma carrière. En fait, c'est l'une des questions auxquelles j'ai répondu lors d'un entretien technique dans le cadre de mon emploi actuel.
En fait, la communauté Stack Overflow a créé une balise pour gérer des questions comme celle-ci :greatest-n-per-group.
En gros, vous avez deux manières de résoudre ce problème :
Utilisez une simple
group-identifier, max-value-in-group
jointure de sous-requêteDans cette approche, vous trouvez d'abord
etgroup-identifier, max-value-in-group
(上面已解决)。然后,将表连接到子查询,并在group-identifier
和max-value-in-group
dans la sous-requête (résolue ci-dessus). Ensuite, joignez la table à la sous-requête et rendez-la égale surmax-value-in-group
:Rejoignez-vous à gauche, ajustez les conditions de participation et les filtres
. Ensuite, 2 gestes intelligents :group-identifier
Dans cette méthode, vous rejoignez la table avec elle-même. L'égalité existe enLa deuxième condition de connexion est que la valeur de gauche est inférieure à la valeur de droite , vous vous souvenez ? ). Nous filtrons ensuite les résultats de la jointure pour afficher uniquement les lignes avec NULL sur le côté droit.
Vous vous retrouvez donc avec :NULL
(这是一个LEFT JOIN
Lorsque vous effectuez l'étape 1, la ligne qui a réellement la plus grande valeur apparaîtra à droiteConclusion Les deux méthodes apporteront exactement les mêmes résultats.
avecgroup-identifier
具有max-value-in-group
Si vous avez deux lignesmax-value-in-group
, les deux lignes apparaîtront dans les résultats des deux méthodes. Les deux méthodes sont compatibles SQL ANSI, elles fonctionneront donc avec votre SGBDR préféré quelle que soit sa « saveur ».Les deux approches sont également favorables aux performances, mais votre situation peut différer (SGBDR, structure de base de données, index, etc.). Ainsi, lorsque vous choisissez une méthode plutôt qu'une autre,Benchmark
. Et assurez-vous de choisir celui qui vous convient le mieux.