J'ai un tableau des documents (voici une version simplifiée) :
id | Redirection | Contenu |
---|---|---|
1 | 1 | ... |
2 | 1 | ... |
1 | 2 | ... |
1 | 3 | ... |
Comment sélectionner une ligne pour chaque identifiant et sélectionner uniquement le rev le plus grand ?
Sur la base des données ci-dessus, le résultat devrait contenir deux lignes :[1, 3, ...]
和[2, 1, ..]
. J'utiliseMySQL.
Actuellement, j'utilise une vérification dans unewhile
boucle pour détecter et écraser les anciennes versions dans l'ensemble de résultats. Mais est-ce la seule façon d’obtenir des résultats ? N'y a-t-il pas de solutionSQL?
Je préfère utiliser le moins de code possible...
Vous pouvez utiliser
IN
pour réaliser Essayez ceci :À mon avis, c'est plus simple... plus facile à lire et à maintenir.
À première vue...
Vous avez juste besoin de la
GROUP BY
子句中使用MAX
fonction d'agrégation :Les choses ne sont jamais aussi simples, n'est-ce pas ?
Je viens de remarquer qu'il faut aussi
content
colonnes.En SQL, il s'agit d'un problème très courant : rechercher la ligne entière de données avec la valeur maximale dans une certaine colonne en fonction d'un certain identifiant de regroupement. J'ai beaucoup entendu cette question au cours de ma carrière. En fait, c'est une question à laquelle j'ai répondu lors d'un entretien technique pour mon emploi actuel.
Cette question est en fait si courante que la communauté Stack Overflow a créé une balise spécifiquement pour traiter ce type de question :greatest-n-per-group.
En gros, vous avez deux manières de résoudre ce problème :
Rejoignez-nous en utilisant une simple
group-identifier, max-value-in-group
sous-requêteDans cette approche, vous trouvez d'abord
etgroup-identifier, max-value-in-group
(已经在上面解决了)。然后,你将你的表与子查询进行连接,使用group-identifier
和max-value-in-group
dans une sous-requête (déjà résolue ci-dessus). Vous joignez ensuite votre table avec la sous-requête, en utilisantmax-value-in-group
pour une équijointure :Utilisez l'auto-jointure pour la jointure gauche et ajustez les conditions de connexion et les conditions de filtrage
. Ensuite, il y a deux étapes astucieuses :group-identifier
Dans cette approche, vous effectuez une jointure gauche de la table avec elle-même. Les équijointures sont placées dansLa deuxième condition de connexion est que la valeur de gauche est inférieure à la valeur de droite à droite.
Donc, vous vous retrouvez avec :NULL
(记住这是一个LEFT JOIN
)。然后,我们过滤连接的结果,只显示右侧为NULL
Lorsque vous effectuez l'étape 1, la ligne qui a réellement la plus grande valeur sera la ligne avecConclusion Les deux méthodes vous donneront exactement les mêmes résultats.
, alors ces deux lignes apparaîtront dans le résultat dans les deux méthodes. Les deux méthodes sont compatibles SQL ANSI, donc quelle que soit la « saveur » du SGBDR que vous préférez, vous pouvez l'utiliser.group-identifier
中有两行具有max-value-in-group
S'il y a deux lignes avecmax-value-in-group
dansLes deux méthodes sont également respectueuses des performances, mais votre situation réelle peut être différente (SGBDR, structure de base de données, index, etc.). Ainsi, lorsque vous choisissez une méthode, effectuez unbenchmarking
. Assurez-vous de choisir la méthode qui vous convient le mieux.