84669 人學習
152542 人學習
20005 人學習
5487 人學習
7821 人學習
359900 人學習
3350 人學習
180660 人學習
48569 人學習
18603 人學習
40936 人學習
1549 人學習
1183 人學習
32909 人學習
光阴似箭催人老,日月如移越少年。
假設你的表名是user:
select * from user where name in (select name from user group by name having count(1) > 1);
select * from user group by (...) having count(*) > 1就夠了,不需要再用in。其實高效什麼的你真的想太多了,這屬於設計失誤,花時間修復一次然後修改表結構防止此類問題再次發生才是正根。
select * from user group by (...) having count(*) > 1
另外這個表沒有id,所以你也不能自動刪除重複的數據,因為寫不出條件,只能再用中間表去倒。
綜上,別考慮效率了,手工改正就好。
SELECT * FROM user AS a WHERE EXISTS ( SELECT 1 FROM user AS b WHERE a.name = b.name GROUP BY name HAVING COUNT(1) > 1 )
由於涉及全表GROUP BY,所以效能比較低。如果可以修改表格結構的話,建議增加一個欄位表示該使用者名稱是否重名,該欄位在寫入資料的時候就可以判斷維護了。
GROUP BY
資料庫的世界沒有魔法,索引之所以能加快搜尋速度就是因為它預先處理了,用延長每次插入更新資料的時間來加快搜尋速度,都是有代價的。
回到這個問題,你可以在name上加索引,這樣group by就能更有效率一點,但是根據你的需求還是要子查詢。
不過在name上加索引我覺得不是個健康的做法。如果是我,解決這個問題會做一個計時任務:掃描重名的用戶,把ID記錄在某個表A上。然後頁面上顯示時直接把表A拿出來關聯使用者表即可。之所以這樣做還有一個原因就是這個工作並非要做到很嚴格,而且實際上有點誤差是無妨的。
假設你的表名是user:
select * from user group by (...) having count(*) > 1
就夠了,不需要再用in。其實高效什麼的你真的想太多了,這屬於設計失誤,花時間修復一次然後修改表結構防止此類問題再次發生才是正根。
另外這個表沒有id,所以你也不能自動刪除重複的數據,因為寫不出條件,只能再用中間表去倒。
綜上,別考慮效率了,手工改正就好。
由於涉及全表
GROUP BY
,所以效能比較低。如果可以修改表格結構的話,建議增加一個欄位表示該使用者名稱是否重名,該欄位在寫入資料的時候就可以判斷維護了。
資料庫的世界沒有魔法,索引之所以能加快搜尋速度就是因為它預先處理了,用延長每次插入更新資料的時間來加快搜尋速度,都是有代價的。
回到這個問題,你可以在name上加索引,這樣group by就能更有效率一點,但是根據你的需求還是要子查詢。
不過在name上加索引我覺得不是個健康的做法。如果是我,解決這個問題會做一個計時任務:掃描重名的用戶,把ID記錄在某個表A上。然後頁面上顯示時直接把表A拿出來關聯使用者表即可。之所以這樣做還有一個原因就是這個工作並非要做到很嚴格,而且實際上有點誤差是無妨的。