group-by - mysql group by 优化的问题

Question

我有一张接近八千万条数据的彩虹表，然后里面有二十多万条的重复数据，我想使用GROUP BY 进行分组，但是使用了GROUP BY语句以后，mysql会生出一张零时表，而零时表，把我的硬盘全部沾满了，所以，求个办法，能帮...

迷茫 · Answer

不贊成用一條SQL語句來搞定這類問題，因為資料庫耗不起。可以用程式來實作(例如寫Python腳本)，步驟是這樣的：