MySQL导入大量数据（36.6G）去重问题-PHP Chinese Network Q&A

Article Topic Learning Download Q&A Programming Dictionary Game Recent Updates

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

MySQL导入大量数据（36.6G）去重问题

ringa_lee 2017-04-17 13:27:41

0

4

478

有个36.6G的csv文件，需要去重并导入到数据库（顺序无所谓，只需要结果是一个无重复的表），如何处理？

ringa_lee

ringa_lee

reply all (4)

PHPzhong2017-04-17 13:29:41 4 floor

如果 Foo 字段不能重复，那么定义 Unique 就好了，自动去掉了：

CREATE TABLE xxx ( ... Foo varchar unique not null, ... );

Like+0

Add Reply

大家讲道理2017-04-17 13:29:41 3 floor

你可以全部导入数据库然后通过sql操作删除重复的数据

Like+0

Add Reply

伊谢尔伦2017-04-17 13:29:41 2 floor

对可能重复的字段建一个唯一索引

插入的时候用insert ignore into ...

Like+0

Add Reply

刘奇2017-04-17 13:29:41 1 floor

可以用bash, 先sort, 然后用awk检查相邻行是否一样，如果不一样就输出到一个新的文件。这样其实速度并不慢，但是可能需要很多空间。

比较好的做法是在导入时让数据库自己处理，比如前面所说的定义unique域。

Like+0

Add Reply

Popular Topics

More>

Popular Articles

Popular Tutorials

More>

Related Tutorials

Popular Recommendations

Latest courses

Latest Downloads

More>

Web Effects

Website Source Code

Website Materials

Front End Template

About us Disclaimer Sitemap: php.cn：Public welfare online PHP training，Help PHP learners grow quickly！