84669인 학습
152542인 학습
20005인 학습
5487인 학습
7821인 학습
359900인 학습
3350인 학습
180660인 학습
48569인 학습
18603인 학습
40936인 학습
1549인 학습
1183인 학습
32909인 학습
数据库中的一个字段已经存在相同的值,想给这个字段建立一个唯一索引,并删除多余的数据,于是建立索引时设置了dropDups 为true,但还是报错重复key,是怎么回事呀?或者有什么方法能快速删除多余的数据呢?
业精于勤,荒于嬉;行成于思,毁于随。
파이썬 스크립트를 통해 중복 제거 가능
아이디어는 매우 간단합니다. 탐색하여 dict에 저장하고 두 번째 발견되면 삭제합니다. 하지만 이 방법으로는 삭제 및 보관된 개체를 제어할 수 없습니다. 시나리오에 따라 스크립트를 조정할 수 있습니다
저도 이런 상황을 겪었는데 어떻게 해결해야 할지 모르겠습니다.
데이터가 10만 개가 넘는 경우 스크립트를 통해 빠르게 처리할 수 있나요? 동시성이 많을 때 스크립트는 어떻게 처리합니까?
mongoDB3.0에서는 dropDups 매개변수를 삭제하므로 향후 이를 통해 중복된 데이터를 삭제할 수 없습니다.
http://blog.chinaunix.net/xmlrpc.php?r=blog/article&id=4865696&uid=15795819
파이썬 스크립트를 통해 중복 제거 가능
으아악아이디어는 매우 간단합니다. 탐색하여 dict에 저장하고 두 번째 발견되면 삭제합니다.
하지만 이 방법으로는 삭제 및 보관된 개체를 제어할 수 없습니다. 시나리오에 따라 스크립트를 조정할 수 있습니다
저도 이런 상황을 겪었는데 어떻게 해결해야 할지 모르겠습니다.
데이터가 10만 개가 넘는 경우 스크립트를 통해 빠르게 처리할 수 있나요? 동시성이 많을 때 스크립트는 어떻게 처리합니까?
mongoDB3.0에서는 dropDups 매개변수를 삭제하므로 향후 이를 통해 중복된 데이터를 삭제할 수 없습니다.
http://blog.chinaunix.net/xmlrpc.php?r=blog/article&id=4865696&uid=15795819