Python - mongodb重複排除
高洛峰
高洛峰 2017-05-17 10:02:13
0
1
797

1. この関数では、ownerId などのフィールドに基づいて重複しているかどうかを判断し、存在するものは破棄する必要があるため、distinct メソッドを使用しましたが、この間にデータ量が徐々に増加したため、次のような疑問が生じました。

操作失敗: 明らかに大きすぎます、16MB の上限です

これはコマンド ラインのエラーです。distinct によって返された結果が大きすぎて 16M を超えていると言われています。専門家がいくつかのメソッドに貢献できますか?

要件: ownerId フィールドがデータベースに出現するかどうかを毎回確認します。データベースは常に更新されており、存在しない ownerId はしばらく処理されるとデータベースに格納されるため、毎回判断する必要があります。データベースの所有者フィールドを再確認する必要があります。したがって、速度要件は比較的高くなります。
ぜひご覧いただき、ご意見をお聞かせください。

高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

全員に返信(1)
迷茫

私の理解が正しければ、一意のインデックスを検討しましたか?

ご参考までに。

MongoDB が大好きです!楽しむ!

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート