mongodb - pymongo カウントが遅い
PHPz
PHPz 2017-05-17 10:03:55
0
1
1224

30,000 個のデータ。各データには乱数が 1 つだけ含まれています。{"数字": 乱数}
要件: 最も頻繁に出現する数値を数えます
データベース テーブル table

リーリー

1 回の実行には約 5 ~ 6 分かかります。マルチスレッドを使用して 100 回実行してもそれほど高速ではなく、ファンの音が非常にうるさいです...
正しい姿勢は何ですか?

PHPz
PHPz

学习是最好的投资!

全員に返信(1)
迷茫

正しい姿勢は集約を使用することです。

リーリー

$group のユーザーはドキュメントを参照できます。
なお、このような需要が現実に現れる可能性は高くないと推定されます。実際、Aggregatoin を使用した場合でも、最も頻繁に発生する数値を見つけるには、コレクション全体のすべてのデータを走査する必要があるため、コレクション内のレコードの総数が比較的大きい場合には、このようなテーブル全体の走査操作が必要になります。この種の検索方法は通常、OLAP シナリオでのみ使用でき、OLAP には通常、高速性の要件はありません。したがって、理論的な議論からのみ、集計フレームワークを使用する必要がありますが、実際のニーズには依然として詳細な分析が必要です。

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート