class Subject(Document): ''' 新闻主题信息 ''' author_ref = ReferenceField(Account,dbref=False) #关联用户 when = DateTimeField(default=datetime.datetime.now, required=True) title = StringField(max_length=50) ` # 文章标题
`
class Comment(Document): ''' 评论 ''' subject_ref = ReferenceField(Subject,dbref=False) #关联主题 display_name = StringField(max_length=50) author_ref = ReferenceField(Account,dbref=False) content = StringField() # 内容
问题:第一个是主贴子表,第二个是评论表,现在要查询出主贴的列表,并且统计出主贴的评论数 有什么好的办法 ?
单纯说里的需求。评论数应该是在主贴那有个附加字段属性的。为什么每次都count?要有个帖子很火几百万评论,你还要count?
跟大牛们聊了一下。有以下几种办法。这是个挺有意思的问题。
保持现在的schema
MongoDB的文档模型决定了它没有Join,所以只好查询两次了。看看你用的 Object-Document-Mapper 的语法吧。
把comments嵌入在post中,客户端计数。
Query的时候把整个文档都拿到client来,计数。浪费了这部分数据传输。但在单个post的显示的时候,所有信息都有了。如果你的comment不多,这种schema是推荐的办法。但是我们可以进一步改进。
把comments嵌入在post中,用aggregation framework计数。
用db.posts.aggregate(...),unwind, group。这个方法有点overkilling了……
把comments嵌入在post中,加个计数的缓存。
也可以像楼上建议的那样,保持现在的样子,不过如果他们在一个doc里,一个update把comment
$push
到comments里,同时$inc
计数,很好地保持了一致性。查询的时候,把第二个projection参数写出来,不要comments就好了。比如想找最近的10个。我查找了大量的资料,最后还是单独增加一个统计属性