mysql where uid in (2000个uid) 的优化或更好的存储方案

Question

有这样一个需求，要存储千万级的帖子，十万级的用户

然后

给定2000个用户ID，需要按照帖子发表时间，从这2000个用户发过的帖子中查出最新的10000个帖子

PS：极端情况

给定的2000各用户中，其中10个非常活跃，可能这最新10000个帖子只是这10个用户发表的

请教诸位大神，

这种情况该如何存储，如何查询

黄舟 · Answer

只说查询，和我最近用的一个sql类似，在一张近百万数据的表中，通过一个文章id(docId),找出对应的word(word是根据文章标题分词得到的),再根据这些word，查找所有的相关的文章id。一开始的做法是select docId from tab1 where word in (select word from tab1 where docId=123) group by docId limit 1000;
各个字段都建了索引，执行过后，花了35s左右时间。后来换成join查询，能达到50ms左右，经过讨论，问题是出在in上，导致查询时没用上索引，优化后的sql是：select docId from (select word from tab1 where docId=123) as t2 join tab1 t on t.word=t2.word where t2.word is not null GROUP BY docId limit 1000