java - 在调用链日志存储和展现的过程中 HBase 和 ElasticSearch 如何取舍?
怪我咯
怪我咯 2017-04-18 10:33:44
0
2
528

要做微服务首先得把全链路监控搭起来,参考过一些方案,拿其中唯品会的方案来举例:

调用链信息分别存储于HBaseElasticSearch中,ElasticSearch 单纯承担起类似于 Solr 的角色,查询的时候只需要通过 ElasticSearch 的倒排索引查到相关的 Rowkey 再去 HBase 里通过 Rowkey 查得完整调用链信息,并将起展现出来。

我知道 ElasticSearch 本身其实可以做可靠性存储的,为什么不直接将 Trace 调用链信息全量存入 ElasticSearch 中,这里借用 HBase 意义何在?

如果是为了后续的批处理计算,也感觉不妥,ES 也有 hadoop插件,可以做集成。
如果说 HBase 能够承受更大的吞吐,感觉也不对,ES 能承受的吞吐也不小。

关于这个问题我依旧思考不出个所以然来,忘各位给出见解,谢谢了!

怪我咯
怪我咯

走同样的路,发现不同的人生

全部回复 (2)
小葫芦

唯品会是如何设计的不是太清楚。

我知道 twitter 开源的zipkin分布式追踪系统是直接将trace信息直接存储在elasticsearch中的。当然zipkin还支持很多其它的存储方式如mysql/nosql。zipkin

条条大路通罗马。我认为不需要太纠结于别人为什么要这样选择,更多应该关注别人做成了什么。这当中有很多原因外人是无法知道的,也许就是个人便好,也许跟公司内部技术有关,也许有其它考量。
但是至少有一点是可以确定的要实现相同的功能,并不一定要选择hbase + elasticsearch才能完成。

    巴扎黑

    hbase算是基本版本。
    想要做分析还是得用es。

      最新下载
      更多>
      网站特效
      网站源码
      网站素材
      前端模板
      关于我们 免责声明 Sitemap
      PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!