• 技术文章 >运维 >Apache

    apache spark是什么意思?

    藏色散人藏色散人2019-08-05 11:11:57原创1505

    apache spark是什么意思?

    Apache Spark是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速。Spark非常小巧玲珑,由加州伯克利大学AMP实验室的Matei为主的小团队所开发。使用的语言是Scala,项目的core部分的代码只有63个Scala文件,非常短小精悍。

    Apache Spark的5大优势:

    1.更高的性能,因为数据被加载到集群主机的分布式内存中。数据可以被快速的转换迭代,并缓存用以后续的频繁访问需求。很多对Spark感兴趣的朋友可能也会听过这样一句话——在数据全部加载到内存的情况下,Spark可以比Hadoop快100倍,在内存不够存放所有数据的情况下快Hadoop 10倍。

    2.通过建立在Java、Scala、Python、SQL(应对交互式查询)的标准API以方便各行各业使用,同时还含有大量开箱即用的机器学习库。

    3.与现有Hadoop v1 (SIMR) 和2.x (YARN) 生态兼容,因此机构可以进行无缝迁移。

    4.方便下载和安装。方便的shell(REPL: Read-Eval-Print-Loop)可以对API进行交互式的学习。

    5.借助高等级的架构提高生产力,从而可以讲精力放到计算上。

    同时,Apache Spark由Scala实现,代码非常简洁。

    以上就是apache spark是什么意思?的详细内容,更多请关注php中文网其它相关文章!

    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。
    专题推荐:apache spark
    上一篇:apache web服务器是什么 下一篇:怎么看Apache的端口号

    相关文章推荐

    • apache是什么牌子• 怎么启动apache• apache是什么公司• apache web服务器是什么

    全部评论我要评论

  • 取消发布评论发送
  • 1/1

    PHP中文网