Apache Hadoop是一套用于在由通用硬件构建的大型集群上运行应用程序的框架。它实现了Map/Reduce编程范型,计算任务会被分割成小块(多次)运行在不同的节点上。除此之外,它还提供了一款分布式文件系统(HDFS),数据被存储在计算节点上以提供极高的跨数据中心聚合带宽。
Apache Hadoop框架介绍
许多提供Apache Hadoop大数据业务的厂商肯定都争相想做企业的生意。毕竟,大的Apache Hadoop数据不是最小的数据集合,但Apache Hadoop大数据需要充分利用尽可能多的数据管理。如果你正在寻找一个部署Apache Hadoop大数据的定义,这却不是完整的Apache Hadoop定义。你需要一个增长的Apache Hadoop数据中心基础设施相匹配所有这些增长的数据。
这个大的数据热潮才真正开始与Apache Hadoop的分布式文件系统,开启了基于成本效益规模的服务器使用相对便宜的本地磁盘群集的作为海量Apache Hadoop数据分析的时代。不管企业发展如何迅速,Apache Hadoop及Apache Hadoop相关大数据的解决方案,Apache Hadoop可以保证持续分析各种原始数据。
问题在于,一旦你想从Apache Hadoop大数据入手,会发现传统的Apache Hadoop数据项目,包括那些熟悉的企业数据管理问题又会涌现出来了,比如Apache Hadoop数据的安全性,可靠性,性能和如何保护数据。
虽然Apache Hadoop HDFS已经趋于成熟,但仍有不少差距以满足企业需求。事实证明,当Apache Hadoop大数据在进行产品生产数据收集时,这些存储集群上的产品可能实际上没有提供最低的成本核算。
这里面,最关键的一点其实是大企业如何将Apache Hadoop大数据盘活了。我们当然不是想简单地拷贝、移动、备份Apache Hadoop大数据数据副本,复制Apache Hadoop大数据是一个大的工作。我们需要管理作为安全和谨慎,甚至更多的要求,所以,比小的不同的Apache Hadoop数据库,不要抱着尽可能多的Apache Hadoop详细信息。如果我们的关键业务流程的基础上新的Apache Hadoop大数据的储存中,我们会需要它的所有的操作弹性和高性能。
更多Apache相关知识,请访问Apache使用教程栏目!
Atas ialah kandungan terperinci apache hadoop是什么?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!