发布网友 发布时间:2022-04-22 21:47
共3个回答
热心网友 时间:2022-04-08 21:14
hadoop是一款开源软件,主要用于分布式存储和计算,他由HDFS和MapRece计算框架组成的,他们分别是Google的GFS和MapRece的开源实现。由于hadoop的易用性和可扩展性,因此成为最近流行的海量数据处理框架。hadoop这个单词来源于其发明者的儿子为一个玩具大象起的名字。热心网友 时间:2022-04-08 22:32
没有任何意思,一个软件的名称,是创始人的儿子在玩玩具大象时候嘴里嘟囔的声音。分布式计算的基础框架,基于Google的Map/Rece论文的Java实现版,类似的还有HyperTable和BigTable热心网友 时间:2022-04-09 00:07
Hadoop在2006年开始成为雅虎项目,随后晋升为顶级Apache开源项目。它是一种通用的分布式系统基础架构,具有多个组件:Hadoop分布式文件系统(HDFS),它将文件以Hadoop本机格式存储并在集群中并行化; YARN,协调应用程序运行时的调度程序; MapRece,这是实际并行处理数据的算法。Hadoop使用Java编程语言构建,其上的应用程序也可以使用其他语言编写。用一个Thrift客户端,用户可以编写MapRece或者Python代码。