简要说明应用hadoop的解决方案,并跟其它方案做对比说明hadoop的优势在什么地方
发布网友
发布时间:2022-05-16 01:27
我来回答
共1个回答
热心网友
时间:2023-10-08 17:00
在Ganglia框架的帮助下,整个系统可以被监测而且能对节点的健康状态进行跟踪。另外,参数配置功能提供了对MapRece的任务控制。Hadoop系统有很好的灵活性可以轻松搞定整个系统的级别控制。
可扩展的持久性。有许多选择可以处置海量的结构化和非结构化的数据,但是储存海量数据的可扩展性仍然是数据世界中的主要问题之一。Hadoop系统计划用Accumulo来缓解这个问题。Accumulo是被谷歌的BigTable的设计所启发的,而且创建在Hadoop、Zookeeper和Thrift的基础之上,同时它给Hadoop提供可扩展的、分布式的、且基于单元持久性的数据备份。Acumulo带来了一些BigTable设计之上的改良,以一种基于单元的访问控制和服务器端的编程机制来帮助在数据治理过程中修改差别点的键/值对。
Hadoop中的数据读取和写入发生在HDFS上。HDFS即Hadoop的分布式文件系统,而且是具有容错性的分布式文件系统。它在对进行文件流读取的大型文件进行了优化,而且和I/O吞吐量相比,更倾向于低延迟。有许多可以高效的从HDFS中读取和写入文件的方法,好比说API文件系统、MapRece以及高级串行化库等。