问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

大数据技术平台有哪些?

发布网友 发布时间:2022-03-24 04:18

我来回答

5个回答

热心网友 时间:2022-03-24 05:48

Java :只要了解一些基础即可,做大数据不需要很深的Java 技术,学java SE 就相当于有学习大数据。基础

Linux:因为大数据相关软件都是在Linux上运行的,所以Linux要学习的扎实一些,学好Linux对你快速掌握大数据相关技术会有很大的帮助,能让你更好的理解hadoop、hive、hbase、spark等大数据软件的运行环境和网络环境配置,能少踩很多坑,学会shell就能看懂脚本这样能更容易理解和配置大数据集群。还能让你对以后新出的大数据技术学习起来更快。

好说完基础了,再说说还需要学习哪些大数据技术,可以按我写的顺序学下去。

Hadoop:这是现在流行的大数据处理平台几乎已经成为大数据的代名词,所以这个是必学的。Hadoop里面包括几个组件HDFS、MapRece和YARN,HDFS是存储数据的地方就像我们电脑的硬盘一样文件都存储在这个上面,MapRece是对数据进行处理计算的,它有个特点就是不管多大的数据只要给它时间它就能把数据跑完,但是时间可能不是很快所以它叫数据的批处理。

记住学到这里可以作为你学大数据的一个节点。

Zookeeper:这是个万金油,安装Hadoop的HA的时候就会用到它,以后的Hbase也会用到它。它一般用来存放一些相互协作的信息,这些信息比较小一般不会超过1M,都是使用它的软件对它有依赖,对于我们个人来讲只需要把它安装正确,让它正常的run起来就可以了。

Mysql:我们学习完大数据的处理了,接下来学习学习小数据的处理工具mysql数据库,因为一会装hive的时候要用到,mysql需要掌握到什么程度,你能在Linux上把它安装好,运行起来,会配置简单的权限,修改root的密码,创建数据库。这里主要的是学习SQL的语法,因为hive的语法和这个非常相似。

Sqoop:这个是用于把Mysql里的数据导入到Hadoop里的。当然你也可以不用这个,直接把Mysql数据表导出成文件再放到HDFS上也是一样的,当然生产环境中使用要注意Mysql的压力。

Hive:这个东西对于会SQL语法的来说就是神器,它能让你处理大数据变得很简单,不会再费劲的编写MapRece程序。有的人说Pig那?它和Pig差不多掌握一个就可以了。

Oozie:既然学会Hive了,我相信你一定需要这个东西,它可以帮你管理你的Hive或者MapRece、Spark脚本,还能检查你的程序是否执行正确,出错了给你发报警并能帮你重试程序,最重要的是还能帮你配置任务的依赖关系。我相信你一定会喜欢上它的,不然你看着那一大堆脚本,和密密麻麻的crond是不是有种想屎的感觉。

Hbase:这是Hadoop生态体系中的NOSQL数据库,他的数据是按照key和value的形式存储的并且key是唯一的,所以它能用来做数据的排重,它与MYSQL相比能存储的数据量大很多。所以他常被用于大数据处理完成之后的存储目的地。

Kafka:这是个比较好用的队列工具,队列是干吗的?排队买票你知道不?数据多了同样也需要排队处理,这样与你协作的其它同学不会叫起来,你干吗给我这么多的数据(比如好几百G的文件)我怎么处理得过来,你别怪他因为他不是搞大数据的,你可以跟他讲我把数据放在队列里你使用的时候一个个拿,这样他就不在抱怨了马上灰溜溜的去优化他的程序去了,因为处理不过来就是他的事情。而不是你给的问题。当然我们也可以利用这个工具来做线上实时数据的入库或入HDFS,这时你可以与一个叫Flume的工具配合使用,它是专门用来提供对数据进行简单处理,并写到各种数据接收方(比如Kafka)的。

Spark:它是用来弥补基于MapRece处理数据速度上的缺点,它的特点是把数据装载到内存中计算而不是去读慢的要死进化还特别慢的硬盘。特别适合做迭代运算,所以算法流们特别稀饭它。它是用scala编写的。Java语言或者Scala都可以操作它,因为它们都是用JVM的。

热心网友 时间:2022-03-24 07:06

百度指数、国家统计局、百度商情、纽扣数据、百度推广、360大数据平台、易车指数、高德地图、移动观测台、艾瑞网。

热心网友 时间:2022-03-24 08:40

大数据信息是大量高速,且多变的借助大数据工具及相关技术可针对不同的行为特征的用户进行针对性的营销。目前主流的十佳权威大数据分析平台主要有阿里巴巴、百度、腾讯、高德开放平台、鹿豹座大数据研究院、友盟、华为云服务、浪潮、神州融、海康威视。

热心网友 时间:2022-03-24 10:32

比如Java,大数据不需要太深的Java技术,所以有点基础就可以了,其次是Linux,大数据基本是在这个平台上运行的,所以对于这个平台需要一定的掌握才行。
最后还有就是Hadoop,星环,浪潮,帆软,海云数据等等

热心网友 时间:2022-03-24 12:40

1、 数据库&数据平台类,星环。专注于Hadoop生态系列的大数据平台公司。Hadoop是开源的,星环将Hadoop不稳定的部分优化,功能细化,为所有企业提供Hadoop大数据引擎及数据库工具。
2、 大数据存储硬件类,浪潮。浪潮是很老牌的IT公司,在大数据方面一直稳扎稳打研究存储,在大数据存储方面国内领先。3、 云端大数据,阿里巴巴。这个不多说,明星产品-阿里云,与亚马逊AWS抗衡,做公有云、私有云、混合云。
4、数据应用方面,帆软、海云数据。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
苹果电脑电池充不进电苹果电脑充不进去电是怎么回事 苹果电脑不充电没反应苹果电脑充电指示灯不亮充不了电怎么办 狗狗更加忠诚护家、善解人意,养一只宠物陪伴自己,泰迪能长多大... 描写泰迪狗的外形和特点的句子 国外留学有用吗 花钱出国留学有用吗 !这叫什么号 百万医疗赔付后是否可以续保 前一年理赔过医疗险还能续保吗? 医疗住院险理赔后还能购买吗? 大数据平台架构有哪些? 大数据管理平台是什么?是如何应用的? 什么是旅游大数据平台 大数据是什么,干什么用的?包含哪些内容?哪些技术?解决什么问题? 大数据平台架构如何进行 包括哪些方面 大数据平台具有哪些特点? 大数据分析平台有什么作用? 什么是大数据采集平台? 什么是大数据,有什么好的大数据平台? 大数据平台有什么特点? 大数据平台的目的和意义,其主要内容和能达到的经济利益和社会效益是什么? 大数据平台是什么?什么时候需要大数据平台?如何建立大数据平台? 大数据服务平台是什么?有什么用? 大数据平台是什么 什么是大数据平台? 在手机怎么打印文件 如何用手机打印 手机怎么在打印机打印 手机如何直接打印文件 手机如何打印 智慧环保大数据平台是什么? 大数据生态平台是什么? 大数据分析平台具有哪些价值? 大数据的起源是哪里? 大数据的三大主要来源 大数据主要来源于什么 大数据的来源有哪些 大数据来源于什么? 大数据的中的数据是从哪里来的? 大数据的起源是金融还是公共管理,互联网 人人都在说大数据,那大数据概念是怎么产生的 你好,我想问一下,大数据的数据来源有哪些方面 大数据起源,给你解析到底什么是大数据 大数据来源的几种类型 什么是大数据,通俗的讲 医疗健康领域的大数据来源有哪些 大数据来源有哪些 大数据时代:大数据是什么? 大数据的由来是什么? 大数据主要来源于人,机,物,数吗