问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

如何在Linux上安装与配置Hadoop-IT168 技术开发专区

发布网友 发布时间:2022-04-21 19:03

我来回答

1个回答

热心网友 时间:2022-04-12 12:34

在Linux上安装Hadoop之前,需要先安装两个程序:
  1. JDK 1.6或更高版本;
  2. SSH(安全外壳协议),推荐安装OpenSSH。
  下面简述一下安装这两个程序的原因:
  1. Hadoop是用Java开发的,Hadoop的编译及MapRece的运行都需要使用JDK。
 
 2.
Hadoop需要通过SSH来启动salve列表中各台主机的守护进程,因此SSH也是必须安装的,即使是安装伪分布式版本(因为Hadoop并没有区分
集群式和伪分布式)。对于伪分布式,Hadoop会采用与集群相同的处理方式,即依次序启动文件conf/slaves中记载的主机上的进程,只不过伪分
布式中salve为localhost(即为自身),所以对于伪分布式Hadoop,SSH一样是必须的。
  一、安装JDK 1.6
  安装JDK的过程很简单,下面以Ubuntu为例。
  (1)下载和安装JDK
  确保可以连接到互联网,输入命令:
sudo apt-get install sun-java6-jdk
  输入密码,确认,然后就可以安装JDK了。
 
 这里先解释一下sudo与apt这两个命令,sudo这个命令允许普通用户执行某些或全部需要root权限命令,它提供了详尽的日志,可以记录下每个用
户使用这个命令做了些什么操作;同时sudo也提供了灵活的管理方式,可以*用户使用命令。sudo的配置文件为/etc/sudoers。
 
 apt的全称为the Advanced Packaging
Tool,是Debian计划的一部分,是Ubuntu的软件包管理软件,通过apt安装软件无须考虑软件的依赖关系,可以直接安装所需要的软件,apt
会自动下载有依赖关系的包,并按顺序安装,在Ubuntu中安装有apt的一个图形化界面程序synaptic(中文译名为“新立得”),大家如果有兴趣
也可以使用这个程序来安装所需要的软件。(如果大家想了解更多,可以查看一下关于Debian计划的资料。)
  (2)配置环境变量
  输入命令:
sudo gedit /etc/profile
  输入密码,打开profile文件。
  在文件的最下面输入如下内容:
#set Java Environment
export JAVA_HOME= (你的JDK安装位置,一般为/usr/lib/jvm/java-6-sun)
export CLASSPATH=".:$JAVA_HOME/lib:$CLASSPATH"
export PATH="$JAVA_HOME/:$PATH"
  这一步的意义是配置环境变量,使你的系统可以找到JDK。
  (3)验证JDK是否安装成功
  输入命令:
java -version
  查看信息:
java version "1.6.0_14"
Java(TM) SE Runtime Environment (build 1.6.0_14-b08)
Java HotSpot(TM) Server VM (build 14.0-b16, mixed mode)
 二、配置SSH免密码登录
  同样以Ubuntu为例,假设用户名为u。
  1)确认已经连接上互联网,输入命令
sudo apt-get install ssh
  2)配置为可以无密码登录本机。
  首先查看在u用户下是否存在.ssh文件夹(注意ssh前面有“.”,这是一个隐藏文件夹),输入命令:
ls -a /home/u
  一般来说,安装SSH时会自动在当前用户下创建这个隐藏文件夹,如果没有,可以手动创建一个。
  接下来,输入命令:
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
 
 解释一下,ssh-keygen代表生成密钥;-t(注意区分大小写)表示指定生成的密钥类型;dsa是dsa密钥认证的意思,即密钥类型;-P用于提
供密语;-f指定生成的密钥文件。(关于密钥密语的相关知识这里就不详细介绍了,里面会涉及SSH的一些知识,如果读者有兴趣,可以自行查阅资料。)
  在Ubuntu中,~代表当前用户文件夹,这里即/home/u。
  这个命令会在.ssh文件夹下创建两个文件id_dsa及id_dsa.pub,这是SSH的一对私钥和公钥,类似于钥匙及锁,把id_dsa.pub(公钥)追加到授权的key里面去。
  输入命令:
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
  这段话的意思是把公钥加到用于认证的公钥文件中,这里的authorized_keys是用于认证的公钥文件。
  至此无密码登录本机已设置完毕。
  3)验证SSH是否已安装成功,以及是否可以无密码登录本机。
  输入命令:
ssh -version
  显示结果:
OpenSSH_5.1p1 Debian-6ubuntu2, OpenSSL 0.9.8g 19 Oct 2007
Bad escape character 'rsion'.
  显示SSH已经安装成功了。
  输入命令:
ssh localhost
  会有如下显示:
The authenticity of host 'localhost (::1)' can't be established.
RSA key fingerprint is 8b:c3:51:a5:2a:31:b7:74:06:9d:62:04:4f:84:f8:77.
Are you sure you want to continue connecting (yes/no)? yes
Warning: Permanently added 'localhost' (RSA) to the list of known hosts.
Linux master 2.6.31-14-generic #48-Ubuntu SMP Fri Oct 16 14:04:26 UTC 2009 i686

To access official Ubuntu documentation, please visit:
http://help.ubuntu.com/

Last login: Mon Oct 18 17:12:40 2010 from master
admin@Hadoop:~$
  这说明已经安装成功,第一次登录时会询问你是否继续链接,输入yes即可进入。
 
 实际上,在Hadoop的安装过程中,是否无密码登录是无关紧要的,但是如果不配置无密码登录,每次启动Hadoop,都需要输入密码以登录到每台机器
的DataNode上,考虑到一般的Hadoop集群动辄数百台或上千台机器,因此一般来说都会配置SSH的无密码登录。

 三、安装并运行Hadoop
  介绍Hadoop的安装之前,先介绍一下Hadoop对各个节点的角色定义。
 
 Hadoop分别从三个角度将主机划分为两种角色。第一,划分为master和slave,即主人与奴隶;第二,从HDFS的角度,将主机划分为
NameNode和DataNode(在分布式文件系统中,目录的管理很重要,管理目录的就相当于主人,而NameNode就是目录管理者);第三,从
MapRece的角度,将主机划分为JobTracker和TaskTracker(一个job经常被划分为多个task,从这个角度不难理解它们之
间的关系)。
  Hadoop有官方发行版与cloudera版,其中cloudera版是Hadoop的商用版本,这里先介绍Hadoop官方发行版的安装方法。
  Hadoop有三种运行方式:单节点方式、单机伪分布方式与集群方式。乍看之下,前两种方式并不能体现云计算的优势,在实际应用中并没有什么意义,但是在程序的测试与调试过程中,它们还是很有意义的。
  你可以通过以下地址获得Hadoop的官方发行版:
  http://www.apache.org/dyn/closer.cgi/Hadoop/core/
  下载Hadoop-0.20.2.tar.gz并将其解压,这里会解压到用户目录下,一般为:/home/[你的用户名]/。
  单节点方式配置:
  安装单节点的Hadoop无须配置,在这种方式下,Hadoop被认为是一个单独的Java进程,这种方式经常用来调试。
  伪分布式配置:
  你可以把伪分布式的Hadoop看做是只有一个节点的集群,在这个集群中,这个节点既是master,也是slave;既是NameNode也是DataNode;既是JobTracker,也是TaskTracker。
  伪分布式的配置过程也很简单,只需要修改几个文件,如下所示。
  进入conf文件夹,修改配置文件:
Hadoop-env.sh:
export JAVA_HOME=“你的JDK安装地址”
  指定JDK的安装位置:
conf/core-site.xml:
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
  这是Hadoop核心的配置文件,这里配置的是HDFS的地址和端口号。
conf/hdfs-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
  这是Hadoop中HDFS的配置,配置的备份方式默认为3,在单机版的Hadoop中,需要将其改为1。
conf/mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
  这是Hadoop中MapRece的配置文件,配置的是JobTracker的地址和端口。
  需要注意的是,如果安装的是0.20之前的版本,那么只有一个配置文件,即为Hadoop-site.xml。
  接下来,在启动Hadoop前,需格式化Hadoop的文件系统HDFS(这点与Windows是一样的,重新分区后的卷总是需要格式化的)。进入Hadoop文件夹,输入下面的命令:
bin/Hadoop NameNode -format
  格式化文件系统,接下来启动Hadoop。
  输入命令:
bin/start-all.sh(全部启动)
  最后,验证Hadoop是否安装成功。
  打开浏览器,分别输入网址:
  http://localhost:50030 (MapRece的Web页面)
  http://localhost:50070 (HDFS的Web页面)
  如果都能查看,说明Hadoop已经安装成功。
  对于Hadoop来说,安装MapRece及HDFS都是必须的,但是如果有必要,你依然可以只启动HDFS(start-dfs.sh)或MapRece(start-mapred.sh)。
如何在Linux上安装与配置Hadoop-IT168 技术开发专区

(1)下载和安装JDK 确保可以连接到互联网,输入命令:sudo apt-get install sun-java6-jdk 输入密码,确认,然后就可以安装JDK了。这里先解释一下sudo与apt这两个命令,sudo这个命令允许普通用户执行某些或全部需要root权限命令,它提供了详尽的日志,可以记录下每个用户使用这个命令做了些什么操作;同时sudo...

如何在Linux上安装与配置Hadoop-IT168 技术开发专区

Tool,是Debian计划的一部分,是Ubuntu的软件包管理软件,通过apt安装软件无须考虑软件的依赖关系,可以直接安装所需要的软件,apt 会自动下载有依赖关系的包,并按顺序安装,在Ubuntu中安装有apt的一个图形化界面程序synaptic(中文译名为“新立得”),大家如果有兴趣 也可以使用这个程序来安装所需要的软件。

如何在Linux上安装与配置Hadoop

一、安装hadoop 1 因为hadoop是基于java的,所以要保证hadoop能找到在本地系统中大路径,即正确设置java的环境变量。详细请看:linux 安装配置jdk 2 到官网: 下载hadoop,这里我选择hadoop1.0.4 3 解压到 /usr/local tar -xvf hadoop-1.0.4.tar.gz 4 设置hadoop环境变量,为了使环境变量永久有效...

linux搭建环境部署项目linux搭建环境

在linux系统上怎么搭建hadoop开发环境?A、基础环境 1.jdk安装与配置 2.host 3.ssh 4.文件目录B、Hadoop安装与配置1.下载hadoop软件2.环境变量3.hadoop配置C、运行Hadoop1.运行hdfs2.运行yarnD、测试hadoop,这是搭建集群的大题路径,详细的可以去看一下八斗学院的视频,第一部分是讲集群搭建的很详细...

linux的开发环境linux下开发环境

所以我建议你,要熟悉Linux的终端命令,熟悉vi的使用,了解Linux操作系统。会给你日后工作和进入外企带来很多方便。在linux系统上怎么搭建hadoop开发环境?A、基础环境 1.jdk安装与配置 2.host 3.ssh 4.文件目录B、Hadoop安装与配置1.下载hadoop软件2.环境变量3.hadoop配置C、运行Hadoop1.运行hdfs2.运行...

Hadoop技术内幕的作品目录

Hadoop配置文件的格式/ 242.2.2 Configuration的成员变量/ 262.2.3 资源加载/ 272.2.4 使用get*和set*访问/设置配置项/ 322.3 Configurable接口/ 342.4 小结/ 35第3章 序列化与压缩/ 363.1 序列化/ 363.1.1 Java内建序列化机制/ 363.1.2 Hadoop序列化机制/ 383.1.3 Hadoop...

请问关于VMware12 下安装与配置CentOS 6.5 64位 的方法

前言:本人在配置Hadoop的过程中,需要搭建Cent OS 64 环境,借此,顺便将Cent OS 64 的安装在此记录,方便自己,也方便大家学习。本次是在VM12虚拟机中实现Cent OS 64 的安装以及配置,后续还会有Hadoop的安装配置教程,我们先来进行第一步。一、VMware 12 Install CentOS 64(Linux)OS create a new...

如何在MacOSX上安装Hadoop

export HADOOP_HOME=/users/billy/hadoop export PATH=$PATH:$HADOOP_HOME/bin 配置hadoop-env.sh 在Hadoop-&gt;conf目录下,找到hadoop-env.sh,打开编辑进行如下设置:export JAVA_HOME=/library/Java/Home(去掉注释)export HADOOP_HEAPSIZE=2000(去掉注释)export HADOOP_OPTS="-Djava.security.krb5....

为什么运行不成功 spark

安装过程十分简单,运行二进制可执行文件即可,程序会自动配置环境变量。(2)安装Cygwin Cygwin是在Windows平台下模拟Linux环境的一个非常有用的工具,只有通过它才可以在Windows环境下安装Hadoop和Spark。具体安装步骤如下。1)运行安装程序,选择install from internet。2)选择网络最好的下载源进行下载。3)...

eclipse 怎么安装eclipse-plugin-1.1.2插件

步骤一:下载Hadoop-Eclipse-Plugin-1.1.2插件。然后确保插件里/lib目录下的各文件与/home/zhadbngiii/hadoop-1.1.2/lib目录里的版本型号一样。若不一样,当然是要改动插件里的版本型号,使其与hadoop里的一致,不要弄反了。至于原因参考网上资料即可。同时还要修改插件里的MANIFEST.MF文件,如图6-...

idea安装与配置详解 win10安装要求配置 nodejs安装及环境配置 plsql安装教程及配置 it技术 博途v15对电脑配置要求 ps对电脑配置的要求 IT专业 怎么看电脑的配置
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
稀饭煮干后加水还能保持原有的营养吗? 喝咖啡的十大好处,喝黑咖啡有什么好处(解酒护肝/提神醒脑) 旺仔牛奶能做什么好吃的 旺仔牛奶适合做什么美食? 酒桌文化是怎样的? 白网运动鞋怎么洗白妙招 白色的网鞋怎么清洗 挂晒辣椒的正确方法 炸出来的辣椒段,爱绵,怎么办? 怎样加密手机软件? 护士需要学什么 hadoop 1.0.3 启动data node时让输入name node密码... hadoop 配置问题 ssh已经设置无密码登录了,但hadoop启动时提示要输... 在hadoop创建ssh无密码登录中,root输入了su - had... hadoop在进行伪分布式搭建时ssh必须配置成无密码登... 如何在Linux上安装与配置Hadoop 我的hadoop配置免密码登陆时出现的问题,求帮忙 hadoop子节点之间要免密码登陆吗 配置hadoop分布式集群一台虚拟系统,二台实体系统... 配置hadoop时,linux系统ssh免登录密码是充分条件吗 linux hadoop搭建集群环境 是不是每个系统都要配置... centos安装hadoop配置免密码登陆是每台主机都需要... hadoop集群为什么需要免密码登陆 搭建hadoop集群为什么要设置SSH无密码登录? 在进行hadoop安装中的ssh免密码设置时,为了让主结... Hadoop配置时配置ssh免密登录遇到的问题 利雅路燃烧机rs50 怎么接线 利雅路燃烧机检漏阀组怎么接线啊? 食品科学与工程的专业的考研历年真题(各大名校的... 跪求东北农业大学食品科学与工程专业考研真题?买... hadoop hue配置文件怎样设置加密密码 hadoop hue配置文件怎样设置加密密码 wps的表格打不开怎么办? wps的excel为什么打不开 WPS的电子表格总是打不开,一直提示正在打开文档,... wps表格数据怎么在excel2003某些版本中打不开啊? Microsoft Excel打不开WPS建的表格? 我的WPS表格打不开怎么办?急急 我装的是2010年WPS抢先版,excel今天突然打不开,以... 我用的是WPS版本的excel, 我输入了内容,可是表格... 安装了WPS。excel表格打不开??? wps文件到excel里打不开怎么办 XLS格式的表格用EXCEL和WPS斗打不开 怎么回事 WPS 打不开EXCEL文件的问题 水星合月的介绍 水星合月的希腊神话 站在地球上看天空离月亮最亮的一颗星星叫什么? 在今年在中国还有哪些可观测的天文奇观最好是壮观的 木柜用玻璃胶粘墙上,如何去玻璃胶,分离柜子与墙! 本月的天文现象