导航：首页 > 互联网科技 >

hadoop 分布式集群初步搭建

发表于：2025-02-02 作者：千家信息网编辑

千家信息网最后更新 2025年02月02日，一、配置环境1.设置主机名和对应的地址映射[root@master ~]# cat /etc/hosts127.0.0.1 localhost localhost.localdomain loca

千家信息网最后更新 2025年02月02日hadoop 分布式集群初步搭建

一、配置环境

1.设置主机名和对应的地址映射

[root@master ~]# cat /etc/hosts127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4::1         localhost localhost.localdomain localhost6 localhost6.localdomain6192.168.230.130 master192.168.230.131 slave1192.168.230.100 slave2#分别对三台设备配置hostname和hosts

2.在三个节点上分别新建hadoop用户

[root@master ~]# tail -1 /etc/passwdhadoop:x:1001:1001::/home/hadoop:/bin/bash

二、为hadoop配置所有节点之间的ssh免密登陆

1.生成密钥

[hadoop@master ~]$ ssh-keygen -t rsaGenerating public/private rsa key pair.Enter file in which to save the key (/home/hadoop/.ssh/id_rsa): /home/hadoop/.ssh/id_rsa already exists.Overwrite (y/n)? yEnter passphrase (empty for no passphrase): Enter same passphrase again: Your identification has been saved in /home/hadoop/.ssh/id_rsa.Your public key has been saved in /home/hadoop/.ssh/id_rsa.pub.The key fingerprint is:1c:16:61:04:4f:76:93:cd:da:9a:08:04:15:58:7d:96 hadoop@masterThe key's randomart p_w_picpath is:+--[ RSA 2048]----+|    .===B.o=     ||    . .=.oE.o    ||     .  +o o     ||      .o .. .    ||       .S. o     ||        . o      ||                 ||                 ||                 |+-----------------+[hadoop@master ~]$

2.发送公钥

[hadoop@master ~]$ ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@slave1The authenticity of host 'slave1 (192.168.230.131)' can't be established.ECDSA key fingerprint is 32:1a:8a:37:f8:11:bc:cc:ec:35:e6:37:c2:b8:e1:45.Are you sure you want to continue connecting (yes/no)? yes/usr/bin/ssh-copy-id: INFO: attempting to log in with the new key(s), to filter out any that are already installed/usr/bin/ssh-copy-id: INFO: 1 key(s) remain to be installed -- if you are prompted now it is to install the new keyshadoop@slave1's password: Number of key(s) added: 1Now try logging into the machine, with:   "ssh 'hadoop@slave1'"and check to make sure that only the key(s) you wanted were added.[hadoop@master ~]$

[hadoop@master ~]$ ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@slave2[hadoop@master ~]$ ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop@master#slave1和slave2对其他节点略

3.验证登陆

[hadoop@master ~]$ ssh hadoop@slave1Last login: Wed Jul 26 01:11:22 2017 from master[hadoop@slave1 ~]$ exitlogoutConnection to slave1 closed.[hadoop@master ~]$ ssh hadoop@slave2Last login: Wed Jul 26 13:12:00 2017 from master[hadoop@slave2 ~]$ exitlogoutConnection to slave2 closed.[hadoop@master ~]$

三、配置JAVA

1.使用xftp将hadoop-2.7.3.tar.gz和jdk-8u131-linux-x64.tar.gz上传至master

[hadoop@master ~]$ lshadoop-2.7.3.tar.gz  jdk-8u131-linux-x64.tar.gz

2.使用root用户解压并移动到/usr/local 下

[hadoop@master ~]$ exitexit[root@master ~]# cd /home/hadoop/[root@master hadoop]# lshadoop-2.7.3.tar.gz  jdk-8u131-linux-x64.tar.gz[root@master hadoop]# tar -zxf jdk-8u131-linux-x64.tar.gz [root@master hadoop]# lshadoop-2.7.3.tar.gz  jdk1.8.0_131  jdk-8u131-linux-x64.tar.gz[root@master hadoop]# mv jdk1.8.0_131 /usr/local/[root@master hadoop]# cd /usr/local/[root@master local]# lsbin  etc  games  include  jdk1.8.0_131  lib  lib64  libexec  sbin  share  src[root@master local]#

3.配置java环境变量（这里使用的是全局变量）

[root@master ~]# vim /etc/profile    #在文件末尾添加如下java环境变量[root@master ~]# tail -5 /etc/profileexport JAVA_HOME=/usr/local/jdk1.8.0_131    #注意jdk版本export JRE_HOME=$JAVA_HOME/jre export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib export PATH=$JAVA_HOME/bin:$PATH[root@master ~]#[root@master ~]# source /etc/profile    #使配置生效

4.测试master上的java是否配置完成

[root@master ~]# java -versionjava version "1.8.0_131"Java(TM) SE Runtime Environment (build 1.8.0_131-b11)Java HotSpot(TM) 64-Bit Server VM (build 25.131-b11, mixed mode)[root@master ~]#

5.使用scp将jdk拷贝到slave1和slave2

[root@master ~]# scp -r /usr/local/jdk1.8.0_131/ root@slave1:/usr/local/[root@master ~]# scp -r /usr/local/jdk1.8.0_131/ root@slave2:/usr/local/

6.配置slave1和slave2上的环境变量（同步骤3），配置完后使用java -version验证一下

四、配置hadoop环境

1.解压hadoop并移动到/usr/local 下

[root@master ~]# cd /home/hadoop/[root@master hadoop]# lshadoop-2.7.3.tar.gz  jdk-8u131-linux-x64.tar.gz[root@master hadoop]# tar -zxf hadoop-2.7.3.tar.gz [root@master hadoop]# mv hadoop-2.7.3 /usr/local/hadoop[root@master hadoop]# ls /usr/local/bin  etc  games  hadoop  include  jdk1.8.0_131  lib  lib64  libexec  sbin  share  src

2.更改hadoop的文件所属用户

[root@master ~]# cd /usr/local[root@master local]# chown -R hadoop:hadoop /usr/local/hadoop[root@master local]# lldrwxr-xr-x  9 hadoop hadoop 149 Aug 17  2016 hadoop[root@master local]#

3.配置hadoop环境变量

[root@master local]# vim /etc/profile[root@master local]# tail -4 /etc/profile#hadoopexport HADOOP_HOME=/usr/local/hadoop    #注意路径export PATH="$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin"[root@master local]# [root@master local]# source /etc/profile    #使配置生效

4.测试

[root@master local]# hadoop versionHadoop 2.7.3Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r baa91f7c6bc9cb92be5982de4719c1c8af91ccffCompiled by root on 2016-08-18T01:41ZCompiled with protoc 2.5.0From source with checksum 2e4ce5f957ea4db193bce3734ff29ff4This command was run using /usr/local/hadoop/share/hadoop/common/hadoop-common-2.7.3.jar[root@master local]#

5.配置hadoop-env.sh

[root@master local]# cd $HADOOP_HOME/etc/hadoop[root@master hadoop]# pwd/usr/local/hadoop/etc/hadoop[root@master hadoop]# [root@master hadoop]# vim hadoop-env.sh [root@master hadoop]# tail -1 hadoop-env.sh export JAVA_HOME=/usr/local/jdk1.8.0_131    #在末尾添加[root@master hadoop]#

6.配置core-site.xml

            fs.defaultFS        hdfs://master:9000

7.配置hdfs-site.xml

              dfs.replication      1            #目录不存在需要手动创建，并把所属改为hadoop          dfs.namenode.name.dir      /usr/local/hadoop/dfs/name                #目录不存在需要手动创建，并把所属改为hadoop          dfs.datanode.data.dir      /usr/local/hadoop/dfs/data

8.配置yarn-site.xml

                yarn.resourcemanager.hostname        master                    yarn.nodemanager.aux-services        mapreduce_shuffle

9.配置mapred-site.xml

[root@master hadoop]# cp mapred-site.xml.template mapred-site.xml[root@master hadoop]# vim mapred-site.xml            mapreduce.framework.name        yarn

10.配置slaves

[root@master hadoop]# vim slaves [root@master hadoop]# cat slaves slave1slave2[root@master hadoop]#

11.使用scp将配置好的hadoop传输到slave1和slave2节点上

[root@master ~]# scp -r /usr/local/hadoop root@slave1:/usr/local/[root@master ~]# scp -r /usr/local/hadoop root@slave2:/usr/local/

12.配置slave1和slave2上的环境变量（同步骤3），配置完后使用hadoop version验证一下

13.格式化 hdfs namenode-format

[root@master hadoop]# su hadoop[hadoop@master hadoop]$ cd /usr/local/hadoop/[hadoop@master hadoop]$ hdfs namenode -format    #一定要在hadoop用户下进行17/07/26 20:26:12 INFO namenode.NameNode: STARTUP_MSG: /************************************************************STARTUP_MSG: Starting NameNodeSTARTUP_MSG:   host = master/192.168.230.130STARTUP_MSG:   args = [-format]STARTUP_MSG:   version = 2.7.3...17/07/26 20:26:15 INFO util.ExitUtil: Exiting with status 0    #status 为0才是成功17/07/26 20:26:15 INFO namenode.NameNode: SHUTDOWN_MSG: /************************************************************SHUTDOWN_MSG: Shutting down NameNode at master/192.168.230.130************************************************************/[hadoop@master hadoop]$

五、启动hadoop服务

1.启动所有的服务

[hadoop@master dfs]$ start-all.sh This script is Deprecated. Instead use start-dfs.sh and start-yarn.shStarting namenodes on [master]hadoop@master's password:     #输入master上的hadoop的密码master: starting namenode, logging to /usr/local/hadoop/logs/hadoop-hadoop-namenode-master.outslave1: starting datanode, logging to /usr/local/hadoop/logs/hadoop-hadoop-datanode-slave1.outslave2: starting datanode, logging to /usr/local/hadoop/logs/hadoop-hadoop-datanode-slave2.outStarting secondary namenodes [0.0.0.0]hadoop@0.0.0.0's password:     #输入master上的hadoop的密码0.0.0.0: starting secondarynamenode, logging to /usr/local/hadoop/logs/hadoop-hadoop-secondarynamenode-master.outstarting yarn daemonsstarting resourcemanager, logging to /usr/local/hadoop/logs/yarn-hadoop-resourcemanager-master.outslave1: starting nodemanager, logging to /usr/local/hadoop/logs/yarn-hadoop-nodemanager-slave1.outslave2: starting nodemanager, logging to /usr/local/hadoop/logs/yarn-hadoop-nodemanager-slave2.out[hadoop@master dfs]$

2.验证

[hadoop@master dfs]$ jps    #master上的进程7491 Jps6820 NameNode7014 SecondaryNameNode7164 ResourceManager[hadoop@master dfs]$

[root@slave1 name]# jps    #slave1上的进程3160 NodeManager3050 DataNode3307 Jps[root@slave1 name]#

[root@slave2 name]# jps     #slave2上的进程3233 DataNode3469 Jps3343 NodeManager[root@slave2 name]#

3.使用浏览器管理

六、总结

1.格式化 hdfs namenode-format时是root用户，导致/usr/local/hadoop/dfs/data目录权限为root。切换为hadoop用户启动时发现NameNode启动不了；

2.出现问题分析日志文件找出问题原因才能有针对性的解决；

很赞哦！

配置环境变量用户节点验证所属文件目录进程密码手动末尾格式步骤问题服务测试登陆移动数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全计算机三级网络技术软件破解头条极速版登录服务器错误霜狼服务器什么矿石值钱学服务器烧钱吗 php下拉列表读数据库小学生网络安全存在问题红盟网络安全安全链接数据库很慢服务器配件供应商利润数据库不能自动清理备份文件阿里服务器设备价值数据库实验表连接查询软件开发验收监理的职责数据库869 中国数据库软件供应商金蝶数据库中间层分开部署网络安全第五轮学科评估a类大学数据库null值怎么查询服务器搭建与安全维护打印机扫描接收方服务器关闭软件开发的需求活动主要任务网络技术在教学中的优势普法考试网络安全法题目衢州学院计算机网络技术第七届中国网络安全年会 2021合肥网络安全大会作战学习数据库三型网络技术wlan 广西璞栈互联网科技有限公司淘宝封号网络安全

千家信息网

千家信息网

hadoop 分布式集群初步搭建

Hive常用的SQL有哪些

Java 嵌入 SPL 轻松实现数据分组

相关文章