千家信息网

大数据之---hadoop伪分布式部署(HDFS)全网终极篇

发表于:2025-01-31 作者:千家信息网编辑
千家信息网最后更新 2025年01月31日,1、软件环境RHEL6jdk-8u45hadoop-2.8.1.tar.gzsshxx.xx.xx.xx ip地址hadoop1xx.xx.xx.xx ip地址hadoop2xx.xx.xx.xx i
千家信息网最后更新 2025年01月31日大数据之---hadoop伪分布式部署(HDFS)全网终极篇

1、软件环境

RHEL6jdk-8u45
hadoop-2.8.1.tar.gzssh
xx.xx.xx.xx ip地址hadoop1
xx.xx.xx.xx ip地址hadoop2
xx.xx.xx.xx ip地址hadoop3
xx.xx.xx.xx ip地址hadoop4
xx.xx.xx.xx ip地址hadoop5

本次部署只涉及伪分布式部署只是要主机hadoop1

2.伪分布式部署

伪分布式部署文档参考官方网站hadoop
Apache > Hadoop > Apache Hadoop Project Dist POM > Apache Hadoop 2.8.3 > Hadoop: Setting up a Single Node Cluster
添加hadoop用户

[root@hadoop1 ~]# useradd hadoop
[root@hadoop1 ~]# vi /etc/sudoers
# 找到root ALL=(ALL) ALL,添加
hadoop ALL=(ALL) NOPASSWD:ALL
上传并解压
[root@hadoop1 software]# rz #上传hadoop-2.8.1.tar.gz
[root@hadoop1 software]# tar -xzvf hadoop-2.8.1.tar.gz
软连接
[root@hadoop1 software]# ln -s /opt/software/hadoop-2.8.1 /opt/software/hadoop
设置环境变量
[root@hadoop1 software]# vi /etc/profile
export HADOOP_HOME=/opt/software/hadoop
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
[root@hadoop1 software]# source /etc/profile
设置用户、用户组
[root@hadoop1 software]# chown -R hadoop:hadoop hadoop
[root@hadoop1 software]# chown -R hadoop:hadoop hadoop/*
[root@hadoop1 software]# chown -R hadoop:hadoop hadoop-2.8.1
[root@hadoop1 software]# cd hadoop
[root@hadoop1 hadoop]# rm -f *.txt
[root@hadoop1 software]# su - hadoop
[root@hadoop1 hadoop]# ll
total 32
drwxrwxr-x. 2 hadoop hadoop 4096 Jun 2 14:24 bin
drwxrwxr-x. 3 hadoop hadoop 4096 Jun 2 14:24 etc
drwxrwxr-x. 2 hadoop hadoop 4096 Jun 2 14:24 include
drwxrwxr-x. 3 hadoop hadoop 4096 Jun 2 14:24 lib
drwxrwxr-x. 2 hadoop hadoop 4096 Aug 20 13:59 libexec
drwxr-xr-x. 2 hadoop hadoop 4096 Aug 20 13:59 logs
drwxrwxr-x. 2 hadoop hadoop 4096 Jun 2 14:24 sbin
drwxrwxr-x. 4 hadoop hadoop 4096 Jun 2 14:24 share

# bin: 可执行文件
# etc: 配置文件
# sbin: shell脚本,启动关闭hdfs,yarn等配置文件
[hadoop@hadoop1 ~]# cd /opt/software/hadoop
[hadoop@hadoop1 hadoop]# vi etc/hadoop/core-site.xml


fs.defaultFS
hdfs://172.168.18.133:9000 # 配置自己机器的IP



[hadoop@hadoop1 hadoop]# vi etc/hadoop/hdfs-site.xml


dfs.replication
1

---红色部分新增
配置hadoop用户的ssh信任关系
# 公钥/密钥 配置无密码登录
[hadoop@hadoop1 ~]# ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
[hadoop@hadoop1 ~]# cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
[hadoop@hadoop1 ~]# chmod 0600 ~/.ssh/authorized_keys
# 查看日期,看是否配置成功
[root@hadoop1 ~]# ssh hadoop1 date
Wed Apr 25 15:22:58 CST 2018

[root@hadoop1 ~]# ssh localhost date
Wed Apr 25 15:23:25 CST 2018

# 第一次执行命令有交互选择输入yes
格式化和启动
[hadoop@hadoop1 hadoop]# bin/hdfs namenode -format
[hadoop@hadoop1 hadoop]# sbin/start-dfs.sh
ERROR:
hadoop1: Error: JAVA_HOME is not set and could not be found.
localhost: Error: JAVA_HOME is not set and could not be found.
解决方法:添加环境变量
[hadoop@hadoop1 hadoop]# vi etc/hadoop/hadoop-env.sh
# 将export JAVA_HOME=${JAVA_HOME}改为
export JAVA_HOME=/usr/java/jdk1.8.0_45
# 继续启动
[hadoop@hadoop1 hadoop]# sbin/start-dfs.sh
检查是否成功
[hadoop@hadoop1 hadoop]# jps
8026 Jps
7485 NameNode
7597 DataNode
7807 SecondaryNameNode
访问: http://192.168.137.130:50070

修改dfs启动的进程,以hadoop1启动 启动的三个进程:
namenode: hadoop1 bin/hdfs getconf -namenodes
datanode: localhost datanodes (using default slaves file) etc/hadoop/slaves
secondarynamenode: 0.0.0.0

[hadoop@hadoop1 ~]# cd /opt/software/hadoop
[hadoop@hadoop1 hadoop]# echo "hadoop1" > ./etc/hadoop/slaves
[hadoop@hadoop1 hadoop]# cat ./etc/hadoop/slaves
hadoop1
[hadoop@hadoop1 hadoop]# vi ./etc/hadoop/hdfs-site.xml

dfs.namenode.secondary.http-address
hadoop1:50090


dfs.namenode.secondary.https-address
hadoop1:50091

[hadoop@hadoop1 hadoop]# sbin/stop-dfs.sh
[hadoop@hadoop1 hadoop]# sbin/start-dfs.sh

访问: http://192.168.137.130:50070界面

配置 地址 用户 分布式 文件 环境 成功 变量 进程 三个 主机 公钥 只是 命令 官方 官方网站 密码 密钥 文档 方法 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 微软拼音输入法软件开发 四川服务器租用 pg数据库退出当前循环 网站架构服务器 UHF麦克风软件开发公司 kafka服务器硬件配置 深圳市赛道网络技术有限公司 如何改绝地求生服务器 自己做计算机网络技术 临潼区网络安全周启动 两会期间网络安全总结 c#软件开发工程师 松江区市场软件开发常见问题 重庆分布式服务器方案云主机 老笔记本改造成云存储服务器 服务器推送消息到pc 数据库分离不了是什么原因 每年的网络安全周是什么时候 腾讯数据库个人能提取数据吗 网络安全风险点排查明细表 85级魔兽装备数据库 移动笔试数据库题库 软件开发的工程怎么接单子 数据库某一列的长度上限 流放之路数据库地裂 四川大学计算机和网络安全 众生缘江苏互联网科技有限公司 陈鑫杰网络安全攻防 数据库工程师在哪里报名 锦江区亿可计算机软件开发部
0