导航：首页 > 互联网科技 >

Hadoop框架中如何配置HDFS高可用环境

发表于：2025-02-05 作者：千家信息网编辑

千家信息网最后更新 2025年02月05日，这篇文章主要为大家展示了"Hadoop框架中如何配置HDFS高可用环境"，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下"Hadoop框架中如何配置HDFS高可

千家信息网最后更新 2025年02月05日Hadoop框架中如何配置HDFS高可用环境

这篇文章主要为大家展示了"Hadoop框架中如何配置HDFS高可用环境"，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下"Hadoop框架中如何配置HDFS高可用环境"这篇文章吧。

一、HDFS高可用

1、基础描述

在单点或者少数节点故障的情况下，集群还可以正常的提供服务，HDFS高可用机制可以通过配置Active/Standby两个NameNodes节点实现在集群中对NameNode的热备来消除单节点故障问题，如果单个节点出现故障，可通过该方式将NameNode快速切换到另外一个节点上。

2、机制详解

基于两个NameNode做高可用，依赖共享Edits文件和Zookeeper集群；
每个NameNode节点配置一个ZKfailover进程，负责监控所在NameNode节点状态；
NameNode与ZooKeeper集群维护一个持久会话；
如果Active节点故障停机，ZooKeeper通知Standby状态的NameNode节点；
在ZKfailover进程检测并确认故障节点无法工作后；
ZKfailover通知Standby状态的NameNode节点切换为Active状态继续服务；

ZooKeeper在大数据体系中非常重要，协调不同组件的工作，维护并传递数据，例如上述高可用下自动故障转移就依赖于ZooKeeper组件。

二、HDFS高可用

1、整体配置

服务列表	HDFS文件	YARN调度	单服务	共享文件	Zk集群
hop01	DataNode	NodeManager	NameNode	JournalNode	ZK-hop01
hop02	DataNode	NodeManager	ResourceManager	JournalNode	ZK-hop02
hop03	DataNode	NodeManager	SecondaryNameNode	JournalNode	ZK-hop03

2、配置JournalNode

创建目录

[root@hop01 opt]# mkdir hopHA

拷贝Hadoop目录

cp -r /opt/hadoop2.7/ /opt/hopHA/

配置core-site.xml

                            fs.defaultFS             hdfs://mycluster                                        hadoop.tmp.dir           /opt/hopHA/hadoop2.7/data/tmp

配置hdfs-site.xml，添加内容如下

        dfs.nameservices        mycluster        dfs.ha.namenodes.mycluster        nn1,nn2        dfs.namenode.rpc-address.mycluster.nn1        hop01:9000        dfs.namenode.rpc-address.mycluster.nn2        hop02:9000        dfs.namenode.http-address.mycluster.nn1        hop01:50070        dfs.namenode.http-address.mycluster.nn2        hop02:50070        dfs.namenode.shared.edits.dir    qjournal://hop01:8485;hop02:8485;hop03:8485/mycluster        dfs.ha.fencing.methods        sshfence        dfs.ha.fencing.ssh.private-key-files        /root/.ssh/id_rsa        dfs.journalnode.edits.dir        /opt/hopHA/hadoop2.7/data/jn        dfs.permissions.enable        false        dfs.client.failover.proxy.provider.mycluster    org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider

依次启动journalnode服务

[root@hop01 hadoop2.7]# pwd/opt/hopHA/hadoop2.7[root@hop01 hadoop2.7]# sbin/hadoop-daemon.sh start journalnode

删除hopHA下数据

[root@hop01 hadoop2.7]# rm -rf data/ logs/

NN1格式化并启动NameNode

[root@hop01 hadoop2.7]# pwd/opt/hopHA/hadoop2.7bin/hdfs namenode -formatsbin/hadoop-daemon.sh start namenode

NN2同步NN1数据

[root@hop02 hadoop2.7]# bin/hdfs namenode -bootstrapStandby

NN2启动NameNode

[root@hop02 hadoop2.7]# sbin/hadoop-daemon.sh start namenode

查看当前状态

在NN1上启动全部DataNode

[root@hop01 hadoop2.7]# sbin/hadoop-daemons.sh start datanode

NN1切换为Active状态

[root@hop01 hadoop2.7]# bin/hdfs haadmin -transitionToActive nn1[root@hop01 hadoop2.7]# bin/hdfs haadmin -getServiceState nn1active

3、故障转移配置

配置hdfs-site.xml，新增内容如下，同步集群

        dfs.ha.automatic-failover.enabled        true

配置core-site.xml，新增内容如下，同步集群

        ha.zookeeper.quorum        hop01:2181,hop02:2181,hop03:2181

关闭全部HDFS服务

[root@hop01 hadoop2.7]# sbin/stop-dfs.sh

启动Zookeeper集群

/opt/zookeeper3.4/bin/zkServer.sh start

hop01初始化HA在Zookeeper中状态

[root@hop01 hadoop2.7]# bin/hdfs zkfc -formatZK

hop01启动HDFS服务

[root@hop01 hadoop2.7]# sbin/start-dfs.sh

NameNode节点启动ZKFailover

这里hop01和hop02先启动的服务状态就是Active，这里先启动hop02。

[hadoop2.7]# sbin/hadoop-daemon.sh start zkfc

结束hop02的NameNode进程

kill -9 14422

等待一下查看hop01状态

[root@hop01 hadoop2.7]# bin/hdfs haadmin -getServiceState nn1active

三、YARN高可用

1、基础描述

基本流程和思路与HDFS机制类似，依赖Zookeeper集群，当Active节点故障时，Standby节点会切换为Active状态持续服务。

2、配置详解

环境同样基于hop01和hop02来演示。

配置yarn-site.xml，同步集群下服务

            yarn.nodemanager.aux-services        mapreduce_shuffle                    yarn.resourcemanager.ha.enabled        true                     yarn.resourcemanager.cluster-id        cluster-yarn01                yarn.resourcemanager.ha.rm-ids        rm1,rm2                yarn.resourcemanager.hostname.rm1        hop01                yarn.resourcemanager.hostname.rm2        hop02                      yarn.resourcemanager.zk-address        hop01:2181,hop02:2181,hop03:2181                     yarn.resourcemanager.recovery.enabled        true                      yarn.resourcemanager.store.class     org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore

重启journalnode节点

sbin/hadoop-daemon.sh start journalnode

在NN1服务格式化并启动

[root@hop01 hadoop2.7]# bin/hdfs namenode -format[root@hop01 hadoop2.7]# sbin/hadoop-daemon.sh start namenode

NN2上同步NN1元数据

[root@hop02 hadoop2.7]# bin/hdfs namenode -bootstrapStandby

启动集群下DataNode

[root@hop01 hadoop2.7]# sbin/hadoop-daemons.sh start datanode

NN1设置为Active状态

先启动hop01即可，然后启动hop02。

[root@hop01 hadoop2.7]# sbin/hadoop-daemon.sh start zkfc

hop01启动yarn

[root@hop01 hadoop2.7]# sbin/start-yarn.sh

hop02启动ResourceManager

[root@hop02 hadoop2.7]# sbin/yarn-daemon.sh start resourcemanager

查看状态

[root@hop01 hadoop2.7]# bin/yarn rmadmin -getServiceState rm1

以上是"Hadoop框架中如何配置HDFS高可用环境"这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注行业资讯频道！

很赞哦！

节点配置状态集群服务故障内容数据同步环境切换框架文件机制篇文章进程两个基础格式目录数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全网络安全手抄报难度一点青岛崂山与青岛网络安全产业园黑龙江智慧医养软件开发系统昆山鼎捷软件开发商网络安全伴我行红包控制软件开发济南浪潮存储服务器哪里有海康转码服务器 sql 跨数据库复制表服务器不能访问端口是什么意思黑龙江评审中心软件开发有限公司网络安全辩论赛方案有关科技互联网的英语作文青海视频会议服务器数据库连接选择投影合并操作网络安全个板块的龙头股扫描枪无法连接远程服务器网络安全售前工程师有前途吗网络技术有什么创新比赛数据库模型优势安庆oa管理软件开发费用数据分析服务器搭建学软件开发大专有前途吗北京工业软件开发价位服务器光驱服务器机箱怎么装硬盘家政帮软件开发模板 cmm软件开发过程网络安全专项培训答题软件开发专业技术职称

千家信息网

千家信息网

Hadoop框架中如何配置HDFS高可用环境

一、HDFS高可用

1、基础描述

2、机制详解

二、HDFS高可用

1、整体配置

2、配置JournalNode

3、故障转移配置

三、YARN高可用

1、基础描述

2、配置详解

nginx怎么配置静态文件服务器

binlog以及Canal的知识有哪些

相关文章