导航：首页 > 互联网科技 >

如何处理Hdfs的DN节点数据磁盘大小不均衡的问题

发表于：2024-12-13 作者：千家信息网编辑

千家信息网最后更新 2024年12月13日，本篇内容介绍了"如何处理Hdfs的DN节点数据磁盘大小不均衡的问题"的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能

千家信息网最后更新 2024年12月13日如何处理Hdfs的DN节点数据磁盘大小不均衡的问题

本篇内容介绍了"如何处理Hdfs的DN节点数据磁盘大小不均衡的问题"的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

现象描述

建集群的时候，datanode的节点数据磁盘总共是四块磁盘做矩阵成了一个7.2TB的sdb1(data1)，两块通过矩阵做了一个3.6TB的sdc1(data2)磁盘，运维做的，历史原因。刚开始没有发现，然后集群过了一段时间，随着数据量的增加，发现集群有很多磁盘超过使用率90%告警，浪尖设置磁盘告警阈值是90%，超过阈值就会发短信或者微信告警，提醒我们磁盘将要满了进行预处理，但是通过hadoop的监控指标获取的磁盘利用率维持在55%+，这种情况下不应该发生告警的。磁盘的使用率在hadoop的hdfs的namnode的web ui也可以看到，如下：

这个时候，大家的怀疑会集中于hdfs的某些datanode节点数据存储过于集中，导致某些节点磁盘告警。但是大家都知道，hdfs允许datanode节点接入时datanode之间磁盘异构，数据存储hadoop会自动在datanode之间进行均衡。所以这个怀疑可以排除。

登录告警节点，发现确实data2磁盘使用率超过了90%，但是data1使用率维持在不足50%。

这时候问题就显而易见了，hadoop3.0之前hdfs数据存储只支持在datanode节点之间均衡，而不支持datanode内部磁盘间的数据存储均衡。

那么这个时候怎么办呢？

起初

浪尖想的是将data1那个矩阵，拆分成两块由两块磁盘组成的矩阵，然后重新滚动上下线Datanode（数据迁移或者通过副本变动让其进行均衡）。但是，后来很快否定了这种方法，原因是很简单。几百TB的数据，在集群中均衡，即使是滚动重启，那么多机器也要持续好久，然后在数据迁移或者均衡的时候，整个几群的带宽和磁盘都是会增加很大负担，导致集群的可用性降低。

接着

通过hadoop官网发现hadoop 3.0不仅支持datanode之间的数据均衡，也支持datanode内部管理的多磁盘的之间的数据均衡。

这个时候，可以考虑升级hadoop集群到hadoop3.0，但是思考再三浪尖觉得浪费时间，不划算，最终放弃这种方案。

最后

几经思考，终于想出了一个原本就很简单的方案，只需要重启datanode，就可以实现提高大磁盘利用率的方法。首先，要知道的是datanode管理磁盘，是根据我们dfs.data.dir参数指定的目录。那么，我们的思路就很简单了，给data1多个目录，不就可以增加其写入的概率，进而提升磁盘的使用率了么。配置方式如下：

         dfs.data.dir        /data1/dfs/dn,/data1/dfs/dn1,/data2/dfs/dn

配置结束之后，重启datanode集群，过一定时间查看该目录的大小，然后发现有数据写入。

由此证明，想法是可行的。

此方法的缺点是，原有的数据不会进行均衡，增加目录的方式只是增加了新数据写入大磁盘的概率，但是这样就可以了，等着原有数据自动删除即可。

"如何处理Hdfs的DN节点数据磁盘大小不均衡的问题"的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站，小编将为大家输出更多高质量的实用文章！

很赞哦！

磁盘数据均衡节点集群之间使用率时候目录矩阵存储支持大小问题时间内容利用率原因情况方式数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全北京mes软件开发设计公司怎么用美国代理服务器 bim数据库建设包括哪些内容莱阳网络安全大队长李超 sqlite数据库教程网络安全与信息委员会职责一起涨芝士网络安全特辑易语言选取数据库网络安全发展趋势包括分布式数据库系统复制透明性 2021网络安全宣传周网站软件开发属不属工程类浪潮服务器和cpu 服务器不在中国浙江数据网络技术创新服务网络技术与工程类专业我与网络安全微视频倪光南实现网络安全谷歌服务器信用卡南通工厂软件开发平台对于关系数据库打电话服务器链接错误请重试网络安全法对民众的影响数据库求和格式网络安全与道德德育活动高防数据库索菲互联网科技公司数据库文件在哪编写 2020十大网络安全软件开发it工资高吗

千家信息网

千家信息网

如何处理Hdfs的DN节点数据磁盘大小不均衡的问题

怎么理解抽象同步队列AQS

用5why分析法分析问题----之zookeeper

相关文章