千家信息网

hadoop2.7.1环境的搭建方法

发表于:2024-12-03 作者:千家信息网编辑
千家信息网最后更新 2024年12月03日,这篇文章主要介绍"hadoop2.7.1环境的搭建方法",在日常操作中,相信很多人在hadoop2.7.1环境的搭建方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"h
千家信息网最后更新 2024年12月03日hadoop2.7.1环境的搭建方法

这篇文章主要介绍"hadoop2.7.1环境的搭建方法",在日常操作中,相信很多人在hadoop2.7.1环境的搭建方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"hadoop2.7.1环境的搭建方法"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

在老板的支持下,陆续划拉到了10几台机器,绑定了固定IP,工作之余开始了Hadoop之旅。将要点记录下来,以备查阅。

硬件构成:

Resource

Volume

CPU

2 cores

Memory

4 GB

Disk

500 GB

Network

100 M

软件构成:

Name

Version

Install Path

CentOS

6.7 x86_64

/

Oracle JDK

7u79-linux-x64

/usr/local/java/

Hadoop

2.7.1

/home/hadoop/

Flume

1.6.0

/home/flume/

Maven

3.3.9

/usr/local/maven/

Ant

1.9.6

/usr/local/ant

MySQL

5.6.21 Community Server

/home/mysql/

D3.js

v3


整体架构:

DFS和Yarn构成:

各个节点需要的配置:

调试hadoop节点用到的命令:

sbin/hadoop-daemon.sh start journal
bin/hdfs namenode format
sbin/hadoop-daemon.sh start namenode
bin/hdfs namenode -bootstrapStandby
sbin/hadoop-daemon.sh start namenode
bin/hdfs haadmin -transitionToActive nn1
sbin/hadoop-daemons.sh start datanode
sbin/yarn-daemon.sh start resourcemanager
sbin/yarn-daemon.sh start nodemanager

调试完毕后的集群启动/关闭命令:

sbin/start-dfs.sh
sbin/start-yarn.sh
bin/hdfs haadmin -transitionToActive nn1

sbin/stop-dfs.sh
sbin/stop-yarn.sh

DFS管理界面:

YARN管理界面:

正在把150G日志手动导入DFS,暂时还没用上Flume,后面逐步集成进来。

MR运行结果存入DFS或者灌入MySQL都试验成功,回头整理。

Yarn的资源队列临时配置了一个,现在只是能跑,还不明白咋回事,抽时间继续研究。

在4个data node节点上(昨晚才凑到9节点)对15G日志跑一个过滤useragent的MR,需要8分钟,这样算下来需要1天时间才能对1个月的日志解析完,孰能忍!性能优化需要陆续展开。

到此,关于"hadoop2.7.1环境的搭建方法"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!

方法 环境 节点 学习 日志 命令 更多 界面 帮助 管理 配置 实用 成功 接下来 之旅 只是 回事 天时 性能 手动 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 服务器服务管理器在哪里打开 我的世界服务器管理员故意欺负人 软件开发人员转型芯片 福州中旭网络技术公司招聘 Arcgis数据库如何一键核图 学校对青少年网络安全教育 数据库系统概论第5版第五章 2020国家网络安全的心得 mc无法连接到服务器连接终止 计算机软件开发前景怎么样 淘宝尺码编辑显示服务器异常 怎么判断数据库是否被修改 java判断服务器 辽宁大型软件开发质量保障 顺义网络安全产业园 积木软件开发环境 网络安全监管运营 安徽软件开发解决方案咨询 精武镇网络安全课程 华南农业大学计算机网络技术 计算机上代理服务器是什么 his数据库怎么打开 无线web认证服务器 仿造健康码软件开发者被支抓 网络技术专业怎样去找工作 定制集成及软件开发 腾昭网络技术 绵羊基因组数据库 打不开服务器无法建立安全 关于预防网络安全的小故事
0