千家信息网

Hadoop伪分布式集群搭建总结

发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,Hadoop伪分布式集群搭建总结一、所需软件VMware15!CentOS6.5JDK1.8Hadoop2.7.3二、安装注意:对文件进行编辑:输入a,表示对该文件进行编辑,最后保存该文件,操作为:点
千家信息网最后更新 2025年01月23日Hadoop伪分布式集群搭建总结
                                           Hadoop伪分布式集群搭建总结

一、所需软件
VMware15!
CentOS6.5
JDK1.8
Hadoop2.7.3
二、安装
注意:
对文件进行编辑:输入a,表示对该文件进行编辑,最后保存该文件,操作为:点击键盘上的Esc按钮,然后输入英文的:字符,再输入wq,点击回车,完成文件的保存。

1、关闭防火墙和禁用SELINUX
(1)、永久关闭防火墙,重启Linux系统

(2) 、禁用SELINUX:修改文件参数 重启Linux使其生效

(3)、检查防火墙是否运行,显示下图即为关闭

2、配置hostname与IP地址之间的对应关系
(1)、查看自己的IP

(2)、查看自己的hostname

(3)、配置对应关系

注意:IP与hostname之间有空格
3、创建用户
(1),创建hadoop用户

(2)、为hadoop用户设置密码

4、配置 SSH免密登录
(1)、检查自己系统是否安装SSH

注意:若没安装SSH则在有网的情况下可输入:yum install openssh-server 进行安装。
(2)、为hadoop用户配置SSH免密登录

注意:一定要切换到hadoop用户下并进入"~"目录!

注意:输入ssh-keygen -t rsa后一直回车即可!
然后进入.ssh目录进行以下操作

注意:"authorized_keys"一定要准确!**``**
进入"~"目录为.ssh目录及其文件赋予相应权限

5、JDK安装
(1)、创建存放软件目录

(2)、上传解压jdk

注意:确保红框内权限为hadoop的!如果为root,可进入root用户修改为hadoop, 命令为:chown -R hadoop:hadoop jdk-8u211-linux-x64.tar.gz ,然后重新进入hadoop用户进行解压
(3)、为jdk1.8.0_211创建软连接

(4)、配置bashrc文件

使配置文件生效

(5)、验证JDK是否安装成功,显示下图即为成功

6、hadoop安装及配置
(1)、上传解压hadoop

注意:确保红框内权限为hadoop的!如果为root,可进入root用户修改为hadoop 命令为:chown -R hadoop:hadoop hadoop-2.7.3.tar.gz ,然后重新进入hadoop用户进行解压

(2)、进入hadoop配置文件目录进行相应文件配置

配置core-site.xml vi core-site.xml

注意:箭头所指应为自己的hostname
配置hdfs-site.xml vi hdfs-site.xml

配置hadoop-env.sh vi hadoop-env.sh

注意:此路径为JDK的安装目录
配置mapred-site.xml vi mapred-site.xml

配置yarn-site.xml vi yarn-site.xml

配置slaves vi slaves

注意:此为自己的hostname
(3)、为hadoop-2.7.3创建软连接

(4)、配置bashrc文件

使配置文件生效

(5)、创建hadoop相关数据目录

(6)、格式化Namenode hadoop namenode -format

注意:出现以上2个信息即为成功!如果出现要输入密码等情况,检查自己的SSH免密登录是否配置正确!!!
(7)、启动hadoop伪分布式集群

注意:出现以上信息输入yes即可!!!
(8)、通过jps命令查看hadoop的启动进程

注意:出现以上5个进程即为hadoop伪分布式集群启动成功

配置 文件 用户 目录 输入 成功 分布式 集群 命令 权限 防火墙 检查 登录 防火 下图 之间 信息 密码 情况 系统 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 关系型数据库常见的关系运算有 中国网络安全与信息化部官网 我的世界服务器页面 做软件开发买微星笔记本 服务器怎么验证客户端证书 仓库管理系统数据库的维护 在其他服务器上重新读取raid 成都图胜网络技术有限公司 大数据技术用什么数据库 个人网络安全安全防护心得 手机管理服务器的软件下载 河北采购管理软件开发公司 国有企业 旗下软件开发公司 重庆服务器迁移询盘 共享ip服务器 连接支付宝的数据库在哪 每个数据库只能有一个主数据文件 国外服务器试用 兴化直销网络技术供应商家 wifi4数据库 网络安全技术与服务专业大学 北京第六网络技术公司 汉中滴驾互联网科技 数据库远程管理是否加密 江西数据库深度学习培训 文明重启服务器自定义 软件开发的接口设计 杭州酷鹏网络技术有限公司 服务器大数据工程师 郑州办公系统软件开发哪家可靠
0