Hadoop 系列(四)—— Hadoop 开发环境搭建
发表于:2025-02-02 作者:千家信息网编辑
千家信息网最后更新 2025年02月02日,一、前置条件Hadoop 的运行依赖 JDK,需要预先安装,安装步骤见:Linux 下 JDK 的安装二、配置免密登录Hadoop 组件之间需要基于 SSH 进行通讯。2.1 配置映射配置 ip 地址
千家信息网最后更新 2025年02月02日Hadoop 系列(四)—— Hadoop 开发环境搭建
一、前置条件
Hadoop 的运行依赖 JDK,需要预先安装,安装步骤见:
- Linux 下 JDK 的安装
二、配置免密登录
Hadoop 组件之间需要基于 SSH 进行通讯。
2.1 配置映射
配置 ip 地址和主机名映射:
vim /etc/hosts# 文件末尾增加192.168.43.202 hadoop001
2.2 生成公私钥
执行下面命令行生成公匙和私匙:
ssh-keygen -t rsa
3.3 授权
进入 ~/.ssh
目录下,查看生成的公匙和私匙,并将公匙写入到授权文件:
[root@@hadoop001 sbin]# cd ~/.ssh[root@@hadoop001 .ssh]# ll-rw-------. 1 root root 1675 3 月 15 09:48 id_rsa-rw-r--r--. 1 root root 388 3 月 15 09:48 id_rsa.pub
# 写入公匙到授权文件[root@hadoop001 .ssh]# cat id_rsa.pub >> authorized_keys[root@hadoop001 .ssh]# chmod 600 authorized_keys
三、Hadoop(HDFS)环境搭建
3.1 下载并解压
下载 Hadoop 安装包,这里我下载的是 CDH 版本的,下载地址为:http://archive.cloudera.com/cdh6/cdh/5/
# 解压tar -zvxf hadoop-2.6.0-cdh6.15.2.tar.gz
3.2 配置环境变量
# vi /etc/profile
配置环境变量:
export HADOOP_HOME=/usr/app/hadoop-2.6.0-cdh6.15.2export PATH=${HADOOP_HOME}/bin:$PATH
执行 source
命令,使得配置的环境变量立即生效:
# source /etc/profile
3.3 修改Hadoop配置
进入 ${HADOOP_HOME}/etc/hadoop/
目录下,修改以下配置:
1. hadoop-env.sh
# JDK安装路径export JAVA_HOME=/usr/java/jdk1.8.0_201/
2. core-site.xml
fs.defaultFS hdfs://hadoop001:8020 hadoop.tmp.dir /home/hadoop/tmp
3. hdfs-site.xml
指定副本系数和临时文件存储位置:
dfs.replication 1
4. slaves
配置所有从属节点的主机名或 IP 地址,由于是单机版本,所以指定本机即可:
hadoop001
3.4 关闭防火墙
不关闭防火墙可能导致无法访问 Hadoop 的 Web UI 界面:
# 查看防火墙状态sudo firewall-cmd --state# 关闭防火墙:sudo systemctl stop firewalld.service
3.5 初始化
第一次启动 Hadoop 时需要进行初始化,进入 ${HADOOP_HOME}/bin/
目录下,执行以下命令:
[root@hadoop001 bin]# ./hdfs namenode -format
3.6 启动HDFS
进入 ${HADOOP_HOME}/sbin/
目录下,启动 HDFS:
[root@hadoop001 sbin]# ./start-dfs.sh
3.7 验证是否启动成功
方式一:执行 jps
查看 NameNode
和 DataNode
服务是否已经启动:
[root@hadoop001 hadoop-2.6.0-cdh6.15.2]# jps9137 DataNode9026 NameNode9390 SecondaryNameNode
方式二:查看 Web UI 界面,端口为 50070
:
四、Hadoop(YARN)环境搭建
4.1 修改配置
进入 ${HADOOP_HOME}/etc/hadoop/
目录下,修改以下配置:
1. mapred-site.xml
# 如果没有mapred-site.xml,则拷贝一份样例文件后再修改cp mapred-site.xml.template mapred-site.xml
mapreduce.framework.name yarn
2. yarn-site.xml
yarn.nodemanager.aux-services mapreduce_shuffle
4.2 启动服务
进入 ${HADOOP_HOME}/sbin/
目录下,启动 YARN:
./start-yarn.sh
4.3 验证是否启动成功
方式一:执行 jps
命令查看 NodeManager
和 ResourceManager
服务是否已经启动:
[root@hadoop001 hadoop-2.6.0-cdh6.15.2]# jps9137 DataNode9026 NameNode12294 NodeManager12185 ResourceManager9390 SecondaryNameNode
方式二:查看 Web UI 界面,端口号为 8088
:
更多大数据系列文章可以参见 GitHub 开源项目: 大数据入门指南
配置
目录
环境
文件
命令
方式
防火墙
防火
变量
地址
界面
服务
成功
主机
数据
版本
生成
验证
之间
位置
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
为什么上网要输入网络安全
中国银联软件开发
高教社期刊数据库
虚荣服务器在哪里
如何提升服务器处理能力
产业互联网 科技创新
贵州中天网络技术有限公司
戴尔服务器安装共享数据库
安卓的软件开发如何收费
数据库列级指定外键
网络服务器可以检测病毒吗
软考网络安全工程师历年真题
数值仿真软件开发招聘
mac泛洪攻击ftp服务器
云服务器管理客户端
软件开发岗位都有什么
运力科技 互联网 公路物流
数据库应用技术模拟
数据库系统常用安全防护
网络安全管理对保险公司
数据库查询 1=1
易钱行北京网络技术有限公司
软件开发45岁换工作
tbc服务器维护要多久
潮州软件开发工程师
成都自在行途网络技术有限公司
多久才能成为软件开发师
文件管理服务器ftp
数据库对于软件的意义
正规专业软件开发服务