大数据平台CDH搭建
发表于:2025-02-01 作者:千家信息网编辑
千家信息网最后更新 2025年02月01日,一、概述Cloudera版本(Cloudera's Distribution Including Apache Hadoop,简称"CDH"),基于Web的用户界面,支持大多数Hadoop组件,包括H
千家信息网最后更新 2025年02月01日大数据平台CDH搭建
一、概述
Cloudera版本(Cloudera's Distribution Including Apache Hadoop,简称"CDH"),基于Web的用户界面,支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop,简化了大数据平台的安装、使用难度。
二、安装部署
序号 | IP地址 | 主机名 | 系统版本 |
---|---|---|---|
1 | 172.20.2.222 | cm-server | centos7.3 |
2 | 172.20.2.203 | hadoop-1 | centos7.3 |
3 | 172.20.2.204 | hadoop-2 | centos7.3 |
4 | 172.20.2.205 | hadoop-3 | centos7.3 |
2.2.1 基础环境部署
a.修改主机名配置hosts
systemctl stop firewalldhostnamectl set-hostname cm-server #更改个主机名sed -i 's/SELINUX=enforcing/SELINUX=disable/g' /etc/selinux/configsetenforce 0cat >>/etc/hosts<
b.配置cm-server免密钥登录其他节点
ssh-keygen -t rsa #在cm-server生成密钥对for num in `seq 1 3`;do ssh-copy-id -i /root/.ssh/id_rsa.pub root@hadoop-$num;done
c.在cm-server安装数据库
在cm-server上安装mariadb,用于后期数据存储
yum install mariadb*systemctl start mariadbmysql -uroot password "mysqladmin"登录数据库后我们采用root登录
e.java环境配置
如果系统有安装java环境卸载干净使用oracle的jdk,此处使用jdk-7u80-linux-x64.rpm
,在各节点均配置java环境
rpm -ivh jdk-7u80-linux-x64.rpmcat >/etc/profile.d/java.sh<
f.配置各节点服务器需求
sysctl -w vm.swappiness=10echo "vm.swappiness=10" >>/etc/sysctl.confecho never > /sys/kernel/mm/transparent_hugepage/defragecho never > /sys/kernel/mm/transparent_hugepage/enabled
2.2.2 Cloudera Manager安装
a.下载解压相关软件包
mkdir /software && cd /softwarewget -c https://archive.cloudera.com/cm5/cm/5/cloudera-manager-centos7-cm5.14.1_x86_64.tar.gz wget -c http://archive.cloudera.com/cdh6/parcels/5.14.2/CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcelwget -c http://archive.cloudera.com/cdh6/parcels/5.14.2/CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel.sha1 -O CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel.shawget -c http://archive.cloudera.com/cdh6/parcels/5.14.2/manifest.jsonwget -c https://dev.mysql.com/get/Downloads/Connector-J/mysql-connector-java-5.1.46.ziptar -zxvf cloudera-manager-centos7-cm5.14.1_x86_64.tar.gz -C /opt/ #解压cm包unzip mysql-connector-java-5.1.46.zip #解压java-mysql连接jar包cp mysql-connector-java-5.1.46/mysql-connector-java-5.1.46-bin.jar /opt/cm-5.14.1/share/cmf/lib/ #将jar包复制到cm的lib目录下cp mysql-connector-java-5.1.46/mysql-connector-java-5.1.46-bin.jar
b.创建用户及初始化数据库
useradd --system --home=/opt/cm-5.14.1/run/cloudera-scm-server/ --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm #在各个节点均创建用户vim /opt/cm-5.14.1/etc/cloudera-scm-agent/config.ini将其中的server_host=cm-server #指向cm-serverusage: /opt/cm-5.14.1/share/cmf/schema/scm_prepare_database.sh [options] (postgresql|mysql|oracle) database username [password] #使用选项/opt/cm-5.14.1/share/cmf/schema/scm_prepare_database.sh mysql cmdb -h"cm-server" -uroot -pmysqladmin --scm-host cm-server scm scm scm
c.将文件将cm-server修改完成的文件分发到其他各节点
for i in `seq 1 3`;do scp -r /opt/cm-5.14.1 hadoop-$i:/opt/;done
d.创建本地源
mv CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel* manifest.json /opt/cloudera/parcel-repo/
e.启动服务
在cm-server启动server和agent服务,在其他节点启动agent服务
/opt/cm-5.14.1/etc/init.d/cloudera-scm-server start/opt/cm-5.14.1/etc/init.d/cloudera-scm-agent start
2.2.2 Cloudera Manager的web界面配置
服务器均启动后,可以浏览器访问cm-server的7180端口,用户名/密码为admin/admin
接受协议继续
可以选择适用60天
提示一些涉及许可证的信息
勾选管理的主机继续操作
选择CDH-5.14版本
parcel安装
主机正确性检查
群集设置(选择安装的服务)
自定义角色分配,选择安装在那个节点上
数据库设置
需要提前创建数据库及授权其他节点可以正常连接
审核更改
集群安装
完成安装
后期可添加服务
节点
数据
服务
配置
主机
数据库
环境
用户
选择
版本
登录
密钥
文件
服务器
界面
系统
a.
平台
干净
信息
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
高级网络安全使用方法
网络技术培训有的好处
小布助手一直都是连接服务器
计算机网络安全论文怎么生成
svn服务器端配置
excel连接mysql数据库
腾信云服务器70岁能购买吗
游戏直播服务器怎么安装
国民技术数据库
软件开发和管理专业的区别
上位机如何与串口服务器通信
服务器的管理 2
大话2免费版有时间服务器吗
派出所网络安全询问
plc软件开发代写代码
德阳软件开发规范
浙江 金融 软件开发
家庭网络安全教育平台
本地数据库备份到服务器
国内哪种服务器适合发个人邮件
网络安全学校讲话稿
服务器传数据速度慢
dell服务器质保期
中科院网络安全网
java 文件存到数据库
黄浦区市场软件开发协议
汕尾通讯软件开发平均价格
网络安全管理尚需进一步加强
信息工程网络安全管理的认识
软件开发模式v w