千家信息网

CDH5基础知识点有哪些

发表于:2025-01-24 作者:千家信息网编辑
千家信息网最后更新 2025年01月24日,这篇文章主要讲解了"CDH5基础知识点有哪些",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"CDH5基础知识点有哪些"吧!0. 体系架构CM分为Serv
千家信息网最后更新 2025年01月24日CDH5基础知识点有哪些

这篇文章主要讲解了"CDH5基础知识点有哪些",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"CDH5基础知识点有哪些"吧!

0. 体系架构

CM分为Server与Agent两部分及数据库(自带更改过的嵌入Postgresql)。它主要做三件事件:

1. 管理监控集群主机。

2. 统一管理配置。

3. 管理维护Hadoop平台系统。

实现采用C/S结构,Agent为客户端负责执行服务端发来的命令,执行方式一般为使用python调用相应的服务shell脚本。Server端为Java REST服务,提供REST API,Web管理端通过REST API调用Server端功能,Web界面使用富客户端技术(Knockout)。

1. Server端主体使用Java实现。

2. Agent端主体使用Python, 服务的启动通过调用相应的shell脚本进行启动,如果启动失败会重复4次调用启动脚本。

3. Agent与Server保持心跳,使用Thrift RPC框架。

1. 相关目录

· /opt/cloudera/parcels/ : Hadoop相关服务安装目录。

· /opt/cloudera/parcel-repo/ : 下载的服务软件包数据,数据格式为parcels。

· /opt/cloudera/parcel-cache/ : 下载的服务软件包缓存数据。

· /opt/cloudera/parcels/CDH/jars : 所有jar包所在目录

· /var/log/cloudera-scm-installer : 安装日志目录

· /var/log/cloudera-scm-* : 相关日志文件(相关服务的及CM的)

· /usr/share/cmf/ : 程序安装目录

· /usr/lib64/cmf/ : Agent程序代码

· /var/lib/cloudera-scm-server-db/data : 内嵌postgresql数据库目录

· /var/lib/cloudera-scm-server:服务端目录

· /usr/bin/postgres : 内嵌数据库程序

· /etc/cloudera-scm-agent/ : cm agent的配置目录。

· /etc/cloudera-scm-agent/config.ini :配置连接服务端的配置,如server_host

· /etc/cloudera-scm-server/ : cm server的配置目录。

· /etc/cloudera-scm-server/db.properties :database settings

· /etc/hadoop/* :hadoop客户端配置目录

· /etc/hive/ :hive 的配置目录

2. 配置及环境变量

CDH安装完成后,服务启动时,Hadoop各组件配置文件会被放置于/var/run/cloudera-scm-agent/process/目录下。

例如:/var/run/cloudera-scm-agent/process/193-hdfs-NAMENODE/core-site.xml。这些配置文件是通过Cloudera Manager启动相应服务(如HDFS)时生成的,内容从数据库中获得(即通过界面配置的参数)。

在CM界面上更改配置是不会立即反映到配置文件中,这些信息会存储于数据库中,等下次重启服务时才会生成配置文件。且每次启动时都会产生新的配置文件。

CM Server主要数据库为scm/cmf中放置配置的数据表为configs。里面包含了服务的配置信息

每一次配置的更改会把当前页面的所有配置内容添加到数据库中,以此保存配置修改历史。

· 查看配置内容

a.直接查询cmf数据库的configs数据表的内容。

b.访问REST API:http://172.16.101.66:7180/api/v4/cm/deployment,返回JSON格式部署配置信息。

· 配置生成方式

CM为每个服务进程生成独立的配置目录(文件)。所有配置统一在服务端查询数据库生成(因为scm/cmf数据库只能在localhost下访问)生成配置文件,再由agent通过网络下载包含配置文件的zip包到本地解压到指定的目录。

· 配置修改

CM对于需要修改的配置预先定义,对于没有预先定义的配置,则通过在高级配置项中使用xml配置片段的方式进行配置。而对于/etc/hadoop/下的配置文件是客户端的配置,可以在CM通过部署客户端生成客户端配置。

· 环境变量脚本:/opt/cloudera/parcels/CDH/meta/cdh_env.sh

CDH_HADOOP_HOME=/opt/cloudera/parcels/CDH/lib/hadoop

HADOOP_BIN=/opt/cloudera/parcels/CDH/lib/hadoop-0.20-mapreduce/bin/Hadoop

#CM 客户端/服务端、Hadoop各个组件的配置文件都在/etc目录下

HDFSActive NameNode 数据目录 dfs.name.dir/dfs/nn
Standby NameNode 数据目录 dfs.name.dir/dfs/nn
Secondary NameNode HDFS 检查点目录fs.checkpoint.dir/dfs/nn
日志目录hadoop.log.dir/var/log/hadoop-hdfs
MapReduceJobTracker 本地数据目录mapred.local.dir/mapred/jt
TaskTracker 本地数据目录列表mapred.local.dir/mapred/local
日志目录hadoop.log.dir/var/log/hadoop-0.20-mapreduce
Hive仓库目录hive.metastore.warehouse.dir/user/hive/warehouse
HiveServer2 日志目录/var/log/hive
Zookeeper数据目录dataDir/var/lib/zookeeper
事务日志目录dataLogDir/var/lib/zookeeper

3. CM常用命令

service cloudera-scm-server start|stop|restart|status

service cloudera-scm-server-db start|stop|restart|status

service cloudera-scm-agent start|stop|restart|status

查看进程:jps / jps -l

4. Hadoop Shell

hadoop fs -ls /:列出hdfs文件系统根目录下的目录和文件

hadoop fs -ls -R /:列出hdfs文件系统所有的目录和文件

hadoop dfsadmin -report : 查看文件系统的基本信息和统计信息

感谢各位的阅读,以上就是"CDH5基础知识点有哪些"的内容了,经过本文的学习后,相信大家对CDH5基础知识点有哪些这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!

配置 目录 数据 服务 文件 数据库 客户 生成 内容 客户端 日志 知识 知识点 信息 基础 系统 脚本 管理 方式 界面 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 收录期刊文献的全文数据库是 连接被重置服务器断开了连接 嘉善景瑞网络技术 企业服务器架构图 数据库前件后件是什么 应用软件开发工资多少 机房服务器管理规定 铁路计算机网络技术是干啥的 软件开发接私活需要注意什么 阿里巴巴如何协助网络安全 淘宝商城科技移动互联网 国家网络安全宣传周直播 网络安全几大品牌 数模与软件开发有关系吗 华三杯网络技术大赛山东 k3 数据库 备份 csgo服务器参数 网络安全类产品国家强制要求 服务器安全测试的项目包括 删除生产数据库被判刑 我的世界服务器卡顿怎么解决方案 洛阳市网络安全宣传活动 软件开发专业的职业生涯规划 学习网络安全的学校 如何删除数据库旧数据库 绩溪微型软件开发服务销售厂 大数据库是来干嘛的 武汉艾迪壹佰网络技术 味极达网络技术 如何将文件图片保存到数据库
0