千家信息网

Yarn架构

发表于:2025-02-02 作者:千家信息网编辑
千家信息网最后更新 2025年02月02日,Yarn是为了解决MRv1中JobTracker负载过重,而设计的第二代MR运行架构。yarn是个master/slave结构,master节点运行Resourcemanager,slave节点运行n
千家信息网最后更新 2025年02月02日Yarn架构

Yarn是为了解决MRv1中JobTracker负载过重,而设计的第二代MR运行架构。
yarn是个master/slave结构,master节点运行Resourcemanager,slave节点运行nodemanager。

  1. RM主要有两个组件:资源调度器(scheduler)和应用程序管理器(Applications Manager)
    scheduler主要进行资源调度,不进行任何与应用程序相关的动作,主要包括Capacity Scheduler和Fair scheduler。
    ASM:主要负责提交、启动以及监控每个application的application master
  2. AM
    每个作业都有一个application master来监控和管理自己的所有任务,具备的功能包括:
    a,与RM交互获取任务运行的资源;
    b,与NM交互提交任务、监控任务运行情况等
  3. NM
    一般集群中每个节点启动一个NM,NM不但向RM发送心跳,汇报本节点的资源使用情况;并与AM交互,接收并处理来自AM的所有关于container的请求。
  4. container
    一个逻辑概念,抽象的资源表示形式,可以代表一组多维度资源,目前yarn主要支持cpu和内存。

yarn工作流程


向yarn提交一个应用程序后,yarn主要分为两个步骤:第一步先启动application master;第二步由AM启动并监控本application中的所有任务,直到完成。

  1. 向yarn提交应用程序,包含application master程序,以及启动am的命令;
  2. RM为AM分配一个container,并与NM通信启动container来运行这个AM(这是唯一一个由RM和NM通信启动的container,其它的container都是AM与NM通信启动)
  3. AM启动之后,主动向RM发送心跳注册自己,此时RM可以监控这个AM,我们可以在yarn web页面上看到这个任务;
  4. AM轮询方式向RM申请和获取资源;
  5. AM获取到资源后,与NM通信要求启动任务;
  6. NM设置任务运行环境,启动任务;
  7. 各个NM上的任务,不断通过RPC向AM发送心跳,汇报自己的状态和进度;
  8. 任务全部完成后,AM向RM注销自己。
任务 资源 运行 程序 监控 应用程序 节点 应用 通信 两个 情况 汇报 管理 调度 架构 主动 不断 代表 内存 功能 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 杨浦区车载网络技术推荐咨询 关于开展全市网络安全检查 校准服务器时间的软件 软件开发三种工具 网络技术和通讯技术 网络安全导论 祖国互联网科技发达怎么做 软件开发合同甲方是卖方还是买方 公务员考试计算机网络技术题库 云南公司天人网络技术支持 关于网络安全的句子或诗句 比萨数据库 怎么确定网络安全性 微软公司软件开发方面的证件 x86服务器怎样部署网站 荣耀商城无法连接到服务器 楚雄州国家网络安全 pmp软件开发管理 电子商务数据库重点 网络安全信息中孚信息是什么公司 中国人民网络安全法的时间 祖国互联网科技发达怎么做 软件开发合同争议解决 怎样才能去华为当软件开发师 深圳和成都软件开发待遇 网络安全比赛证书 服务器多节点批量管理器 信息化软件开发特价 机器学习服务器安装教程 水星云监控器 使用自己的服务器
0