千家信息网

Apache Hadoop的MapReduce有什么优点

发表于:2024-12-04 作者:千家信息网编辑
千家信息网最后更新 2024年12月04日,本篇内容主要讲解"Apache Hadoop的MapReduce有什么优点",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"Apache Hadoop的Map
千家信息网最后更新 2024年12月04日Apache Hadoop的MapReduce有什么优点

本篇内容主要讲解"Apache Hadoop的MapReduce有什么优点",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"Apache Hadoop的MapReduce有什么优点"吧!

MapReduce已经在hadoop-0.23中经历了彻底的检修,现在,我们有了称之为MapReduce2.0(MRv2) 或者 YARN的新的框架。

MRv2基本的理念是将JobTracker中两个主要的功能(资源管理和作业调度/监控),拆分为单独的守护进程。想法就是有一个全局的ResourceMaager(RM)和对应每个应用的ApplicationMaster(AM)。一个Application是传统意义上的一个Map-Reduce 或者DAG 的作业。

ResourceManager和每台节点上从属的NodeManager(NM),构成了数据计算的框架。RM是最终权威仲裁系统资源在所有应用中(的分配)。

事实上,每个应用的ApplicationMaster 是一个用来向RM协商资源,与NodeManager(s)一起工作,执行和监控任务的特定框架库。

ResourceManager有两个重要的组件:Scheduler和ApplicationsManager。

Scheduler负责为各式各样运行中的应用分配受限制的资源,比如相似的约束,容量,队列等等。Scheduler就只是一个scheduler,不监控和跟踪应用的状态。还有,他不会保证重启那些由于应用失败或是硬件失败的任务。Scheduler基于applications的资源需求来执行他的调度功能;基于将memory、cpu、network、disk等元素合并进来的抽象概念--资源容器Container。在第一个版本中,只支持memory。

Scheduler有一个可插入策略的插件,负责在不同队列,应用间对集群的资源进行分区。当前Map-Reduce schedulers,比如CapacityScheduler,FairScheduler就是这个插件的一些例子。

CapacityScheduler顾及共享的集群资源更容易预测,支持分层级的队列。

ApplicationsManager负责接收任务的提交,协商第一个用来执行特定ApplicationMaster的容器,提供在(任务?)失败时重启ApplicationMaster容器的服务。

NodeManager是每台机器的代理框架,负责containers,监控他们(机器)的资源使用情况(cpu,memory,disk,network),同时报告给ResourceManager/Scheduler。

每个应用的ApplicationMaster负责与Scheduler协商合适的资源容器,并跟踪他们的状态,监控进展。

MRV2 兼容之前的稳定版本(hadoop-1.x),这意味着所愿的Map-Reduce jobs 只需要重统计一下就可以奔跑在MRV2之上了。

 

 

理解:YARN框架是建立在之前的Map-Reduce之上,将之前JobTracker的两个主要功能进行了拆分,分家,资源一家(RM老大),监控一家(NM,ApplicationMaster),各自分工明确。

RM又把他的活分派给了两个小头目(Scheduler,ApplicationsManager),job的接收就交给ApplicationsManager来做,job的调度就交给Scheduler,ApplicationsManager还要负责失败时重启ApplicationMaster,兼任多职啊。

监控的活也细分了,节点的情况(内存,CPU,硬盘,网络等)就由NM来负责监控并上报给领导(RM),再细点说,应该是上报给Scheduler小头目,这样他在调度的时候就会根据你这台节点的状态来分配任务。而每个应用的状态和进展,就交由各自的ApplicationMaster来监控了,如果ApplicationMaster挂了(任务?),没事,ApplicationsManager来帮你重启。

到此,相信大家对"Apache Hadoop的MapReduce有什么优点"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

资源 应用 监控 任务 框架 两个 容器 状态 调度 优点 功能 节点 队列 分配 协商 一家 内容 头目 就是 情况 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 我国有哪些网络安全监管措施 数据库二进制和十进制存储 web应用数据库在哪里 腾讯云轻量应用服务器玩游戏 浏览器登录服务器提示未知异常 查询整个数据库的表 网络安全审判办法什么时候实施 部队当前网络安全形势怎么看 冒险岛2服务器ip 阿里云服务器解绑支付宝 腾讯软件开发需要什么资质 小学学校网络安全检查总结报告 t 普及版数据库安装 收费站开展国家网络安全 中国电信的服务器是谁做的 服务器选管理员 甘肃交通职业技术学院数据库 延长网络安全宣传周活动 大美綦江网络安全答案 联想服务器配置如何开启防火墙 vf数据库文件是 达梦数据库入门 传统数据库名字有哪三种 加工数据库加工方法怎么调不出 王者营地软件开发者是男的女的 静安区企业网络技术服务价目 计算机网络技术分班 哔哩漫游服务器发生错误 福建正规软件开发服务有哪些 ug10许可证服务器连不上
0