千家信息网

为什么我们生产上要选择Spark On Yarn模式?

发表于:2024-11-27 作者:千家信息网编辑
千家信息网最后更新 2024年11月27日,为什么我们生产上要选择Spark On Yarn?开发上我们选择local[2]模式生产上跑任务Job,我们选择Spark On Yarn模式 ,将Spark Application部署到yarn中,
千家信息网最后更新 2024年11月27日为什么我们生产上要选择Spark On Yarn模式?

为什么我们生产上要选择Spark On Yarn?

开发上我们选择local[2]模式
生产上跑任务Job,我们选择Spark On Yarn模式 ,

将Spark Application部署到yarn中,有如下优点:

1.部署Application和服务更加方便

  • 只需要yarn服务,包括Spark,Storm在内的多种应用程序不要要自带服务,它们经由客户端提交后,由yarn提供的分布式缓存机制分发到各个计算节点上。

2.资源隔离机制

  • yarn只负责资源的管理和调度,完全由用户和自己决定在yarn集群上运行哪种服务和Applicatioin,所以在yarn上有可能同时运行多个同类的服务和Application。Yarn利用Cgroups实现资源的隔离,用户在开发新的服务或者Application时,不用担心资源隔离方面的问题。

3.资源弹性管理

  • Yarn可以通过队列的方式,管理同时运行在yarn集群种的多个服务,可根据不同类型的应用程序压力情况,调整对应的资源使用量,实现资源弹性管理。

Spark On Yarn有两种模式,一种是cluster模式,一种是client模式。

运行client模式:

  • "./spark-shell -master yarn"
  • "./spark-shell -master yarn-client"
  • "./spark-shell -master yarn -deploy-mode client"

运行的是cluster模式

  • "./spark-shell -master yarn-cluster"
  • "./spark-shell -master yarn -deploy-mode cluster"

client和cluster模式的主要区别:a. client的driver是运行在客户端进程中b. cluster的driver是运行在Application Master之中

模式 资源 服务 运行 管理 选择 隔离 生产 同时 多个 客户 客户端 应用程序 弹性 机制 用户 程序 集群 应用 开发 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 从事软件开发一年还是初级 上海威博网络技术是上市公司吗 数据资源管理监测软件开发 懒人听书软件开发 北京达因军惠网络技术有限 浪潮服务器管理软件开发 宁波建设智慧学校软件开发 亲朋服务器占时无法登录什么情况 有巢氏数据库 云上部署备份服务器 海宁卡卡网络技术有限公司 软件开发工作日志英文 违反网络安全怎么拘留 全民枪战2哪个服务器好 昆山提供网络技术包括什么 天津私人服务器操作系统虚拟主机 plc能用远程数据库吗 软件开发过程中的V模型中 网络安全素养心得体会100字 一流网络安全企业 审计报告比较数据库 杨浦区自动化软件开发口碑推荐 德州便民平台软件开发哪儿好 网络安全知识内容文案 刀片服务器机 服务器主板显示bf是啥意思 数据库登陆加密 专业区块链软件开发 网络安全专题课公开课 水稻 数据库 蛋白组
0