为什么我们生产上要选择Spark On Yarn模式?
发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,为什么我们生产上要选择Spark On Yarn?开发上我们选择local[2]模式生产上跑任务Job,我们选择Spark On Yarn模式 ,将Spark Application部署到yarn中,
千家信息网最后更新 2025年01月23日为什么我们生产上要选择Spark On Yarn模式?
为什么我们生产上要选择Spark On Yarn?
开发上我们选择local[2]模式
生产上跑任务Job,我们选择Spark On Yarn模式 ,
将Spark Application部署到yarn中,有如下优点:
1.部署Application和服务更加方便
- 只需要yarn服务,包括Spark,Storm在内的多种应用程序不要要自带服务,它们经由客户端提交后,由yarn提供的分布式缓存机制分发到各个计算节点上。
2.资源隔离机制
- yarn只负责资源的管理和调度,完全由用户和自己决定在yarn集群上运行哪种服务和Applicatioin,所以在yarn上有可能同时运行多个同类的服务和Application。Yarn利用Cgroups实现资源的隔离,用户在开发新的服务或者Application时,不用担心资源隔离方面的问题。
3.资源弹性管理
- Yarn可以通过队列的方式,管理同时运行在yarn集群种的多个服务,可根据不同类型的应用程序压力情况,调整对应的资源使用量,实现资源弹性管理。
Spark On Yarn有两种模式,一种是cluster模式,一种是client模式。
运行client模式:
- "./spark-shell -master yarn"
- "./spark-shell -master yarn-client"
- "./spark-shell -master yarn -deploy-mode client"
运行的是cluster模式
- "./spark-shell -master yarn-cluster"
- "./spark-shell -master yarn -deploy-mode cluster"
client和cluster模式的主要区别:a. client的driver是运行在客户端进程中b. cluster的driver是运行在Application Master之中
模式
资源
服务
运行
管理
选择
隔离
生产
同时
多个
客户
客户端
应用程序
弹性
机制
用户
程序
集群
应用
开发
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
DNS服务器在哪里获得
数据库80 90 100
闲鱼发布软件开发
网络安全中的个人隐私
家庭教育与网络安全公约
厦门软件开发学校
阜阳颍泉区网络安全
境外服务器推荐
嵌入式和网络安全区别
校园网络安全实名制
上海信息软件开发产品介绍
光网络技术有哪些速率等级
中国平安成都软件开发
网络安全考试题及解析
台式电脑服务器组建
河北省比较好的服务器云主机
中峰乡软件开发培训
云丁网络技术公司怎么样
上海浦东安卓软件开发招聘
北京bim软件开发工程多少钱
java中的mysql数据库
软件开发工程师具体工作内容
北邮 数据库
中国篮球数据库新浪
宿舍网络安全宣传视频
三大中文数据库体会
电站网络安全培训的内容
服务器防火墙开了无法远程桌面
佛山市乐商互联网科技
数据库80多g