如何解析Spark集群和任务执行过程
发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,本篇文章给大家分享的是有关如何解析Spark集群和任务执行过程,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。Spark集群组件Spark
千家信息网最后更新 2025年01月23日如何解析Spark集群和任务执行过程
Spark是典型的Master/Slave架构,集群主要包括以下4个组件: Driver:Spark框架中的驱动器,运行用户编写Application 的main()函数。类比于MapReduce的MRAppmaster Master:主节点,控制整个集群,监控worker。在Yarn模式中为全局资源管理器 Worker:从节点,负责控制计算节点,启动Executor。类比Yarn中的节点资源管理器 Executor:运算任务执行器,运行在worker节点上的一个进程。类似于MapReduce中的MapTask和ReduceTask
1.客户端启动应用程序及Driver相关工作,向Master提交任务申请资源
2.Master给Worker分配资源,通知worker启动executor 4.ExecutorBackend启动后向Driver的SchedulerBackend注册,SchedulerBackend将任务提交到Executor上运行 5.所有Stage都完成后作业结束
本篇文章给大家分享的是有关如何解析Spark集群和任务执行过程,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
Spark集群组件
Spark基本执行流程
以StandAlone运行模式为例:
1.客户端启动应用程序及Driver相关工作,向Master提交任务申请资源
3.Worker启动Executor,Worker创建ExecutorRunner线程,ExecutorRunner会启动ExecutorBackend进程,Executor和Driver进行通信(任务分发监听等)
笔者强调:
Driver端进行的操作
SparkContext构建DAG图
DAGScheduler将任务划分为stage、为需要处理的分区生成TaskSet
TaskScheduler进行task下发
SchedulerBackend将任务提交到Executor上运行 资源划分的一般规则
获取所有worker上的资源
按照资源大小进行排序
按照排序后的顺序拿取资源
轮询
优先拿资源多的 Spark不同运行模式任务调度器是不同的,如Yarn模式:yarn-cluster模式为YarnClusterScheduler,yarn-client模式为YarnClientClusterScheduler
以上就是如何解析Spark集群和任务执行过程,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。
任务
资源
模式
运行
集群
节点
过程
不同
更多
知识
篇文章
组件
资源管理
进程
工作
排序
控制
管理
全局
典型
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
梅州公安局网络技术员
交通银行软件开发中心总部
学网络安全买什么笔记本好
28所网络安全事业部
软件开发项目配置库
网络安全创新研究院论证
计算机网络技术 电子教案
数据库第六版 13章
苹果id首次登录无法连接服务器
数据库判断符合条件值列表
华为手机用网络技术
邮件目标服务器不存在被退回
拍牌软件开发
服务器安全模式如何进入
青岛唯米网络技术有限公司
云服务器网吧
防止服务器监控局域网电脑
组织网络安全考试经验
竞彩足球数据库
软件开发中涉及的三类人员
万网服务器的价格
网络安全如何确保
软件开发 复用系数
西安服务器机柜公司
cad的数据库应用与方向
网络安全与前端开发那个稳定
西宁森凯软件开发
广州个人云数据库
铜陵软件开发公司皖icp备
税务网络安全意识形态存在不足