如何解析Spark集群和任务执行过程
发表于:2025-02-23 作者:千家信息网编辑
千家信息网最后更新 2025年02月23日,本篇文章给大家分享的是有关如何解析Spark集群和任务执行过程,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。Spark集群组件Spark
千家信息网最后更新 2025年02月23日如何解析Spark集群和任务执行过程
Spark是典型的Master/Slave架构,集群主要包括以下4个组件: Driver:Spark框架中的驱动器,运行用户编写Application 的main()函数。类比于MapReduce的MRAppmaster Master:主节点,控制整个集群,监控worker。在Yarn模式中为全局资源管理器 Worker:从节点,负责控制计算节点,启动Executor。类比Yarn中的节点资源管理器 Executor:运算任务执行器,运行在worker节点上的一个进程。类似于MapReduce中的MapTask和ReduceTask
1.客户端启动应用程序及Driver相关工作,向Master提交任务申请资源
2.Master给Worker分配资源,通知worker启动executor 4.ExecutorBackend启动后向Driver的SchedulerBackend注册,SchedulerBackend将任务提交到Executor上运行 5.所有Stage都完成后作业结束
本篇文章给大家分享的是有关如何解析Spark集群和任务执行过程,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
Spark集群组件
Spark基本执行流程
以StandAlone运行模式为例:
1.客户端启动应用程序及Driver相关工作,向Master提交任务申请资源
3.Worker启动Executor,Worker创建ExecutorRunner线程,ExecutorRunner会启动ExecutorBackend进程,Executor和Driver进行通信(任务分发监听等)
笔者强调:
Driver端进行的操作
SparkContext构建DAG图
DAGScheduler将任务划分为stage、为需要处理的分区生成TaskSet
TaskScheduler进行task下发
SchedulerBackend将任务提交到Executor上运行 资源划分的一般规则
获取所有worker上的资源
按照资源大小进行排序
按照排序后的顺序拿取资源
轮询
优先拿资源多的 Spark不同运行模式任务调度器是不同的,如Yarn模式:yarn-cluster模式为YarnClusterScheduler,yarn-client模式为YarnClientClusterScheduler
以上就是如何解析Spark集群和任务执行过程,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。
任务
资源
模式
运行
集群
节点
过程
不同
更多
知识
篇文章
组件
资源管理
进程
工作
排序
控制
管理
全局
典型
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
java学习主流数据库
qq空间的数据库设计
静态网站数据库
设计院网络安全管理制度
软件开发类招聘网站
嵌入式开发和互联网软件开发
控件连接数据库稳定吗
服务器怎么显示正在使用的用户
睿民互联网科技有限公司
网络技术管理与创新
会员绑定手机网络安全法
工业网络技术基本知识
志邦家居软件开发岗怎么样
关注网络安全我们应该怎么做
如何登录远程主机的数据库
网络安全 测试
有信号就是连接不到服务器
路由器显示服务器已连接
vue前端数据库查询
漳州市超越网络技术有限公司
网络安全教育警示案例
手抄报关于网络安全简单的
贵州企业软件开发公司
网络安全渊源
知到数据库应用与开发
关注网络安全我们应该怎么做
数据库游标超过上限
深圳时时彩软件开发公司
数据库 join 一对一
彩铅画网络安全手抄报