千家信息网

Spark的HA是如何处理的

发表于:2025-02-02 作者:千家信息网编辑
千家信息网最后更新 2025年02月02日,本篇内容介绍了"Spark的HA是如何处理的"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Q1:Ma
千家信息网最后更新 2025年02月02日Spark的HA是如何处理的

本篇内容介绍了"Spark的HA是如何处理的"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

Q1:Master和Driver的是同一个东西吗?

  • 两者不是同一个东西,在Standalone模式下Master是用于集群资源管理和调度的,而Driver适用于指挥Worker上的Executor通过多线的方式处理任务的;

  • Master位于集群的管理节点,一般和 NameNode在同一个节点上;

  • Driver一般都位于客户机上,客户机一般都不属于集群,但是和集群在同一个网络环境下,因为客户机中的Driver要和集群中的Executor频繁的交互;

Q2:Standalone和Yarn之间如何选择

  • Standalone和Yarn都是用于资源管理的系统,Standalone是专门为Spark打造的资源管理和分配方式,是轻量级的,而Yarn是大数据通用的资源管理框架,不仅可以用于管理Spark顶点资源分配,也可以用于管理实现了Yarn的其它计算平台的资源管理和分配;

  • 如果在生产系统中有多套计算框架 ,例如Spark、MapReduce、Mahout并存,建议使用Yarn或者Mesos进行资源统一的管理和调度;如果只使用Spark的话,建议使用Standalone就足够了,Yarn比较消耗资源;

Q3:Spark 的HA怎么处理的?

  • 对于Master的HA,在Standalone模式下,Worker节点自动是HA的,对于Master的HA,一般采用Zookeeper;

  • Utilizing ZooKeeper to provide leader election and some state storage, you can launch multiple Masters in your cluster connected to the same ZooKeeper instance. One will be elected "leader" and the others will remain in standby mode. If the current leader dies, another Master will be elected, recover the old Master's state, and then resume scheduling. The entire recovery process (from the time the the first leader goes down) should take between 1 and 2 minutes. Note that this delay only affects scheduling new applications - applications that were already running during Master failover are unaffected;

  • 对于Yarn和Mesos模式,ResourceManager一般也会采用ZooKeeper进行HA;

"Spark的HA是如何处理的"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!

管理 资源 资源管理 集群 客户 模式 节点 分配 东西 内容 客户机 建议 方式 更多 框架 知识 系统 处理 调度 实用 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 多用户远程登录服务器 浙江图腾机柜服务器机柜虚拟主机 人工智能基础软件开发 数据库设计方案模板 触犯网络安全法通报是否需要公示 dns服务器 正向 反向 程序员做服务器开发能做多少年 网络安全的看法的作文 淄川供应链软件开发服务 怀旧服tbc 有哪些服务器 银行的网络安全构建 软件开发项目经理的工作简历 linux怎么查服务器是几核 连接数据库显示未设置属性 云服务器提供的服务和收费情况 互联网是属于科技还是消费 网络技术研发算制造业吗 强化网络安全监管工作情况 数据分析要学会哪种数据库 四川信息安全技术提升网络安全 重庆打车软件开发 湖南手机软件开发哪家好 两个数据库文件可以吗 吉林升腾服务器 网络安全free 国网网络安全调查答题 辽宁省网络安全答案 广达服务器主板开机按f1跳过 dell主板支持服务器内存吗 局网络安全领导小组
0