千家信息网

spark是如何使用堆栈的

发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,本篇内容介绍了"spark是如何使用堆栈的"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!spark进
千家信息网最后更新 2025年01月23日spark是如何使用堆栈的

本篇内容介绍了"spark是如何使用堆栈的"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

spark进程是以JVM进程运行的,可以通过-Xmx和-Xms配置堆栈大小,它是如何使用堆栈呢?下面是spark内存分配图。

storage memory

spark默认JVM堆为512MB,为了避免OOM错误,只使用90%。通过spark.storage.safetyFraction来设置。spark通过内存来存储需要处理的数据,使用安全空间的60%,通过 spark.storage.memoryFraction来控制。如果我们想知道spark可以缓存多少数据?假设使用executors数为N,那么缓存数据为N*90%*60%*512MB。 ##shuffle memory shuffle memory的内存为"Heap Size" * spark.shuffle.safetyFraction * spark.shuffle.memoryFraction。默认spark.shuffle.safetyFraction 是 0.8 , spark.shuffle.memoryFraction是0.2 ,因此shuffle memory为 0.8*0.2*512MB = 0.16*512MB ##unroll memory unroll memory的内存为spark.storage.unrollFraction * spark.storage.memoryFraction * spark.storage.safetyFraction,即0.2 * 0.6 * 0.9 * 512MB = 0.108 * 512MB。unroll memory用作数据序列化和反序列化。

"spark是如何使用堆栈的"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!

堆栈 内存 数据 内容 序列 更多 知识 缓存 进程 实用 安全 学有所成 接下来 可以通过 困境 大小 实际 情况 文章 案例 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 重庆语音网络技术分类技术 软件开发服务的合同 数据库查询中筛选器和表达式 小米手机网络安全关闭 网络安全有啥子证书 三亚双花网络技术有限公司 配电网络的数据库er图 文章出了刊没有被数据库收录 镇海嵌入式软件开发企业 本地网络安全公司 微信服务器一直运行旧代码 易和网络技术有限公司 公安局的网络安全管理职位 中专网络安全需要笔记本吗 网络安全攻防靶场平台图片 信息系统集成包含软件开发吗 浙江企业软件开发哪家可靠 网络安全主题班会课件末尾自取 mysql数据库报错1604 大学网络安全宣传活动简报 上海网络安全技术培训简单易学 数据库语句有top vba 清空67列数据库 网络技术可以考什么专科大学 孩子学习网络技术 apriori算法扫描数据库 我的世界单人存档转服务器 达梦数据库查询到期时间 计算机网络安全基础第三版 宏策科技 互联网
0