千家信息网

jvm-profiler中如何使用spark 内存

发表于:2024-10-18 作者:千家信息网编辑
千家信息网最后更新 2024年10月18日,本篇文章给大家分享的是有关 jvm-profiler中如何使用spark 内存,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。jvm-pr
千家信息网最后更新 2024年10月18日jvm-profiler中如何使用spark 内存

本篇文章给大家分享的是有关 jvm-profiler中如何使用spark 内存,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

jvm-profiler

一般来说监控 spark 内存有2种方式

  1. 通过 Spark ListenerBus 获取 Executor 内部的内存使用情况 ,现在能获取的相关信息还比较少,在 https://github.com/apache/spark/pull/21221 合进来后就能采集到executor 内存各个逻辑分区的使用情况。

  2. 通过 Spark Metrics 将 JVM 信息发送到指定的 sink,用户也可以自定义 Sink 比如发送到 kafka/Redis。

Uber 最近开源了 jvm-profiler,采集分布式JVM应用信息,可以用于 debug CPU/mem/io 或者方法调用的时间等。比如调整Spark JVM 内存大小,监控 HDFS Namenode RPC 延时,分析数据血缘关系。

应用于 Spark 比较简单

每5S采集一次JVM信息,发送到 kafka profiler_CpuAndMemory topic


hdfs dfs -put jvm-profiler-0.0.9.jar hdfs://hdfs_url/lib/jvm-profiler-0.0.9.jar--conf spark.jars=hdfs://hdfs_url/lib/jvm-profiler-0.0.9.jar--conf spark.executor.extraJavaOptions=-javaagent:jvm-profiler-0.0.9.jar=reporter=com.uber.profiling.reporters.KafkaOutputReporter,metricInterval=5000,brokerList=brokerhost:9092,topicPrefix=profiler_

消费后存入HDFS用于分析。

分析

hive 表结构

对用户自定义内存的任务进行分析

用户自定义内存调度任务,75%的任务内存使用率低于80%,可以进行优化。

用户自定义内存调度任务

用户自定义内存开发任务,45%的任务内存使用率低于20%,用户存在不良使用习惯。

用户自定义内存开发任务

总结

通过采集 jvm 的最大使用值和设定值,可以解决下述问题。

  1. 内存滥用

  2. 监控应用内存使用趋势,防止数据增长导致内存不足

  3. Spark Executor 默认内存设置不合理

根据应用的使用预计内存减少情况

  • executor 默认内存减少10%,平均每个任务能释放 60G 内存

  • 自定义内存调度任务利用率提高到 70%,平均每个任务能释放 450G 内存

  • 自定义内存开发任务利用率提高到 70%,平均每个任务能释放 550G 内存

以上就是 jvm-profiler中如何使用spark 内存,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。

内存 任务 用户 信息 分析 应用 情况 开发 监控 调度 使用率 利用率 数据 更多 知识 篇文章 不合理 不良 实用 最大 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 互联网科技的大事件了解一下 网络安全泄密专项总结报告 校园网络安全作文650 瑞安天气预报软件开发 网络安全生态是破解时代 lol手游外服玩哪个服务器 如何把踢出服务器的指令撤回 如何测服务器带宽 adt是软件开发工具包吗 网页服务器怎么远程进入 如何在世界中创造一个服务器 网络安全小故事400字 数据库系统及其应用视频 青山区电商网络安全维护范围 数据库导出excel为空值 金融网络安全视频 回收打印机台式电脑液晶屏服务器 web应用保证网络安全 数据库查询某一部门的工资并输出 网络安全为人民的知识 云数据库操作系统 邯郸软件开发培训学校 数据库中的ole对象是什么意思 东丽区信息网络技术诚信合作 网络安全宣传梅江 数据库系统及其应用视频 软件开发和测试的薪资待遇 数据库查询某一部门的工资并输出 人口数据库更新 查重数据库帐号
0