spark-yarn 模式 jar包优化
发表于:2024-12-12 作者:千家信息网编辑
千家信息网最后更新 2024年12月12日,在yarn模式下,会上传jar包到yarn来执行spark程序,如果每次都上传,很耗时间,而且如果是阿里云的机器,上传很慢,180m的jar要上传十几分钟,所以要提前上传到hdfs中去。spark支持
千家信息网最后更新 2024年12月12日spark-yarn 模式 jar包优化
在yarn模式下,会上传jar包到yarn来执行spark程序,如果每次都上传,很耗时间,而且如果是阿里云的机器,上传很慢,180m的jar要上传十几分钟,所以要提前上传到hdfs中去。
spark支持如下几个参数
spark.yarn.jars:只能指定具体jar包,在spark1.6.2(包括)以前,从官网上可以下载一个大的jar包,写上这个jar包即可,但是在2.0过后,就成为了一大堆小包
spark.yarn.archive:这个支持文件夹,但是有一点要注意,
.set("spark.yarn.archive","hdfs://node2:8020/user/xiaokan/assembly/target/scala-2.11/jars")
.set("spark.yarn.archive","hdfs://node2:8020/user/xiaokan/assembly/target/scala-2.11/jars/")
只有第一种写法正确,第二种错误,第二种写法不会读取任何jar包。
写法
支持
模式
参数
只有
大堆
小包
文件
文件夹
是在
机器
程序
过后
错误
阿里
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
信息网络安全保护的实现
软件开发主流有哪些员工
国产串口设备服务器生产
智阳网络技术有限公司排名
一个服务器可以玩几个游戏
网络安全校园教务报告
qracle是数据库管理系统吗
网络安全对抗是什么
服务器系统稳定性
授予数据库创建视图的权限
济南智飞网络技术有限公司
网络技术批发价格
榆树有名的网络技术诚信服务
idc机房服务器安全检测
国家推行网络安全什么体系
北京联合众网络技术有限公司
达梦数据库更改数据文件名称
linuxdhcp服务器
主机安全是否属于网络安全
数据库服务器名称在哪里设置
青岛视觉软件开发教程
互联网直销软件开发
南邮软件开发考试卷
新时代网络安全的思考3000字
数据库行锁报错
饥荒联机版本地服务器搜索不到
数据库select可视化
网络安全就业训练营公开直播课
软件开发团队分工协作ppt
天津工业服务器及存储云服务器