spark-yarn 模式 jar包优化
发表于:2024-12-12 作者:千家信息网编辑
千家信息网最后更新 2024年12月12日,在yarn模式下,会上传jar包到yarn来执行spark程序,如果每次都上传,很耗时间,而且如果是阿里云的机器,上传很慢,180m的jar要上传十几分钟,所以要提前上传到hdfs中去。spark支持
千家信息网最后更新 2024年12月12日spark-yarn 模式 jar包优化
在yarn模式下,会上传jar包到yarn来执行spark程序,如果每次都上传,很耗时间,而且如果是阿里云的机器,上传很慢,180m的jar要上传十几分钟,所以要提前上传到hdfs中去。
spark支持如下几个参数
spark.yarn.jars:只能指定具体jar包,在spark1.6.2(包括)以前,从官网上可以下载一个大的jar包,写上这个jar包即可,但是在2.0过后,就成为了一大堆小包
spark.yarn.archive:这个支持文件夹,但是有一点要注意,
.set("spark.yarn.archive","hdfs://node2:8020/user/xiaokan/assembly/target/scala-2.11/jars")
.set("spark.yarn.archive","hdfs://node2:8020/user/xiaokan/assembly/target/scala-2.11/jars/")
只有第一种写法正确,第二种错误,第二种写法不会读取任何jar包。
写法
支持
模式
参数
只有
大堆
小包
文件
文件夹
是在
机器
程序
过后
错误
阿里
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
服务器2g内存
数据库id值快满了怎么处理
华为数据库可视化中台
dell服务器维修点
vb指针回到数据库原位置
常熟电子网络技术哪个好
饥荒联机版搭建阿里云服务器
东城二手服务器回收估价
金华市规划编制成果空间数据库
提供零信任网络安全
哪个光影材质包能装在服务器里面
什么是网路服务器
华脉软件开发
网络安全漏洞图片
校园网络安全教育主题图片
北京服务器机柜设计
腾讯阿里云服务器原理
中国最大的软件开发公司排名
催眠软件开发
DB2数据库专家
数字经济服务器一哥
湖南盘古软件开发有限公司
计算机网络技术基础T恤推荐
挑战拿走服务器的龙蛋
数据库订单表
亳州通信软件开发需要多少钱
中国三大网上期刊数据库对比
r 语言 取重复的数据库
人渣服务器管理员代码
知网论文怎么打印数据库