spark-yarn 模式 jar包优化
发表于:2025-02-01 作者:千家信息网编辑
千家信息网最后更新 2025年02月01日,在yarn模式下,会上传jar包到yarn来执行spark程序,如果每次都上传,很耗时间,而且如果是阿里云的机器,上传很慢,180m的jar要上传十几分钟,所以要提前上传到hdfs中去。spark支持
千家信息网最后更新 2025年02月01日spark-yarn 模式 jar包优化
在yarn模式下,会上传jar包到yarn来执行spark程序,如果每次都上传,很耗时间,而且如果是阿里云的机器,上传很慢,180m的jar要上传十几分钟,所以要提前上传到hdfs中去。
spark支持如下几个参数
spark.yarn.jars:只能指定具体jar包,在spark1.6.2(包括)以前,从官网上可以下载一个大的jar包,写上这个jar包即可,但是在2.0过后,就成为了一大堆小包
spark.yarn.archive:这个支持文件夹,但是有一点要注意,
.set("spark.yarn.archive","hdfs://node2:8020/user/xiaokan/assembly/target/scala-2.11/jars")
.set("spark.yarn.archive","hdfs://node2:8020/user/xiaokan/assembly/target/scala-2.11/jars/")
只有第一种写法正确,第二种错误,第二种写法不会读取任何jar包。
写法
支持
模式
参数
只有
大堆
小包
文件
文件夹
是在
机器
程序
过后
错误
阿里
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全周电商产业园启动仪式
山东理工大学有软件开发
数据库设计通常包括
浅谈数据库技术论文
网络安全知识进小学课堂讲座
表格匹配填充数据库
部门预算数据库在哪里
广东省网络安全工商学院
网络安全加固内容
深圳编程软件开发报价
大专计算机网络技术好找工作吗
数据库科目借贷属性
游戏模型开发软件开发
山东发展软件开发创新服务
光纤交换机 服务器
阿里巴巴网络技术部地址
小米5s无法定位服务器
公安开展网络安全法教育
psql数据库sql优化
护苗网络安全日
扫黄打非网络安全观后感
嵌入式软件开发培训哪家好
迁安创新软件开发答疑解惑
手机服务器升级需要几天
移动端web开发软件开发
远程ftp服务器搭建
互联网公司数据库营销方案
散布谣言算不算网络安全
啥叫镜像服务器
支持服务器的音乐播放器