Spark2.4.2源码编译
发表于:2025-02-01 作者:千家信息网编辑
千家信息网最后更新 2025年02月01日,软件版本:jdk:1.8maven:3.61 http://maven.apache.org/download.cgispark:2.42 https://archive.apache.org/dis
千家信息网最后更新 2025年02月01日Spark2.4.2源码编译
软件版本:
jdk:1.8
maven:3.61 http://maven.apache.org/download.cgi
spark:2.42 https://archive.apache.org/dist/spark/spark-2.4.2/
hadoop版本:hadoop-2.6.0-cdh6.7.0(spark编译支持的hadoop版本,不需要安装)
配置maven:
#配置环境变量[root@hadoop004 soft]# cat /etc/profile.d/maven.sh MAVEN_HOME=/usr/local/mavenexport PATH=$MAVEN_HOME/bin:$PATH#确认maven版本[root@hadoop004 maven]# mvn --versionApache Maven 3.6.1 (d66c9c0b3152b2e69ee9bac180bb8fcc8e6af555; 2019-04-05T03:00:29+08:00)Maven home: /usr/local/mavenJava version: 1.8.0_111, vendor: Oracle Corporation, runtime: /usr/java/jdk1.8.0_111/jreDefault locale: en_US, platform encoding: UTF-8OS name: "linux", version: "3.10.0-862.3.2.el7.x86_64", arch: "amd64", family: "unix"#配置mvn的本地存放地址:settings.xml文件/usr/local/maven/repo #配置mvn下载源为阿里云的maven仓库,加速下载alimaven aliyun maven http://maven.aliyun.com/nexus/content/groups/public/ central
配置Spark:
tar xf spark-2.4.2.tgzcd spark-2.4.2.tgz#修改pom.xml文件,添加clouder仓库cloudera https://repository.cloudera.com/artifactory/cloudera-repos/
执行编译命令:
#在spark目录下执行./dev/make-distribution.sh --name 2.6.0-cdh6.7.0 --tgz -Pyarn -Phadoop-2.6 -Phive -Phive-thriftserver -Dhadoop.version=2.6.0-cdh6.7.0注:本次编译时长大约为35分钟,中间无任何报错;注:默认使用的scala版本为最新的,如果要指定scala版本,通过以下方式修改比如把scala版本改为 2.10./dev/change-scala-version.sh 2.10
参数说明:
--name:生成压缩包的后缀名字;前缀默认为spark版本的名字,本例为:spark-2.4.2-bin
--tgz:采用压缩格式为tar,压缩的后缀名为.tgz
-Pyarn:表示spark需要运行在yarn上面
-Phadoop-2.6:表示spark使用hadoop的profile的id
-Dhadoop.version=2.6.0-cdh6.7.0:表示spark使用hadoop的版本;如果不指定,默认使用的是2.2.0的hadoop
-Phive -Phive-thriftserver:表示支持hive
其它参数:
-DskipTests:跳过测试
生成的文件:
在spark目录下:spark-2.4.2-bin-2.6.0-cdh6.7.0.tgz
使用编译后的spark部署:
tar xf spark-2.4.2-bin-2.6.0-cdh6.7.0.tgzln -s spark-2.4.2-bin-2.6.0-cdh6.7.0 spark#配置spark的环境变量[hadoop@hadoop001 ~]$ vim .bash_profileexport SPARK_HOME=/home/hadoop/app/spark-2.4.2-bin-2.6.0-cdh6.7.0export PATH=${SPARK_HOME}/bin:$PATH[hadoop@hadoop001 ~]$ source .bash_profile#运行spark测试[hadoop@hadoop001 ~]$ spark-shell 19/04/29 10:51:04 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicableUsing Spark's default log4j profile: org/apache/spark/log4j-defaults.propertiesSetting default log level to "WARN".To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).Spark context Web UI available at http://hadoop001:4040Spark context available as 'sc' (master = local[*], app id = local-1556506274719).Spark session available as 'spark'.Welcome to ____ __ / __/__ ___ _____/ /__ _\ \/ _ \/ _ `/ __/ '_/ /___/ .__/\_,_/_/ /_/\_\ version 2.4.2 /_/ Using Scala version 2.11.12 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_111)Type in expressions to have them evaluated.Type :help for more information.scala>
版本
配置
编译
文件
仓库
参数
变量
名字
后缀
环境
目录
支持
测试
生成
运行
前缀
命令
地址
方式
时长
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
什么叫数据库访问组件
申请删除数据库
软件开发项目售后服务承诺函
cas 数据库验证
创欧网络技术有限公司
一个app调用2个数据库吗
网络安全宣讲后感
培训数据库月报范文
服务器cpu监控
网络安全一般事件启动几级响应
无法验证数据库参数
数据库中integer
电商服务器租用
微机中使用的数据库属于
绩效考核网络安全内容
服务器赞助
软件工程是计算机网络技术类
武汉市网络安全大会
DSP软件开发是做什么的
网络技术目标职业分析
优极网络安全海报
微信类软件开发费用
手机端如何访问服务器资源
信息短信服务器发送
数据库分页查询公式
湖南长沙软件开发公司哪个好
csgo开箱连接服务器错误
操作数据库会导致应用程序异常吗
攀枝花网络技术专业
慈溪手机游戏软件开发哪家好