导航：首页 > 互联网科技 >

centOS7下Spark安装配置

发表于：2024-11-17 作者：千家信息网编辑

千家信息网最后更新 2024年11月17日，环境说明：操作系统： centos7 64位 3台 centos7-1 192.168.190.130 master centos7-2 192.168.1

千家信息网最后更新 2024年11月17日centOS7下Spark安装配置

    环境说明：        操作系统： centos7 64位 3台        centos7-1 192.168.190.130 master        centos7-2 192.168.190.129 slave1        centos7-3 192.168.190.131 slave2    安装spark需要同时安装如下内容：    jdk  scale      1.安装jdk，配置jdk环境变量    这里不讲如何安装配置jdk，自行百度。    2.安装scala    下载scala安装包，https://www.scala-lang.org/download/选择符合要求的版本进行下载，使用客户端工具上传到服务器上。解压：    #tar -zxvf scala-2.13.0-M4.tgz    再次修改/etc/profile文件，添加如下内容：    export SCALA_HOME=$WORK_SPACE/scala-2.13.0-M4    export PATH=$PATH:$SCALA_HOME/bin    #source /etc/profile      // 让其立即生效    #scala -version           //查看scala是否安装完成    3.安装spark    spark下载地址：http://spark.apache.org/downloads.html     说明：有不同的版本包下载，选则你需要的下载安装即可    Source code: Spark 源码，需要编译才能使用，另外 Scala 2.11 需要使用源码编译才可使用    Pre-build with user-provided Hadoop: "Hadoop free" 版，可应用到任意 Hadoop 版本    Pre-build for Hadoop 2.7 and later: 基于 Hadoop 2.7 的预先编译版，需要与本机安装的 Hadoop 版本对应。可选的还有 Hadoop 2.6。我这里因为装的hadoop是3.1.0，所以直接安装for hadoop 2.7 and later的版本。            注：hadoop的安装请查看我的上一篇博客，不在重复描述。

#mkdir spark #cd /usr/spark#tar -zxvf spark-2.3.1-bin-hadoop2.7.tgz#vim /etc/profile#添加spark的环境变量，加如PATH下、export出来#source /etc/profile#进入conf目录下，把spark-env.sh.template拷贝一份改名spark-env.sh#cd /usr/spark/spark-2.3.1-bin-hadoop2.7/conf#cp spark-env.sh.template spark-env.sh#vim spark-env.shexport SCALA_HOME=/usr/scala/scala-2.13.0-M4export JAVA_HOME=/usr/lib/jvm/jre-1.8.0-openjdk-1.8.0.171-8.b10.el7_5.x86_64export HADOOP_HOME=/usr/hadoop/hadoop-3.1.0export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoopexport SPARK_HOME=/usr/spark/spark-2.3.1-bin-hadoop2.7export SPARK_MASTER_IP=masterexport SPARK_EXECUTOR_MEMORY=1G#进入conf目录下，把slaves.template拷贝一份改名为slaves#cd /usr/spark/spark-2.3.1-bin-hadoop2.7/conf#cp slaves.template slaves#vim slaves#添加节点域名到slaves文件中#master     //该域名为centos7-1的域名#slave1     //该域名为centos7-2的域名#slave2     //该域名为centos7-3的域名

启动spark
#启动spark之前先要把hadoop节点启动起来
#cd /usr/hadoop/hadoop-3.1.0/
#sbin/start-all.sh
#jps //检查启动的线程是否已经把hadoop启动起来了
#cd /usr/spark/spark-2.3.1-bin-hadoop2.7
#sbin/start-all.sh

备注：在slave1\slave2节点上也必须按照上面的方式安装spark，或者直接拷贝一份到slave1,slave2节点上#scp -r /usr/spark root@slave1ip:/usr/spark启动信息如下:

starting org.apache.spark.deploy.master.Master, logging to /usr/spark/logs/spark-root-org.apache.spark.deploy.master.Master-1-master.out
slave2: starting org.apache.spark.deploy.worker.Worker, logging to /usr/spark/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-slave2.com.cn.out
slave1: starting org.apache.spark.deploy.worker.Worker, logging to /usr/spark/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-slave1.com.cn.out
master: starting org.apache.spark.deploy.worker.Worker, logging to /usr/spark/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-master.out

测试Spark集群：用浏览器打开master节点上的spark集群url:http://192.168.190.130:8080/

很赞哦！

版本节点域名拷贝环境编译配置内容变量文件源码目录集群不同操作系统信息再次博客同时地址数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全全球网络安全标准无线网络技术创新服务暗黑3拍卖行服务器佛山支付软件开发设计如何查看系统装了什么数据库胜先会软件开发中心注册码网络安全问题答题库检索中文期刊论文用哪几个数据库数据库升级后1146 天津挑选软件开发模型如何成为一名软件开发人员传奇数据库密码修改组织网络安全专题讲座程序 2021年网络安全周是第几个贵州移动城管软件开发电话网络安全海报手绘内容认证授权服务器网络安全工作目标 200元家庭服务器明日之后最受欢迎的服务器是什么软件开发设计模式面试软件开发是技术么数据库是否应该加约束皇室战争如何更改服务器河北加工软件开发发展现状网页无法下载的数据库我的阿里云服务器保定机械盘古网络技术支持认证授权服务器安全数据库加密系统王勇

千家信息网

千家信息网

centOS7下Spark安装配置

笔记本电脑中如何设置固定IP地址不被修改

GWAS和GS分析中到底是用BLUE值还是BLUP值

相关文章