导航：首页 > 互联网科技 >

spark 1.X standalone和on yarn安装配置

发表于：2025-01-31 作者：千家信息网编辑

千家信息网最后更新 2025年01月31日，安装JDK 1.7以上 Hadoop 2.7.0不支持JDK1.6，Spark 1.5.0开始不支持JDK 1.6安装Scala 2.10.4安装 Hadoop 2.x 至少HDFSspark-env

千家信息网最后更新 2025年01月31日spark 1.X standalone和on yarn安装配置

安装JDK 1.7以上 Hadoop 2.7.0不支持JDK1.6，Spark 1.5.0开始不支持JDK 1.6

安装Scala 2.10.4

安装 Hadoop 2.x 至少HDFS

spark-env.sh

export JAVA_HOME=export SCALA_HOME=export HADOOP_CONF_DIR=/opt/modules/hadoop-2.2.0/etc/hadoop //运行在yarn上必须要指定export SPARK_MASTER_IP=server1export SPARK_MASTER_PORT=8888export SPARK_MASTER_WEBUI_PORT=8080export SPARK_WORKER_CORES=export SPARK_WORKER_INSTANCES=1export SPARK_WORKER_MEMORY=26gexport SPARK_WORKER_PORT=7078export SPARK_WORKER_WEBUI_PORT=8081export SPARK_JAVA_OPTS="-verbose:gc -XX:-PrintGCDetails -XX:PrintGCTimeStamps"

slaves指定worker节点

xx.xx.xx.2xx.xx.xx.3xx.xx.xx.4xx.xx.xx.5

运行spark-submit时默认的属性从spark-defaults.conf文件读取

spark-defaults.conf

spark.master=spark://hadoop-spark.dargon.org:7077

启动集群

start-master.shstart-salves.sh

spark-shell命令其实也是执行spark-submit命令

spark-submit --help

deploy-mode针对driver program(SparkContext)的client(本地)、cluster(集群)

默认是client的，SparkContext运行在本地，如果改成cluster则SparkContext运行在集群上

hadoop on yarn的部署模式就是cluster，SparkContext运行在Application Master

spark-shell quick-start链接

http://spark.apache.org/docs/latest/quick-start.html

很赞哦！

运行集群命令支持就是属性文件模式节点链接配置数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全阿克苏网络安全服务如何使用中国国史数据库软件开发的二本理科大学排名软件开发考研难吗计算机数据库学习历史辞典数据库下载用友修改数据库学生网络安全征文500字计算机网络技术专业电脑拯救者青山联想服务器供应商计算机三级网络技术模考软件电脑服务器可以接几台电脑全国人口各省普查数据库 c 软件开发工程师入职苹果服务器被黑软件开发和编程那种好为什么要进行网络安全防护云租户内数据库系统数据库有哪些数据库三级数据库技术考试真题控制管理服务器品牌阿里云服务器虚拟的吧用友修改数据库计算机三级网络技术模考软件 2020全球网络技术大会 pd生成数据库文件科技互联网专家业务部门关于网络安全的要求计算机网络技术综合实训教程一般网络安全设置设什么

千家信息网

千家信息网

spark 1.X standalone和on yarn安装配置

sybase是一款什么数据库

windows下80端口被占用nginx不能启动怎么解决

相关文章