spark 1.X standalone和on yarn安装配置
发表于:2025-01-31 作者:千家信息网编辑
千家信息网最后更新 2025年01月31日,安装JDK 1.7以上 Hadoop 2.7.0不支持JDK1.6,Spark 1.5.0开始不支持JDK 1.6安装Scala 2.10.4安装 Hadoop 2.x 至少HDFSspark-env
千家信息网最后更新 2025年01月31日spark 1.X standalone和on yarn安装配置
安装JDK 1.7以上 Hadoop 2.7.0不支持JDK1.6,Spark 1.5.0开始不支持JDK 1.6
安装Scala 2.10.4
安装 Hadoop 2.x 至少HDFS
spark-env.sh
export JAVA_HOME=export SCALA_HOME=export HADOOP_CONF_DIR=/opt/modules/hadoop-2.2.0/etc/hadoop //运行在yarn上必须要指定export SPARK_MASTER_IP=server1export SPARK_MASTER_PORT=8888export SPARK_MASTER_WEBUI_PORT=8080export SPARK_WORKER_CORES=export SPARK_WORKER_INSTANCES=1export SPARK_WORKER_MEMORY=26gexport SPARK_WORKER_PORT=7078export SPARK_WORKER_WEBUI_PORT=8081export SPARK_JAVA_OPTS="-verbose:gc -XX:-PrintGCDetails -XX:PrintGCTimeStamps"
slaves指定worker节点
xx.xx.xx.2xx.xx.xx.3xx.xx.xx.4xx.xx.xx.5
运行spark-submit时默认的属性从spark-defaults.conf文件读取
spark-defaults.conf
spark.master=spark://hadoop-spark.dargon.org:7077
启动集群
start-master.shstart-salves.sh
spark-shell命令其实也是执行spark-submit命令
spark-submit --help
deploy-mode针对driver program(SparkContext)的client(本地)、cluster(集群)
默认是client的,SparkContext运行在本地,如果改成cluster则SparkContext运行在集群上
hadoop on yarn的部署模式就是cluster,SparkContext运行在Application Master
spark-shell quick-start链接
http://spark.apache.org/docs/latest/quick-start.html
运行
集群
命令
支持
就是
属性
文件
模式
节点
链接
配置
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
阿克苏网络安全服务
如何使用中国国史数据库
软件开发的二本理科大学排名
软件开发考研难吗
计算机数据库学习
历史辞典数据库下载
用友修改数据库
学生网络安全征文500字
计算机网络技术专业电脑拯救者
青山联想服务器供应商
计算机三级网络技术模考软件
电脑服务器可以接几台电脑
全国人口各省普查数据库
c 软件开发工程师入职
苹果服务器被黑
软件开发和编程那种好
为什么要进行网络安全防护
云租户内数据库
系统数据库有哪些数据库
三级数据库技术考试真题
控制管理服务器品牌
阿里云服务器 虚拟的吧
用友修改数据库
计算机三级网络技术模考软件
2020全球网络技术大会
pd生成数据库文件
科技互联网专家
业务部门关于网络安全的要求
计算机网络技术综合实训教程
一般网络安全设置设什么