千家信息网

docker中spark+scala安装配置

发表于:2025-02-01 作者:千家信息网编辑
千家信息网最后更新 2025年02月01日,一、scala安装首先下载scala压缩包wget https://downloads.lightbend.com/scala/2.11.7/scala-2.11.7.tgz解压tar -zxvf s
千家信息网最后更新 2025年02月01日docker中spark+scala安装配置

一、scala安装
首先下载scala压缩包

wget https://downloads.lightbend.com/scala/2.11.7/scala-2.11.7.tgz

解压

tar -zxvf scala-2.11.7.tgz

移动目录

mv scala-2.11.7 /usr/local/

改名

cd /usr/local/
mv scala-2.11.7 scala

配置环境变量

vim /etc/profile
export SCALA_HOME=/usr/local/scala
export PATH=$PATH:$SCALA_HOME/bin

环境变量生效

source /etc/profile

查看scala版本

scala -version

分发scala到其他主机

scp -r /usr/local/scala/ root@Master:/usr/local/
scp -r /usr/local/scala/ root@Slave2:/usr/local/

二、spark安装
复制spark压缩包 到容器中

docker cp /root/spark-2.1.2-bin-hadoop2.4.tgz b0c77:/

查看并解压


在profile中添加spark环境变量

生效环境变量

source /etc/profile

编辑spark-env.sh

vim /usr/local/spark/conf/spark-env.sh

  • JAVA_HOME:Java安装目录
  • SCALA_HOME:Scala安装目录
  • HADOOP_HOME:hadoop安装目录
  • HADOOP_CONF_DIR:hadoop集群的配置文件的目录
  • SPARK_MASTER_IP:spark集群的Master节点的ip地址
  • SPARK_WORKER_MEMORY:每个worker节点能够最大分配给exectors的内存大小
  • SPARK_WORKER_CORES:每个worker节点所占有的CPU核数目
  • SPARK_WORKER_INSTANCES:每台机器上开启的worker节点的数目
    修改slaves文件

cp slaves.template slaves

vi conf/slaves

scp -r /usr/local/spark/ Master:/usr/local

scp -r /usr/local/spark/ Slave2:/usr/local


同时其他两个节点也要修改 /etc/profile
启动spark

./sbin/start-all.sh


成功打开之后使用jps在Master、Slave1和Slave2节点上分别可以看到新开启的Master和Worker进程。



成功打开Spark集群之后可以进入Spark的WebUI界面,可以通过
SparkMaster_IP:8080
端口映射:

iptables -t nat -A DOCKER -p tcp --dport 8080 -j DNAT --to-destination 172.17.0.2:8080

此时我们可以通过映射到宿主机的端口访问,可见有两个正在运行的Worker节点。

打开Spark-shell
使用

spark-shell

推出spark-shell的命令是":quit"
因为shell在运行,我们也可以通过
SparkMaster_IP:4040(172.17.0.2:4040)

访问WebUI查看当前执行的任务。
先进行端口映射:

iptables -t nat -A DOCKER -p tcp --dport 4040 -j DNAT --to-destination 172.17.0.2:4040


节点 目录 变量 环境 可以通过 端口 集群 配置 成功 两个 数目 文件 运行 最大 主机 任务 内存 同时 命令 地址 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 关系模型就是关系数据库A对B错 网络技术的出现为现阶段电子商务 综合软件开发调试 企业网络安全工作调研报告 计算机网络技术应该考那个证 数据库数据刷新 瀚海网络技术能恢复朋友圈吗 浦东新区银联数据库服务商前景 oppo软件开发工程师 维护网络安全横幅 传奇手游怀旧服什么时候开服务器 校园实验楼网络安全设备配置 影院投影机连不上服务器 天津会计软件开发 烟台春牧网络技术有限公司 资讯类软件开发项目说明书 维护网络安全是重大 软件开发最难的面试题 江阴进口软件开发报价 浙江正规戴尔服务器云服务器 数据库管理数据插入 天心区软件开发大专学校 马云互联网科技有限公司 服务器ftp列表错误 网络安全博士信息系统安全研究 网络安全风险隐患应对措施 2016网络安全主题 彩票自动挂机手机软件开发 光域服务器 浙江正规戴尔服务器云服务器
0