导航：首页 > 服务器 >

hadoop2.7+Spark1.4环境如何搭建

发表于：2025-01-26 作者：千家信息网编辑

千家信息网最后更新 2025年01月26日，这篇文章主要为大家展示了"hadoop2.7+Spark1.4环境如何搭建"，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下"hadoop2.7+Spark1.

千家信息网最后更新 2025年01月26日hadoop2.7+Spark1.4环境如何搭建

这篇文章主要为大家展示了"hadoop2.7+Spark1.4环境如何搭建"，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下"hadoop2.7+Spark1.4环境如何搭建"这篇文章吧。

一、hadoop伪分布式搭建

其实官网有比较详实的说明，英语好的可以直接看官网，地址

1、安装JDK1.7

这个省略，官网显示1.6可以，但是我用openjdk1.6出了异常，JDK1.6没试，直接用了JDK1.7

配置好环境变量

vi /etc/profile

export JAVA_HOME=/usr/local/jdk1.7.0_79export CLASSPATH=.:$JAVE_HOME/lib.tools.jarexport PATH=$PATH:$JAVA_HOME/bin

添加完后执行命令使配置生效

source /etc/profile

2、安装ssh、rsync,（以ubuntu为例）

  $ sudo apt-get install ssh  $ sudo apt-get install rsync

3、下载hadoop编译包，镜像地址（国内镜像竟然比US的还慢，不能忍，注意2.7的编译包为64位）

查是32还是64位的办法

cd hadoop-2.7.0/lib/nativefile libhadoop.so.1.0.0

hadoop-2.7.0/lib/native/libhadoop.so.1.0.0: ELF 64-bit LSB shared object, AMD x86-64, version 1 (SYSV), not stripped

4、配置环境变量

hadoop配置文件指定java路径

etc/hadoop/hadoop-env.sh

export JAVA_HOME=/usr/local/jdk1.7.0_79

系统环境变量

export HADOOP_HOME=/usr/local/hadoop-2.7.0export PATH=$PATH:$HADOOP_HOME/binexport HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/nativeexport HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"

后两条不加会出现

You have loaded library /usr/hadoop/hadoop-2.7.0/lib/native/libhadoop.so.1.0.0 which might have disabled stack guard. The VM will try to fix the stack guard now.

It's highly recommended that you fix the library with 'execstack -c ', or link it with '-z noexecstack'.

添加完后执行命令使配置生效

source /etc/profile

执行命令查看是否成功

hadoop version

5、修改hadoop配置文件

etc/hadoop/core-site.xml:

            fs.defaultFS        hdfs://localhost:9000

etc/hadoop/hdfs-site.xml:

            dfs.replication        1

6、设置hadoop ssh无密码访问

  $ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa  $ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys  $ export HADOOP\_PREFIX=/usr/local/hadoop-2.7.0

7、格式化节点和启动hadoop

$ bin/hdfs namenode -format$ sbin/start-dfs.sh

打开浏览器 http://localhost:50070/看是否成功

hdfs配置：username最好和当前用户名相同，不然会可能出现权限问题

  $ bin/hdfs dfs -mkdir /user  $ bin/hdfs dfs -mkdir /user/

8、yarn配置

etc/hadoop/mapred-site.xml:

            mapreduce.framework.name        yarn

etc/hadoop/yarn-site.xml:

            yarn.nodemanager.aux-services        mapreduce_shuffle

启动yarn

$ sbin/start-yarn.sh

http://localhost:8088/查看是否成功

至此hadoop单节点伪分布式安装配置完成

二、spark安装配置

spark的安装相对就要简单多了

1、首先下载，地址

因为我之前已经有hadoop了所以选择第二个下载

2、下载解压后进入目录

cd confcp spark-env.sh.template spark-env.shcp spark-defaults.conf.template spark-defaults.confvi conf/spark-env.sh

最后添加

export HADOOP_HOME=/usr/local/hadoop-2.7.0export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoopexport SPARK_DIST_CLASSPATH=$(hadoop classpath)

最后一个需要hadoop添加了环境变量才行。

官网配置中没有前两个配置，我运行例子时总报错，找不到hdfs jar 包。

3、回到解压目录运行示例

./bin/run-example SparkPi 10

成功则到此配置完成

以上是"hadoop2.7+Spark1.4环境如何搭建"这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注行业资讯频道！

很赞哦！

配置环境成功变量内容命令地址篇文章分布式文件目录节点镜像学习帮助编译运行相同详实两个数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全 JS 连接数据库DB2 河南全城网络技术网络技术原理及应用实训 7u服务器我的枪械服务器全国网络安全竞赛题汕头通讯软件开发价目表 h3cse网络安全工程师龙族幻想现在的服务器是什么软件开发测试要怎么做服务器安全提示助手最新版软件开发专业全国排名战地无服务器国旗全球服务器租用公网ip访问服务器网络安全模式怎么远程桌面大屏对接软件开发新乡闲跃网络技术有限公司方舟非官方服务器简幻欢服务器如何修改公告早期软件开发的历史国外校园网络安全状况蓬莱管理系统软件开发哪家靠谱 win10登陆服务器软件开发工程师中级难吗学网络技术应该从哪方面开始软件开发又称大型企事业网络安全防护体系网络技术单招山东软件开发大裁员

千家信息网