千家信息网

VMware虚拟机怎么搭建Hadoop2.7.1分布式集群

发表于:2024-12-05 作者:千家信息网编辑
千家信息网最后更新 2024年12月05日,本篇内容介绍了"VMware虚拟机怎么搭建Hadoop2.7.1分布式集群"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细
千家信息网最后更新 2024年12月05日VMware虚拟机怎么搭建Hadoop2.7.1分布式集群

本篇内容介绍了"VMware虚拟机怎么搭建Hadoop2.7.1分布式集群"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

【架构介绍】

【准备工作】

1. VMware:11.0.0 build-2305329 (下载:http://pan.baidu.com/s/1skq0oP3 )

2. CentOS:CentOS-6.7-x86_64-bin-DVD1.iso (下载:http://pan.baidu.com/s/1o7xYgGE )

或Ubuntu(以CentOS为例,一般生产环境用的是CentOS)

3. 本地机器配置:

5. JDK

(1)版本1.7.9

(2)下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html

【运行MapReduce】

1. 准备数据

在本地目录创建wordcount.txt文件,并随便输入写英文,如:

aa bb cc dd

2. 上传文件

hadoop fs -put ./wordcount.txt /workspace

3. 执行命令

hadoop jar /opt/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /workspace/wordcount.txt /outpath

4. UI查看任务

http://192.168.159.130:8088/cluster/app/RUNNING

5. 查看结果

hadoop fs -cat /outpath/*

aa 1

bb 1

cc 1

dd 1

【遇到的问题】

1. 拒绝连接

问题描述:在启动和运行任务时报连接拒绝等问题。

解决方案:检查防火墙是否已关闭。

2. resourcemanager起动失败

问题描述:启动集群时,其他进程都正常,只有resourcemanager启动失败,或只启动短暂几秒钟后失败。

解决方案:通过hadoop02机器(即resourcemanager所在机器)执行sh start-all.sh启动集群。

3. 执行start-all.sh时出现异常

问题描述:启动集群时,报错:Error:Cannot find configuration directory:/etc/hadoop

解决方案:在 hadoop-env.sh 配置文件中将 export HADOOP_CONF_DIR=${HADOOP_CONF_DIR:-"etc/hadoop"}替换成 export HADOOP_CONF_DIR=/usr/hadoop-2.6.0/etc/hadoop修改完后运行 source hadoop-env.sh 让其立即生效!

4. 运行Wordcount报错

问题描述:跑自带WordCount时候报mapreduce_shuffle does not exist。

解决方案:在yarn-site.xml中加如下配置

yarn.nodemanager.aux-services

mapreduce_shuffle

yarn.nodemanager.aux-services.mapreduce.shuffle.class

org.apache.hadoop.mapred.ShuffleHandler

5. 运行Wordcount一段时间后报错

问题描述:hadoop org.apache.hadoop.yarn.exceptions.YarnException: Unauthorized request to start container

解决方案:百度说是集群的时间不同步,解决方法参考:
http://www.chinadmd.com/file/tixiarput3eweszaceuzpttc_1.html
http://www.aboutyun.com/thread-11397-1-2.html
http://www.linuxde.net/2013/02/12232.html

"VMware虚拟机怎么搭建Hadoop2.7.1分布式集群"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!

0