千家信息网

如何以本地和伪分布式模式安装Hadoop

发表于:2024-11-29 作者:千家信息网编辑
千家信息网最后更新 2024年11月29日,这篇文章主要为大家展示了"如何以本地和伪分布式模式安装Hadoop",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"如何以本地和伪分布式模式安装Hadoop"
千家信息网最后更新 2024年11月29日如何以本地和伪分布式模式安装Hadoop

这篇文章主要为大家展示了"如何以本地和伪分布式模式安装Hadoop",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"如何以本地和伪分布式模式安装Hadoop"这篇文章吧。

一、预备知识

a) 支持平台

l GNU/Linux的开发平台和生产平台都支持。

l Windows也支持(不推荐,这篇文章也不讲)。

b) 必须的软件

i. hadoop是java开发的,所以必须安装java环境。

ii. 需要启动sshd服务,hadoop要通过ssh管理远程守护进程。

c) 安装软件

如果你的集群没有安装上面所说的软件,你首先需要安装它们。

i. 安装java。

ii. 安装ssh。

二、下载

下载hadoop2.4版本。

三、准备启动hadoop

解压下载的hadoop压缩包。编辑文件etc/hadoop/hadoop-env.sh。添加或定义下面两个参数:

#设置java安装目录export JAVA_HOME=/usr/java/jdk_***#设置你的hadoop安装目录export HADOOP_PREFIX=/usr/local/hadoop

使用下面的命令进行验证:

bin/hadoop

如果设置成功会显示hadoop命令的使用文档。

现在你能够使用下面三种方式安装你的hadoop集群了。

l 本地模式

l 伪分布模式

l 分布模式

四、本地模式

Hadoop默认配置就是本地模式,在一个java进程中允许hadoop。这中模式常用来进行调试。

用下面的方式进行验证一下:

mkdir inputcp etc/hadoop/*.xml inputbin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.0.jar grep input output 'dfs[a-z.]+'

如果output中有结果就对了。

cat output/*

五、伪分布模式

Hadoop也可以在一个单节点上一以伪分布的方式运行。Hadoop的每个守护进程分别以不同的java进程运行。

a) 配置

etc/hadoop/core-site.xml:

            fs.defaultFS        hdfs://localhost:9000    

etc/hadoop/hdfs-site.xml:

            dfs.replication        1    

b) Ssh免密码登录

l Ssh免密码登录

c) 启动

下面的例子是在本地运行mapreduce程序,如果你想在yarn上运行mapreduce,请看yarn单节点安装。

i. 格式化文件系统。

bin/hdfs namenode -format

ii. 启动namenode守护进程和datanode守护进程:

sbin/start-dfs.sh

Hadoop守护进程日志输出目录通过$HADOOP_LOG_DIR指定(默认为$HADOOP_HOME/logs)

iii. 通过浏览器浏览namenode:

http://localhost:50070/

iv. 在hdfs上创建文件夹,用来执行mapreduce程序。

bin/hdfs dfs -mkdir /userbin/hdfs dfs -mkdir /user/

v. 复制文件到hdfs上:

bin/hdfs dfs -put etc/hadoop input

vi. 运行示例程序

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.0.jar grep input output 'dfs[a-z.]+'

vii. 检查输出文件

bin/hdfs dfs -cat output/*

viii. 关闭hdfs守护进程。

sbin/stop-dfs.sh

六、Yarn单点安装

通过设置一些参数,并运行ResourceManagers守护进程和NodeManager守护进程。我们也可以在yarn上以伪分布模式运行mapreducer任务。

a) 配置

etc/hadoop/mapred-side.xml

            mapreduce.framework.name        yarn    

etc/hadoop/yarn-site.xml

            yarn.nodemanager.aux-services        mapreduce_shuffle    

b) 启动ResourceManager守护进程和NodeManager 守护进程。

sbin/start-yarn.sh

c) 通过浏览器查看ResourceManager:

http://localhost:8088/

d) 运行mapreduce任务。

e) 运行完任务的时候,关闭守护进程

sbin/stop-yarn.sh

以上是"如何以本地和伪分布式模式安装Hadoop"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!

进程 模式 运行 文件 篇文章 分布式 任务 内容 平台 方式 目录 程序 软件 面的 i. 支持 浏览 配置 参数 命令 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 瑞幸咖啡服务器崩溃视频 软件开发工程师班 美国vps云服务器 多ip 软件开发学出来的好处 松江区常见软件开发加工厂 网络安全法二十一 数据库设计哪个阶段属于物理模式 软件开发过程方法 中宏产业数据库 卫生局能调阅医院的数据库吗 怎么连接云数据库 服务器登录用户数限制 保障数据库信息的安全性 中职院校网络安全教育ppt 计算机网络技术电子版 语音序列数据库 网络安全文明同行的看法 长沙举办网络安全智能制造大会 数据库查看所有的存储过程 switch土豆服务器慢 机架式服务器热仿真用哪个软件好 软件开发要点有哪些 有网络为什么无法连接到服务器 消防大队开展办公网络安全检查 明星行程软件开发 数据库原理及应用基础语言 国家网络安全局马朝显 四川企业软件开发如何收费 公司删除数据库后网站出现问题 分布式数据库与集中式开销
0