千家信息网

hadoop中入门配置知识点有哪些

发表于:2025-02-08 作者:千家信息网编辑
千家信息网最后更新 2025年02月08日,这篇文章给大家分享的是有关hadoop中入门配置知识点有哪些的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。环境本人使用的是 XUbuntu14.04 64位,在虚拟机下搭建
千家信息网最后更新 2025年02月08日hadoop中入门配置知识点有哪些

这篇文章给大家分享的是有关hadoop中入门配置知识点有哪些的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

环境

本人使用的是 XUbuntu14.04 64位,在虚拟机下搭建的

  • 安装 JDK,配置环境变量

配置 classpath,修改所有用户的环境变量

sudo vim /etc/profile#在文件最后添加 #set java environmentexport JAVA_HOME={path}export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jarexport PATH=$PATH:$JAVA_HOME/bin source/etc/profile  ##使环境变量生效
  • 配置SSH无密码吗登陆

在用户根目录创建隐藏文件夹 .ssh (没有的需要创建)

mkdir .ssh
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

验证下 ssh ,

 shh localhost
  • 安装hadoop (我用的是2.7)

    • 解压文件夹

sudo tar -zxvf hadoop-2.7.1.tar.gz -C /usr/local/hadoop    # 指定目录,可根据自己的喜好选择放在哪
    • 创建 hadooop 工作所需要的文件目录

    • 设置环境变量 (进入$HADOOP_HOME/etc/hadoop)

    sudo vim /etc/profileexport HADOOP_HOME={path}#path 后面继续跟export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

    • 配置文件

      • 配置 hadoop-env.sh

    export JAVA_HOME=${JAVA_HOME}          # JAVA_HOME JDK 路径

      • 配置 core-site.xml (关于Hadoop配置项的一点说明虽然只需要配置fs.defaultFS 和 dfs.replication 就可以运行(官方教程如此),不过若没有配置 hadoop.tmp.dir 参数,则默认使用的临时目录为 /tmp/hadoo-hadoop,而这个目录在重启时有可能被系统清理掉,导致必须重新执行 format 才行。所以我们进行了设置,同时也指定 dfs.namenode.name.dir 和 dfs.datanode.data.dir,否则在接下来的步骤中可能会出错。shay为主机名,如果不知道自己的主机名可以 cat 一下 /etc/hostname)

                hadoop.tmp.dir        file:/usr/local/hadoop/tmp                fs.defaultFS        hdfs://shay:9000    

      • 配置hdfs-site.xml

                dfs.replication        1                dfs.namenode.name.dir        file:/usr/local/hadoop/tmp/dfs/name                dfs.datanode.data.dir        file:/usr/local/hadoop/tmp/dfs/data        

      • 配置 mapred-site.xml

                        mapreduce.framework.name         yarn    

      • 配置 yarn-site.xml

                        yarn.nodemanager.aux-services                mapreduce_shuffle                yarn.resourcemanager.hostname        shay    

      • 配置 yarn-env.sh

    export JAVA_HOME=${JAVA_HOME}

    • Hadoop 启动

      • 执行 namenode 格式化

    hdfs namenode -format

      • 开启守护进程

    start-dfs.sh        # NameNode 和 DataNode 守护进程start-yarn.sh       # ResourceManager 和 NodeManager 守护进程
      • 验证

    jps

感谢各位的阅读!关于"hadoop中入门配置知识点有哪些"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

配置 文件 环境 变量 目录 知识 主机 进程 知识点 内容 文件夹 更多 用户 篇文章 验证 不错 实用 接下来 参数 同时 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 计算机类网络技术专业 公安网络安全相关论述考试题 闵行区管理软件开发多少钱 酷狗音乐什么软件开发的 苹果恢复备份无法连接服务器 软件开发的项目总结ppt 自组织网络技术公司 数据库应用系统技术书 软件开发工程师需要考什么学校 lant数据库 汽车电子软件开发工程师岗位职责 接入层网络安全防护 国企好还是软件开发好 数据库insert语句功能 ps5安全模式重建数据库 信息与网络技术与网络语言 上地街道工商银行软件开发中心 福建师大网络安全研究生 联想7x06服务器电源 汕头考试软件开发联系方式 为什么要学习网络安全技术 广东销售软件开发价格 成都市企米网络技术有限公司 科创板同花顺数据库 数据库系统体系结构有哪几种 数据库超出嵌套层数是 贵州为什么有那么多企业数据库 北京戴尔服务器虚拟化多少钱 筑牢保密防线 网络安全 高一预习软件开发
0