千家信息网

hadoop-2.6.2 lzo的配置过程

发表于:2024-11-14 作者:千家信息网编辑
千家信息网最后更新 2024年11月14日,本篇内容介绍了"hadoop-2.6.2 lzo的配置过程"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所
千家信息网最后更新 2024年11月14日hadoop-2.6.2 lzo的配置过程

本篇内容介绍了"hadoop-2.6.2 lzo的配置过程"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

Hadoop集群说明

集群有三台主机,主机名分别是:bi10,bi12,bi13。我们的操作都在bi10上面进行。

安装依赖包

安装lzo需要一些依赖包,如果你已经安装过了,那么可以跳过这一步。首先你需要切换到root用户下

yum install gcc gcc-c++ kernel-develyum install git

除了以上两个之外,你还需要配置maven环境,下载之后直接解压并配置环境变量即可使用

wget http://apache.fayea.com/maven/maven-3/3.3.9/binaries/apache-maven-3.3.9-bin.tar.gztar -xzf apache-maven-3.3.9-bin.tar.gz

配置maven环境变量,maven软件包放置到/home/hadoop/work/apache-maven-3.3.9

[hadoop@bi10 hadoop-2.6.2]$ vim ~/.bash_profile#init maven environmentexport MAVEN_HOME=/home/hadoop/work/apache-maven-3.3.9export PATH=$PATH:$MAVEN_HOME/bin
LZO安装

下载lzo安装包

[hadoop@bi10 apps]$ wget http://www.oberhumer.com/opensource/lzo/download/lzo-2.09.tar.gz

解压并编译安装lzo到:/usr/local/hadoop/lzo/,安装时切换到root用户下

[hadoop@bi10 apps]$ tar -xzf lzo-2.09.tar.gz [hadoop@bi10 apps]$ cd lzo-2.09[hadoop@bi10 apps]$ su root[root@bi10 lzo-2.09]$ ./configure -enable-shared -prefix=/usr/local/hadoop/lzo/ [root@bi10 lzo-2.09]$ make && make test && make install

查看安装目录

[hadoop@bi10 lzo-2.09]$ ls /usr/local/hadoop/lzo/include  lib  share
HADOOP-LZO安装

下载hadoop-lzo

git clone https://github.com/twitter/hadoop-lzo.git

设置环境变量,并使用maven编译

[hadoop@bi10 hadoop-lzo]$ export CFLAGS=-m64[hadoop@bi10 hadoop-lzo]$ export CXXFLAGS=-m64[hadoop@bi10 hadoop-lzo]$ export C_INCLUDE_PATH=/usr/local/hadoop/lzo/include[hadoop@bi10 hadoop-lzo]$ export LIBRARY_PATH=/usr/local/hadoop/lzo/lib[hadoop@bi10 hadoop-lzo]$ mvn clean package -Dmaven.test.skip=true

将编译好的文件拷贝到hadoop的安装目录

[hadoop@bi10 hadoop-lzo]$ tar -cBf - -C target/native/Linux-amd64-64/lib . | tar -xBvf - -C $HADOOP_HOME/lib/native/[hadoop@bi10 hadoop-lzo]$ cp target/hadoop-lzo-0.4.20-SNAPSHOT.jar $HADOOP_HOME/share/hadoop/common/[hadoop@bi10 hadoop-lzo]$ scp target/hadoop-lzo-0.4.20-SNAPSHOT.jar bi12:$HADOOP_HOME/share/hadoop/common/[hadoop@bi10 hadoop-lzo]$ scp target/hadoop-lzo-0.4.20-SNAPSHOT.jar bi13:$HADOOP_HOME/share/hadoop/common/

将编译好的文件分别复制到集群其他机器对应的目录,其中native目录需要先打包再拷贝到集群的其他机器上,然后解压。

tar -czf hadoop-native.tar.gz /$HADOOP_HOME/lib/native/scp hadoop-native.tar.gz bi12:/$HADOOP_HOME/libscp hadoop-native.tar.gz bi13:/$HADOOP_HOME/lib
修改hadoop配置文件

修改hadoop-env.sh,增加一条

# The lzo libraryexport LD_LIBRARY_PATH=/usr/local/hadoop/lzo/lib

修改core-site.xml

      io.compression.codecs    org.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.DefaultCodec,com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec,org.apache.hadoop.io.compress.BZip2Codec        io.compression.codec.lzo.class    com.hadoop.compression.lzo.LzoCodec  

修改mapred-site.xml

        mapred.compress.map.output    true        mapred.map.output.compression.codec    com.hadoop.compression.lzo.LzoCodec        mapred.child.env    LD_LIBRARY_PATH=/usr/local/hadoop/lzo/lib  

拷贝三个配置文件到集群其他机器

scp etc/hadoop/hadoop-env.sh bi12:/home/hadoop/work/hadoop-2.6.2/etc/hadoop/scp etc/hadoop/hadoop-env.sh bi13:/home/hadoop/work/hadoop-2.6.2/etc/hadoop/scp etc/hadoop/core-site.xml bi12:/home/hadoop/work/hadoop-2.6.2/etc/hadoop/scp etc/hadoop/core-site.xml bi13:/home/hadoop/work/hadoop-2.6.2/etc/hadoop/scp etc/hadoop/mapred-site.xml bi12:/home/hadoop/work/hadoop-2.6.2/etc/hadoop/scp etc/hadoop/mapred-site.xml bi13:/home/hadoop/work/hadoop-2.6.2/etc/hadoop/
测试hadoop lzo

安装lzop,需要切换到root用户下

yum install lzop

进入hadoop安装目录然后对LICENSE.txt执行lzo压缩,会生成一个lzo压缩文件LICENSE.txt.lzo

lzop LICENSE.txt

上传压缩文件到hdfs

[hadoop@bi10 hadoop-2.6.2]$ hdfs dfs -mkdir /user/hadoop/wordcount/lzoinput[hadoop@bi10 hadoop-2.6.2]$ hdfs dfs -put LICENSE.txt.lzo /user/hadoop/wordcount/lzoinput[hadoop@bi10 hadoop-2.6.2]$ hdfs dfs -ls /user/hadoop/wordcount/lzoinputFound 1 items-rw-r--r--   2 hadoop supergroup       7773 2016-02-16 20:59 /user/hadoop/wordcount/lzoinput/LICENSE.txt.lzo

对lzo压缩文件建立索引

hadoop jar ./share/hadoop/common/hadoop-lzo-0.4.20-SNAPSHOT.jar com.hadoop.compression.lzo.DistributedLzoIndexer /user/hadoop/wordcount/lzoinput/[hadoop@bi10 hadoop-2.6.2]$ hdfs dfs -ls /user/hadoop/wordcount/lzoinput/Found 2 items-rw-r--r--   2 hadoop supergroup       7773 2016-02-16 20:59 /user/hadoop/wordcount/lzoinput/LICENSE.txt.lzo-rw-r--r--   2 hadoop supergroup          8 2016-02-16 21:02 /user/hadoop/wordcount/lzoinput/LICENSE.txt.lzo.index

对lzo压缩文件执行wordcount

hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.2.jar wordcount /user/hadoop/wordcount/lzoinput/ /user/hadoop/wordcount/output2

"hadoop-2.6.2 lzo的配置过程"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!

文件 配置 目录 集群 环境 编译 过程 变量 拷贝 机器 用户 切换 主机 内容 更多 知识 实用 学有所成 接下来 三个 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 育碧服务器怎么只能下载老版本 用sql语句编写数据库表 网络安全培训出来好找工作吗 银行业务与新网络技术 sql数据库图片怎么读取 中小学生网络安全倡议书 长沙软件开发人员薪资 云计算服务器产业龙头 软件开发工作年纪大了 卫星模拟软件开发 网络安全反恐怖宣传教育 怎么管理别人的服务器 谈谈网络安全的重要性作文 各省 乡村 旅游 数据库 数据库索引的关键词 服务器组策略管理工具 网络安全预算项目的 互联网加是科技创新吗 网络安全工程师属于前端 广东爱上梦想网络技术有限公司 微信数据库安装失败 碧蓝航线服务器经常断开连接 组态王的报表里无数据库 微服务逻辑写在应用还是数据库 上海物流软件开发一般要多少钱 shopnc 连接数据库 gps网络技术维护怎么做 服务器BMC口与管理口 上饶方正服务器项目 贵州服务器散热风扇价格
0