hive如何开启lzo压缩
发表于:2025-02-06 作者:千家信息网编辑
千家信息网最后更新 2025年02月06日,这篇文章给大家分享的是有关hive如何开启lzo压缩的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。hive开启lzo压缩1.Hadoop安装lzo依赖并进行配置涉及到jar
千家信息网最后更新 2025年02月06日hive如何开启lzo压缩
这篇文章给大家分享的是有关hive如何开启lzo压缩的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
hive开启lzo压缩
1.Hadoop安装lzo依赖并进行配置
涉及到jar包的编译以及core-site文件的配置
可以在mapred-site文件中,设置是在map还是reduce端开启压缩。在这里只是设置mapreduce的压缩。hadoop和hive是可以单独设置的。
2. 在hive中开启压缩以及设置压缩方式
在hive客户端中设置参数,开始hive的map或者reduce端的压缩。
set mapred.output.compress=true;set hive.exec.compress.output=true;# 必须是LzopCodec才支持切片set mapred.output.compression.codec=com.hadoop.compression.lzo.LzopCodec;
3. 创建表指定InputFormat以及OutFormat
CREATE EXTERNAL TABLE ods_log (`line` string) PARTITIONED BY (`dt` string) STORED AS INPUTFORMAT 'com.hadoop.mapred.DeprecatedLzoTextInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'LOCATION '/warehouse/gmall/ods/ods_log';
INPUTFORMAT 是指从表中读取时,支持从lzo文件中读取
OUTPUTFORMAT是指写入数据到文件,输入数据的格式
4. 上传数据到表中
load data inpath '/origin_data/gmall/log/topic_log/2020-06-14' into table ods_log partition(dt='2020-06-14');
将数据导入到hive中后,数据会保存在lzo文件中
5. 为lzo文件创建索引
hadoop jar /opt/module/hadoop-3.1.3/share/hadoop/common/hadoop-lzo-0.4.20.jar com.hadoop.compression.lzo.DistributedLzoIndexer /warehouse/gmall/ods/ods_log/dt=2020-06-14
感谢各位的阅读!关于"hive如何开启lzo压缩"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
文件
数据
内容
更多
篇文章
支持
配置
不错
实用
参数
只是
客户
客户端
文章
方式
是在
格式
看吧
知识
端的
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库规模分类
外卖网络安全问题的措施
世界技能大赛网络安全项目样题
小学生网络安全防沉迷
数据库写入语句
鸣思网络技术有限公司
交易猫平台的服务器怎么填
网络安全扫码领红包
东营库存软件开发
徐州网络安全教育平台
金仓安全数据库股票
数据库系统函数的功能
软件开发时打的代码是什么
杭州英海互联网科技公司
网络安全算行政职能吗
筑志软件开发有限公司
sql新增数据库语句
蓟州区数据网络技术售后服务
现代服务器是什么
测试ntp服务器
网络安全人员职责有哪些
潼南租房网络安全
计算机软件开发创业规划
遵守网络安全规定意见
易语言插住数据库数据
迅雷5.8无法连接到服务器
wpf软件开发工程
无锡led大屏服务器
广州公共网络安全宣传周
网络安全大学生演讲河北省