导航：首页 > 互联网科技 >

Hive分区表常用语法有哪些

发表于：2025-02-01 作者：千家信息网编辑

千家信息网最后更新 2025年02月01日，这篇文章给大家分享的是有关Hive分区表常用语法有哪些的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。前言：如果对分区表了如指掌，那么非分区表的语法就简单多了，只需将 PAR

千家信息网最后更新 2025年02月01日Hive分区表常用语法有哪些

这篇文章给大家分享的是有关Hive分区表常用语法有哪些的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。

前言：

如果对分区表了如指掌，那么非分区表的语法就简单多了，只需将 PARTITION 相关字段去掉就可以了。

1. 创建hive分区表

//不指定LOCATION

CREATE EXTERNAL TABLE

IF NOT EXISTS hive_partition_01(

ROWKEY STRING,

YEAR INT,

MONTH INT,

DAY INT,

HOUR INT,

MINUTE INT)

PARTITIONED BY (AGE INT)

ROW FORMAT DELIMITED FIELDS

TERMINATED BY ',' STORED AS TEXTFILE;

注：不指定LOCATION，默认为/user/hive/warehouse/*.db/table_name

//指定LOCATION

CREATE EXTERNAL TABLE

IF NOT EXISTS hive_partition_02(

ROWKEY STRING,

YEAR INT,

MONTH INT,

DAY INT,

HOUR INT,

MINUTE INT)

PARTITIONED BY (AGE INT)

ROW FORMAT DELIMITED FIELDS

TERMINATED BY ','

STORED AS TEXTFILE

LOCATION 'hdfs://master:8020/user/hive/warehouse/hive_hbase.db/hive_partition_01' ;

注：创建指定数据路径的外部分区表要添加分区后才能查到数据，可在hive命令行执行修复命令： msck repair table tablename。

2. 创建分区

ALTER TABLE hive_partition_01 ADD PARTITION(AGE= 1998);

注：创建分区后 HDFS 增加目录 age=1998

3. 删除分区

ALTER TABLE hive_partition_01 DROP IF EXISTS PARTITION(age =1998);

注：外部表删除分区后HDFS分区数据不会被删除

4. 向HIVE表加载数据（四种方式）

4.1 从HDFS上导入数据到Hive表

//加载某个目录下所有数据，只适合非分区表

LOAD DATA INPATH '/emp.txt' OVERWRITE INTO TABLE hive_01;

//INTO 追加写

LOAD DATA INPATH '/emp.txt' INTO TABLE hive_partition_01 PARTITION(AGE=1998);

注：从HDFS加载数据，加载后emp.txt文件消失，属于copy操作

//OVERWRITE INTO 覆盖写

LOAD DATA INPATH '/emp.txt' OVERWRITE INTO TABLE hive_partition_01 PARTITION(AGE=1998);

LOAD DATA INPATH '/emp.txt' [OVERWRITE] INTO TABLE hive_partition_01 PARTITION(AGE=1999);

注：执行该语句若分区不存在会自动创建

4.2 从本地文件系统中导入数据到Hive表

// INTO 追加写

LOAD DATA LOCAL INPATH '/home/emp.txt' INTO TABLE hive_partition_01 PARTITION(AGE=1999);

// OVERWRITE INTO 覆盖写

LOAD DATA LOCAL INPATH '/home/emp.txt' OVERWRITE INTO TABLE hive_partition_01 PARTITION(AGE=1999);

4.3 从别的表中查询数据并导入到Hive表中

// INTO 追加写

insert INTO table hive_partition_01 partition (AGE=1999) select rowkey, year, month ,day , hour , minute from hive_partition_02;

注：hive_partition_02 表 select 的字段必须与 hive_partition_01 表对应，此条语句会执行MapReduce任务

//OVERWRITE 覆盖写

insert OVERWRITE table hive_partition_01 partition (AGE=1999) select rowkey, year, month ,day , hour , minute from hive_partition_02;

注：HDFS分区目录下的文件都会被覆盖写

4.4 创建表时从别的表查询数据到所创建的表

create table hive_partition_03 as select rowkey, year, month from hive_partition_01;

注：此条语句会执行MapReduce任务,可select部分字段

4.5 支持多表插入

from hive_partition_01

> insert into table hive_partition_02

> partition(age=1998)

> select rowkey, year, month ,day , hour , minute

> insert into table hive_partition_03

> select rowkey, year, month;

注：向HDFS目录相同路径下上传相同文件，文件名会添加copy字样。如下：

/user/hive/warehouse/hive_hbase.db/hive_partition_01/age=1999/emp.txt

/user/hive/warehouse/hive_hbase.db/hive_partition_01/age=1999/emp_copy_1.txt

注：hive 字段不区分大小写

感谢各位的阅读！关于"Hive分区表常用语法有哪些"这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，让大家可以学到更多知识，如果觉得文章不错，可以把它分享出去让更多的人看到吧！

很赞哦！

数据分区表文件字段目录语法语句常用相同任务内容命令更多篇文章路径查询不错实用了如指掌前言数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全上海进口网络技术材料叫号系统的网络技术运用了通信网络技术的行业北京网络安全大会金句网络安全维护技术咨询成果计算机和软件开发有限公司服务器修改密码在哪里网络安全保障技术关键要素互联网科技的收入网络安全论坛及网站品牌软件开发售后保障北京软件开发区网络安全教育800字检讨电脑服务器进程怎么查看 catia用什么软件开发的云赞软件开发怎么样西藏智慧城管软件开发哪儿好国家网络安全战略部署软件开发干系人列表我的世界网易版服务器排行 intel服务器配置一对一营销与数据库营销有何联系施耐德低压数据库外国科技互联网标志中国2019年网络安全事件以太网网络服务器安装山西pdu服务器电源生产商深圳市雅迪捷网络技术公司北京网络安全数据2019 数据库表中表

千家信息网

千家信息网

Hive分区表常用语法有哪些

python如何实现输入2个整形数字并输出最大值

Linux中如何使用kmalloc内核内存分配函数

相关文章