千家信息网

用Partition函数怎么实现Hive动态分区

发表于:2025-01-24 作者:千家信息网编辑
千家信息网最后更新 2025年01月24日,这篇文章主要讲解了"用Partition函数怎么实现Hive动态分区",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"用Partition函数怎么实现Hi
千家信息网最后更新 2025年01月24日用Partition函数怎么实现Hive动态分区

这篇文章主要讲解了"用Partition函数怎么实现Hive动态分区",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"用Partition函数怎么实现Hive动态分区"吧!

一、前段时间因为导表需求(从一张表中查找出数据,按日期分区overwrite 到指定分区表中),在Hive里面研究了一下自动分区。

步骤:

1、建好所需分区表

2、设置分区参数

set hive.exec.dynamic.partition=true;(可通过这个语句查看:set hive.exec.dynamic.partition;) set hive.exec.dynamic.partition.mode=nonstrict; SET hive.exec.max.dynamic.partitions=100000;(如果自动分区数大于这个参数,将会报错)SET hive.exec.max.dynamic.partitions.pernode=100000;

3、书写代码(特别注意:日期字段一定要放在末尾),例如:

INSERT OVERWRITE TABLE dw_stage.ds_info_msg partition(cal_dt)select id               ,...       ,pv       ,0  uv       ,cal_dtfrom   dw_stage.tiny_info_msg

二、如果要在partition字段用函数处理也可通过通过这种方式实现;例如:

set hive.exec.dynamic.partition=true;set hive.exec.dynamic.partition.mode=nostrick;INSERT OVERWRITE TABLE dw_stage.ds_info_msg partition(cal_dt)SELECT id           ,...       ,pv       ,date_sub('2014-03-23',7) cal_dtFROM   dw_stage.tiny_info_msg07;

感谢各位的阅读,以上就是"用Partition函数怎么实现Hive动态分区"的内容了,经过本文的学习后,相信大家对用Partition函数怎么实现Hive动态分区这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!

0