千家信息网

Hive高阶聚合函数用法示例

发表于:2025-02-05 作者:千家信息网编辑
千家信息网最后更新 2025年02月05日,这篇文章主要为大家展示了"Hive高阶聚合函数用法示例",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"Hive高阶聚合函数用法示例"这篇文章吧。如果需要多维
千家信息网最后更新 2025年02月05日Hive高阶聚合函数用法示例

这篇文章主要为大家展示了"Hive高阶聚合函数用法示例",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"Hive高阶聚合函数用法示例"这篇文章吧。

如果需要多维度做一些指标统计,数据量比较大的话,我们一般会选择olap引擎,比如kylin等,但是如果数据量不是很大的话,hive也是可以实现的。

create table wedw_tmp.hive_function_test_df

(

province_name string comment '省份名称'

,city_name string comment '城市名称'

,area_name string comment '地区名称'

,people_cnt int comment '人口数量'

,amt decimal(16,2) comment 'GDP'

)

row format delimited fields terminated by ','

广东,广州,白云区,100,30

广东,广州,番禺区,120,45

广东,深圳,福田区,200,67

广东,深圳,南山区,290,100

浙江,杭州,萧山区,80,20

浙江,杭州,滨江区,120,50

浙江,宁波,江东区,80,23

浙江,宁波,江北区,45,5

select * from wedw_tmp.hive_function_test_df;

一 with cube

select

province_name

,city_name

,area_name

,sum(people_cnt) as all_people_cnt

from

wedw_tmp.hive_function_test_df

group by

province_name

,city_name

,area_name

with cube

;

二 grouping sets

select

province_name

,city_name

,area_name

,sum(people_cnt) as all_people_cnt

from

wedw_tmp.hive_function_test_df

group by

province_name

,city_name

,area_name

grouping sets((),(province_name),(province_name,city_name))

;

三 with rollup

select

province_name

,city_name

,area_name

,sum(people_cnt) as all_people_cnt

from

wedw_tmp.hive_function_test_df

group by

province_name

,city_name

,area_name

with rollup

;

以上是"Hive高阶聚合函数用法示例"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!

0