Hive的join底层mapreduce是如何实现的
发表于:2024-11-17 作者:千家信息网编辑
千家信息网最后更新 2024年11月17日,这篇文章主要讲解了"Hive的join底层mapreduce是如何实现的",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Hive的join底层mapre
千家信息网最后更新 2024年11月17日Hive的join底层mapreduce是如何实现的如果没开启hive.auto.convert.join=true或者不符合MapJoin的条件,那么Hive解析器会将Join操作转换成Common Join,在Reduce阶段完成join。并且整个过程包含Map、Shuffle、Reduce阶段。1 Map阶段 2 Shuffle阶段 3 Reduce阶段 4 举例
这篇文章主要讲解了"Hive的join底层mapreduce是如何实现的",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Hive的join底层mapreduce是如何实现的"吧!
Common Join
读取表的数据,Map输出时候以 Join on 条件中的列为key,如果Join有多个关联键,则以这些关联键的组合作为key;
Map输出的 value 为 join 之后需要输出或者作为条件的列;同时在value中还会包含表的 Tag 信息,用于标明此value对应的表;按照key进行排序
根据key取哈希值,并将key/value按照哈希值分发到不同的reduce中
根据key的值完成join操作,并且通过Tag来识别不同表中的数据。在合并过程中,把表编号扔掉
drop table if exists wedw_dwd.user_info_df; CREATE TABLE wedw_dwd.user_info_df( user_id string COMMENT '用户id', user_name string COMMENT '用户姓名' )row format delimited fields terminated by '\t' STORED AS textfile ; +----------+------------+--+| user_id | user_name |+----------+------------+--+| 1 | 小红 || 2 | 小明 || 3 | 小花 |+----------+------------+--+
drop table if exists wedw_dwd.order_info_df; CREATE TABLE wedw_dwd.order_info_df( user_id string COMMENT '用户id', course_name string COMMENT '课程名称' )row format delimited fields terminated by '\t' STORED AS textfile ; +----------+--------------+--+| user_id | course_name |+----------+--------------+--+| 1 | spark || 2 | flink || 3 | java |+----------+--------------+--+
select t1.user_id,t1.user_name,t2.course_namefromwedw_dwd.user_info_df t1join wedw_dwd.order_info_df t2on t1.user_id = t2.user_id;+----------+------------+--------------+--+| user_id | user_name | course_name |+----------+------------+--------------+--+| 1 | 小红 | spark || 2 | 小明 | flink || 3 | 小花 | java |+----------+------------+--------------+--+
图解:(在合并过程中,把表编号扔掉)
感谢各位的阅读,以上就是"Hive的join底层mapreduce是如何实现的"的内容了,经过本文的学习后,相信大家对Hive的join底层mapreduce是如何实现的这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!
阶段
底层
条件
用户
过程
学习
输出
不同
内容
小花
数据
哈希
小明
小红
关联
信息
同时
名称
多个
姓名
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
浙江ai服务器
课外阅读软件开发
数据库挖掘 发文章
梦中交谈打一网络技术
深圳市棒谷网络技术有限公司
奉贤区上门软件开发代理品牌
电商网络安全实验报告
dnf数据库改密码
侠客营销软件开发特训+下载
英雄联盟各服务器登录界面头像
关于青少年网络安全心得
网络安全与法治建设
计算机网络技术基础填空
淘宝数据库合法吗
华三服务器进入安全模式
app移动应用软件开发教程
北京观听网络技术有限公司
网络安全工程师的从业要求
全球网络安全公司排名中国公司
服务器更改管理卡
网络安全海报模板
中职学生的计算机网络技术
管理软件开发宣传
软件开发需要什么知识
歌曲音译软件开发
plsql连接数据库超时
四川服务器托管虚拟主机服务器
100克数据库能存多少东西
施乐v80服务器怎么打印不了
数据库视图怎么用的