Hive的join底层mapreduce是如何实现的
发表于:2025-02-09 作者:千家信息网编辑
千家信息网最后更新 2025年02月09日,这篇文章主要讲解了"Hive的join底层mapreduce是如何实现的",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Hive的join底层mapre
千家信息网最后更新 2025年02月09日Hive的join底层mapreduce是如何实现的如果没开启hive.auto.convert.join=true或者不符合MapJoin的条件,那么Hive解析器会将Join操作转换成Common Join,在Reduce阶段完成join。并且整个过程包含Map、Shuffle、Reduce阶段。1 Map阶段 2 Shuffle阶段 3 Reduce阶段 4 举例
这篇文章主要讲解了"Hive的join底层mapreduce是如何实现的",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Hive的join底层mapreduce是如何实现的"吧!
Common Join
读取表的数据,Map输出时候以 Join on 条件中的列为key,如果Join有多个关联键,则以这些关联键的组合作为key;
Map输出的 value 为 join 之后需要输出或者作为条件的列;同时在value中还会包含表的 Tag 信息,用于标明此value对应的表;按照key进行排序
根据key取哈希值,并将key/value按照哈希值分发到不同的reduce中
根据key的值完成join操作,并且通过Tag来识别不同表中的数据。在合并过程中,把表编号扔掉
drop table if exists wedw_dwd.user_info_df; CREATE TABLE wedw_dwd.user_info_df( user_id string COMMENT '用户id', user_name string COMMENT '用户姓名' )row format delimited fields terminated by '\t' STORED AS textfile ; +----------+------------+--+| user_id | user_name |+----------+------------+--+| 1 | 小红 || 2 | 小明 || 3 | 小花 |+----------+------------+--+
drop table if exists wedw_dwd.order_info_df; CREATE TABLE wedw_dwd.order_info_df( user_id string COMMENT '用户id', course_name string COMMENT '课程名称' )row format delimited fields terminated by '\t' STORED AS textfile ; +----------+--------------+--+| user_id | course_name |+----------+--------------+--+| 1 | spark || 2 | flink || 3 | java |+----------+--------------+--+
select t1.user_id,t1.user_name,t2.course_namefromwedw_dwd.user_info_df t1join wedw_dwd.order_info_df t2on t1.user_id = t2.user_id;+----------+------------+--------------+--+| user_id | user_name | course_name |+----------+------------+--------------+--+| 1 | 小红 | spark || 2 | 小明 | flink || 3 | 小花 | java |+----------+------------+--------------+--+
图解:(在合并过程中,把表编号扔掉)
感谢各位的阅读,以上就是"Hive的join底层mapreduce是如何实现的"的内容了,经过本文的学习后,相信大家对Hive的join底层mapreduce是如何实现的这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!
阶段
底层
条件
用户
过程
学习
输出
不同
内容
小花
数据
哈希
小明
小红
关联
信息
同时
名称
多个
姓名
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
幼儿园网络安全竞赛题
数据库安全的关键
网络安全200
音乐主题数据库小结报告
浙江现代软件开发公司
打印机服务器怎么设置密码
zinc数据库打开很慢
长沙万户网络技术有限公司
5650服务器
服务器动
夕颜若雪是哪个游戏的服务器名
广州金山云网络技术有限公司
郑州互联网软件开发哪家专业
晋宁区方便软件开发报价表
服务器硬盘 黄灯闪
哪一个数据库提供外文电子图书
创建的数据库怎么导出
misc数据库是什么意思
服务器远程桌面工具
山东网络安全信息与工程院校
计算机网络技术论文实施计划
svn服务器搭建 本地
网络安全教育主题团课心得
服务器等级修改器
两人联机服务器多少钱
网络安全重点工作安排
91安装完一直显示连接服务器
安徽 软件开发有限公司
山西万美汇网络技术
上海综合软件开发市场报价