Hive基本概念是什么
发表于:2024-09-21 作者:千家信息网编辑
千家信息网最后更新 2024年09月21日,这篇文章主要为大家展示了"Hive基本概念是什么",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"Hive基本概念是什么"这篇文章吧。1、Hive基本概念1.
千家信息网最后更新 2024年09月21日Hive基本概念是什么
这篇文章主要为大家展示了"Hive基本概念是什么",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"Hive基本概念是什么"这篇文章吧。
1、Hive基本概念
1.1、什么是hive?
Hive是基于Hadoop的一个数据仓库工具,能将结构化的数据文件映射为一张表,并提供类SQL查询功能。Facebook家的。
1.2、hive的本质
本质就是将HQL转化为MR程序。工作流程:Hive数据库将SQL中常用语句封装为对应的MapReduce模板并封装在hive中----> 客户使用sql语句对hive提交任务需求----> hive将根据对应的sql语句调用MapReduce程序----> MapReduce程序提交到yarn上运行----> 运行结果返回给客户
要说的是:
Hive处理的数据是存在hdfs上。(这点一定要明确,不然就会有种hive像数据库的错觉)
HQL语句调用的底层是MapReduce。
Hive任务提交在Yarn上。
1.3、hive优缺点
优点:(1)Hive可以使用类SQL语言进行数据查询操作,减小了开发难度;(2)Hive使开发时避免写冗长的MapReduce程序,提高开发效率;(3)Hive可以实现对海量数据的分析计算操作;(4)Hive提供了自定义函数,用户可根据需求自定义封装函数。缺点:(1)Hive的HQL表达能力有限,其自动生成的MapReduce程序不够智能,且无法对部分更优的算法进行封装;(2)Hive不支持行级别更新,只允许新增与追加,不允许修改删除操作;(3)Hive的效率比较低,执行延迟比较高,调优粒度较粗。
1.4、hive框架原理
(1)client:用户接口,命令行cli、JDBC接口
(2)Metastore:元数据,存储数据的库名、表名、字段、类别、存储目录、自定义函数等,默认存储在自带的derby中
(3)Hadoop:HDFS存放数据,MapReduce进行数据计算
(4)Driver:解析器(SQL-->AST)、编译器(AST-->执行计划)、优化器(执行计划优化)、执行器(执行计划-->MapReduce)
1.5、hive跟数据库比较
(1)查询语言:Hive提供了类SQL查询语句HQL,但HIve不提供数据存储于计算环境;
(2)数据更新:Hive不支持对数据库的删除、修改;
(3)执行延迟:Hive执行延迟较高
(4)数据规模:Hive可以对海量数据进行分析计算
以上是"Hive基本概念是什么"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
数据
程序
语句
概念
数据库
存储
封装
查询
内容
函数
篇文章
延迟
开发
任务
客户
接口
效率
本质
海量
用户
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
具有口碑的数据库防火墙
监听短信数据库
华为网络技术工程师录用
关于网络安全的作文初中
网络安全攻防比赛
服务器机柜过滤器厂商
手游客户端计算和服务器计算
jtable 加载数据库
广博网络技术有限公司
数据库系统开发实例论文
电力应用软件开发及维护服务
软件开发中的pm
杭州游戏软件开发公司
软件开发开心购
移动后台网络安全是做什么
区块宠物软件开发
ctf网络安全大赛awsd
计算机信息网络技术是什么
测试人员访问服务器的过程
崇明区品牌软件开发有哪些
软件开发抖音怎么认证
xeon服务器芯片
查询数据库中ID的最大值
一个网站 三台服务器
什么是网络安全教育学
冒险岛服务器怎么找
宁夏网络安全十三五
潜渊症怎么删除服务器
手机我的世界定位服务器进不去
关于网络安全的名言名语