Hive基本概念是什么
发表于:2025-02-08 作者:千家信息网编辑
千家信息网最后更新 2025年02月08日,这篇文章主要为大家展示了"Hive基本概念是什么",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"Hive基本概念是什么"这篇文章吧。1、Hive基本概念1.
千家信息网最后更新 2025年02月08日Hive基本概念是什么
这篇文章主要为大家展示了"Hive基本概念是什么",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"Hive基本概念是什么"这篇文章吧。
1、Hive基本概念
1.1、什么是hive?
Hive是基于Hadoop的一个数据仓库工具,能将结构化的数据文件映射为一张表,并提供类SQL查询功能。Facebook家的。
1.2、hive的本质
本质就是将HQL转化为MR程序。工作流程:Hive数据库将SQL中常用语句封装为对应的MapReduce模板并封装在hive中----> 客户使用sql语句对hive提交任务需求----> hive将根据对应的sql语句调用MapReduce程序----> MapReduce程序提交到yarn上运行----> 运行结果返回给客户
要说的是:
Hive处理的数据是存在hdfs上。(这点一定要明确,不然就会有种hive像数据库的错觉)
HQL语句调用的底层是MapReduce。
Hive任务提交在Yarn上。
1.3、hive优缺点
优点:(1)Hive可以使用类SQL语言进行数据查询操作,减小了开发难度;(2)Hive使开发时避免写冗长的MapReduce程序,提高开发效率;(3)Hive可以实现对海量数据的分析计算操作;(4)Hive提供了自定义函数,用户可根据需求自定义封装函数。缺点:(1)Hive的HQL表达能力有限,其自动生成的MapReduce程序不够智能,且无法对部分更优的算法进行封装;(2)Hive不支持行级别更新,只允许新增与追加,不允许修改删除操作;(3)Hive的效率比较低,执行延迟比较高,调优粒度较粗。
1.4、hive框架原理
(1)client:用户接口,命令行cli、JDBC接口
(2)Metastore:元数据,存储数据的库名、表名、字段、类别、存储目录、自定义函数等,默认存储在自带的derby中
(3)Hadoop:HDFS存放数据,MapReduce进行数据计算
(4)Driver:解析器(SQL-->AST)、编译器(AST-->执行计划)、优化器(执行计划优化)、执行器(执行计划-->MapReduce)
1.5、hive跟数据库比较
(1)查询语言:Hive提供了类SQL查询语句HQL,但HIve不提供数据存储于计算环境;
(2)数据更新:Hive不支持对数据库的删除、修改;
(3)执行延迟:Hive执行延迟较高
(4)数据规模:Hive可以对海量数据进行分析计算
以上是"Hive基本概念是什么"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
数据
程序
语句
概念
数据库
存储
封装
查询
内容
函数
篇文章
延迟
开发
任务
客户
接口
效率
本质
海量
用户
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
科技园互联网公司
像素工厂无法连接服务器怎么办
安川服务器报警a720
在线鲜花系统的数据库系统实现
数据库原理职工编号
互联网网络安全法
微字节网络技术
数据库设计实例之银行
王者荣耀数据库怎么删除
腾讯云游戏服务器怎么选择
杭州服务器机房空调
学数据库有什么好的网站
count统计数据库
网络安全产业园入驻企业
英灵神殿服务器退出
桐柏软件开发有限公司
服务器要网卡是在哪里
阜阳互联网科技有限公司
js如何操作数据库
同上一堂课网络安全教育课
希捷服务器硬盘是叠瓦式的么
安卓系统与app软件开发
数据库事务应用
合肥公安局网络安全招聘
幼儿园网络安全值班记录
数据库取数建表
dell服务器r730
软件开发中的角色和职责
中职学软件开发好吗
算法在数据库中的应用几个表格