千家信息网

混合数据湖的好处是什么

发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,这篇文章主要为大家分析了混合数据湖的好处是什么的相关知识点,内容详细易懂,操作细节合理,具有一定参考价值。如果感兴趣的话,不妨跟着跟随小编一起来看看,下面跟着小编一起深入学习"混合数据湖的好处是什么"
千家信息网最后更新 2025年01月23日混合数据湖的好处是什么

这篇文章主要为大家分析了混合数据湖的好处是什么的相关知识点,内容详细易懂,操作细节合理,具有一定参考价值。如果感兴趣的话,不妨跟着跟随小编一起来看看,下面跟着小编一起深入学习"混合数据湖的好处是什么"的知识吧。

在存储大数据时,数据湖和数据仓库都是既定术语,但是这两个术语不是同义词。数据湖是尚未确定用途的大量原始数据。另一方面,数据仓库是用于特定目的的结构化过滤数据的存储库。

共同点

数据仓库和数据湖代表了一个中央数据库系统,可以在公司中用于分析目的。该系统从各种异构数据源中提取,收集和保存相关数据,并提供给下游系统。

数据仓库可以分为四个子过程:

  • 数据获取:从各种数据存储库中获取和提取数据。

  • 数据存储:包括长期归档在内的数据仓库中的数据存储。

  • 数据提供:向下游系统提供所需的数据,提供数据集市。

  • 数据评估:对数据库存的分析和评估。

差异性

数据仓库将经典的ETL流程与关系数据库中的结构化数据结合使用,而数据湖则使用诸如ELT的范式和读取模式以及经常使用的非结构化数据[2]。

> Differences Data Warehouse vs. Lake

在上方,您可以看到主要区别。您使用的技术也完全不同。对于数据仓库,您将使用SQL和关系数据库,而对于数据湖,您可能将使用NoSQL或两者的混合。

将两者结合在混合数据湖中

那么如何将这两个概念结合起来?在下图中,您可以从高角度查看架构。

该过程是将非结构化和未转换的数据加载到数据湖中。从这里,一方面可以将数据用于ML和Data Science任务。另一方面,数据也可以转换为结构化形式并加载到数据仓库中。从这里,可以实现通过数据集市和(自助服务)BI工具进行的经典数据仓库分发。

> Hybrid Data Lake Concept — Image from Author

可以用于此体系结构的主要技术例如:

  • 通过talend,Google Dataflow,AWS Data Pipeline进行ELT / ETL流程

  • 通过Data Lake-HDFS,AWS Athena和S3,Google Cloud Storage

  • 数据仓库通过-Google BigQuery,AWS Redshift,Snowflake

注意:诸如Google的BiqQuery或AWS Redshift之类的技术通常被视为数据仓库技术与数据湖技术之间的混合体,因为它们通常已经具有NoSQL的某些特征。

关于"混合数据湖的好处是什么"就介绍到这了,更多相关内容可以搜索以前的文章,希望能够帮助大家答疑解惑,请多多支持网站!

数据 仓库 混合 结构 技术 存储 结构化 数据库 好处 系统 分析 两个 内容 另一方面 术语 流程 目的 知识 经典 跟着 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 三明财务机器人rpa软件开发 手机版无人管理服务器 大一上学期网络技术期末考试 阿里云国外服务器怎么样 江苏塞普网络技术公司 服务器管理器 命令行 行云数据库怎么登录 软件开发人员转hris 数据库概论基本知识 医院网络安全法实施方案 2019-2021主要网络安全事件举例 借口吉他谱软件开发 操作系统支撑软件开发是做什么 字节跳动时序数据库查询内核 江苏电脑软件开发定制 常州衡器管理软件开发公司 国外知名的期刊数据库 服务器每次重启ip地址丢失 电子网络技术大学 泉州微信插件 软件开发 数据库一个模式能有几个表 四川省公安厅Y数据库 上传失败无法连接到服务器 铁可以在水银中我服务器的 网络安全法 三级等保 牟平区管理系统软件开发哪家好 2017网络安全法知识 上海网络技术服务项目 网络安全知识考试2021 广州南渠互联网科技有限公司
0