千家信息网

大数据的数仓平台设计思路是什么

发表于:2024-11-17 作者:千家信息网编辑
千家信息网最后更新 2024年11月17日,这篇文章主要讲解了"大数据的数仓平台设计思路是什么",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"大数据的数仓平台设计思路是什么"吧!下图为数仓整体的技
千家信息网最后更新 2024年11月17日大数据的数仓平台设计思路是什么

这篇文章主要讲解了"大数据的数仓平台设计思路是什么",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"大数据的数仓平台设计思路是什么"吧!

下图为数仓整体的技术架构:

一个优秀可靠的数仓,一定要结构、分层清晰,而不是越多的分层和主题越好,保障清晰的状态下,能够快速找到数据的位置。主题域的划分,完全可按照公司内部的业务线和结构去划分。

图中BDL层,作为缓冲数据层,其实就是贴数据层,和源数据表相同的表。直接用源库(传统关系型业务库)抽取数据,只存每天最新的数据快照(主要是增量数据)

BAK层是BDL层抽数,保存的是全历史业务数据,起备份和查错的作用。

FDL层是基础数据层,是基于主题、数仓模型开发的基础数据表。这里主要用到了范式建模法和维度建模法(即星型模型)包含最细粒度的数据,故称基础数据层,通俗的理解,这才是整个数仓的最核心的基础数据层,因为BAK层和BDL层的数据表结构跟业务库的数据是完全一致的,而FDL层的数据才是开始进行真正意义上的第一次清洗,不要的字段去除,不规范的字段命名去除,统一数据,规范标准化的一个过程。

GDL层是通用数据层,就是宽表层。也是基于主题、数仓模型开发的宽表。可能会牺牲第三范式,将相关的各维度或属性整合到一张表里。这种表的特点就是字段较多,数据量较大,但它能帮助消除重复查询。由于这种表会被各种需求用到,故称通用数据层。

ADL层是汇总数据层,是基于主题、数仓模型开发的汇总数据表。这里只用到维度建模法(即星型模型)。指标库可以放到这一层。

APP层是开放给用户,用户可以在此层自己开发数据,提数。给用户的脱敏数据也可以放到这一层。我们开发的数据产品所需数据也可以在这一层做。

还有两层比较特殊:
一个是TMP(临时层),说白了就是存储中间结果表,有些业务场景比较复杂,需要拆表,多次计算,要用到一些中间结果集表,因此这层也是辅助层。

DIM层是维表层,各种时间维,省市区维度都可以存放,根据公司的业务形态去划分,ADL层可以跟DIM层的多维度关联,做各种报表,手到擒来。

以下是数据仓库数据流架构图:

感谢各位的阅读,以上就是"大数据的数仓平台设计思路是什么"的内容了,经过本文的学习后,相信大家对大数据的数仓平台设计思路是什么这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!

数据 业务 思路 主题 就是 模型 开发 平台 设计 基础 数据表 维度 字段 用户 结构 学习 公司 内容 架构 结果 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 网络安全与民众生活 国际网络安全应急响应体系 有关网络安全的文档 怎么才能当好一名网络安全员 数据库被禁用了 高密度存储服务器价格 网络安全建设语录 创新软件开发互惠互利 江苏辅助计算机网络技术服务优势 服务器资源使用日志 运用了通信网络技术的行业 协智网络技术有限公司 游览器与web服务器之间的协议 关于网络安全的好词好句好段 数据库bi工程师 开发数据库管理系统 智慧社区软件开发广东 安全服务器多少钱 数据库配置管理器怎么关闭 数据库怎么设置账号密码 聚好看怎么查看服务器是否维护 工业数据库法人代码 中宁县app软件开发找哪家 电脑服务器无法连接网络 同城交友社交软件开发说明 国内数据库公司有哪些属于国企 阿里云服务器如何建立多个站 数据库后期维护升级方案 戴尔服务器启动跳线 西安市网络安全宣传周高校
0