3-dw_缓慢变化维
发表于:2025-02-08 作者:千家信息网编辑
千家信息网最后更新 2025年02月08日,上次我们理解了维度表,哪什么是缓慢变化维呢,比如我们有这样的一个场景, A 客户在 4 月份的时候归属于 X 部门,在 5 月的时候归属于 Y 部门,如果 A 客户的销售额需要体现归属部门的变化关系。
千家信息网最后更新 2025年02月08日3-dw_缓慢变化维
上次我们理解了维度表,哪什么是缓慢变化维呢,比如我们有这样的一个场景, A 客户在 4 月份的时候归属于 X 部门,在 5 月的时候归属于 Y 部门,如果 A 客户的销售额需要体现归属部门的变化关系。此时就需要用到缓慢变化维了。如下图就是对客户表的一个缓慢变化。
上面设计就是对每个月把客户生成一份数据,但如果我们的客户有 100 万个呢,每月生成一份,一年后就有 1200 万了,这样导致数据量会很大,在关联的时候会严重影响性能。哪么我们就需要用缓慢变化维的设计方案了,采用代理键方案来达到最少数据量。如下图:
我们通过对客户表的开始日期和结束日期框定每个客户的当前版本,然后落地数据时把客户的代理键带上,这样以后在做数据分析时,如果结果表带的客户维度信息不全,就可以直接用代理键关联客户维表带出需要的维度,如果此时没有代理键做关联,采用客户代码做关联,就会出现数据笛卡尔积,如下图,当我们需要对结果表增加客户的"归属部门名称"时,有"代理键"信息时,则直接按代理键做关联条件带出客户维表里的"归属部门名称"信息,如果按"客户代码"关联,则会导致数据翻倍,见红色数据记录, 4 月的由 100 变化到 200 了, 5 月份的 200 变化到 400 了,不然就需要重新计算每个月的数据才能达到增加"归属部门名称"信息的目的。
生成缓慢变化维的 SQL 代码见 :
https://github.com/blt328/dw_blt
更多技术文章请关注公众号 ( 长按后点识别图中二维码 ):
客户
数据
变化
部门
代理
关联
缓慢
信息
归属
代码
名称
时候
维度
生成
就是
方案
日期
月份
结果
表带
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
地方数据库查询
重庆永川仓储生鲜软件开发
tcp接收多个服务器数据
手机文件管理软件开发
数据库索引为什么用b树
巴蜀麻将客服软件开发定制
网络安全三大趋势
怎样给数据库单独设置密码
网络安全的应用方向是什么
数据库 网页程序
数据仓库是一种数据库
体验服服务器扩容
吴江网络技术咨询有哪些
数据库费电脑吗
剑网3服务器点卡区在哪里
网际关于网络安全的评价标准内容
软件开发中心 成本中心
北京哈希深度网络技术有限公司
网络安全包含逆向吗
网络安全事件应急处置小组
保康农发行网络安全宣传
重新连接数据库
网络安全科技奖
挂软件服务器
软件开发驱动底层好就业吗
购服务器带软件都算固定资产吗
网络安全管理 顺口溜
软件开发项目人力资源成本
电子科技大学互联网复合培训班
win10远程修改数据库