新媒易动态
NEWS CENTER
NEWS CENTER
2023-09-19
在数据仓库领域中,事务总线矩阵是一种用于规划和安排数据仓库的事务模型的东西。它是基于事务需求和事务进程的分析,清晰事务进程与维度的关系。它帮助将事务需求转化为数据模型,并辅导数据仓库的建模和规划进程。
从该事务矩阵中,咱们可以得知需求建造哪些DIM层维度表,DWD层的现实表。
方针的拆分是运算进程的拆分,维度模型里的方针拆分是一种思路,是模型规划很重要的一环。想了解更多可看《原子方针、派生方针、复合方针》。
原子方针:不行再分的方针。
派生方针:派生方针是由原子方针、时刻周期、修饰词构成,用于反映企业某一事务活动在指定时刻周期及方针规模中的事务情况。
复合方针:由派生方针直接运算而来,通常是比率型方针。比如最近七天广告点击率,他的特点便是产生了新的原子方针。
根据事务总线矩阵,可构建用户维度表、时刻维度表、地理位置维度表等等。
日期维度表明例:
此处拓宽现实表构建流程。
现实表阐明:
现实表包含:事务型现实表、周期快照现实表、累积快照现实表。
1)挑选事务进程及确认现实表类型
事务进程界说:事务进程是从企业的经营收益、成本出发,价值链条上有影响力的用户需求事情或者事情。并且,这样的进程非常多,咱们要分析傍边的中心关键进程,不断细分。
中心内容:企业活动事情、不行拆分原则。
2)声明粒度:界说现实表的每一行所表明的事务含义,尽量挑选最细级别的原子粒度,以确保现实表的运用具有最大的灵活性。
3)确认维度:挑选能够描绘清楚事务进程所在的环境的维度信息。
4)确认现实:现实有可加性、半可加性、非可加性三种类型 需求将不行加性现实分解为可加的组件。
5)冗余维度:考虑更多的是提高下流用户的运用功率,降低数据获取的复杂性,减少关联的表数量。
文章阅览现实表:
页面浏览现实表:
下单累计快照现实表:
交易域每日付出汇总表:
流量域每日曝光汇总表:
根据需求,汇总表还需求统计每月、每年、近7天、近30天等数据汇总情况,此处不做过多表格展现。需求注意命名规范以及现实是否可加。