出版时间:2012-7 出版社:清华大学出版社 作者:亚当森 页数:390 字数:662000
Tag标签:无
内容概要
学习维度设计的最佳实践。《Star
Schema完全参考手册:数据仓库维度设计权威指南》全面、深入地介绍了设计原理及其理论基础。全书围绕设计概念组织并辅以详实的示例,可作为初学者逐步深入学习星型模式的参考资料,同时也为专家提供了内容丰富的参考资源。
《Star
Schema完全参考手册:数据仓库维度设计权威指南》首先介绍维度设计的基础知识,向读者展示如何将这些基础应用于不同的数据仓库体系结构,包括w.h.inmon和ralph
kimball倡导的体系结构。本书通过介绍一系列高级技术来帮助读者解决现实世界中存在的复杂性,获得最佳性能并适应商业智能和etl软件产品的需求。读者可以将书中的设计任务和设计产品运用于所有项目中,而无论项目采用什么方法和架构。
作者简介
作者:(美国)亚当森(Christopher Adamson) 译者:王红滨 王念滨 初妍 Christopher Adamson是星型模式设计专家,并且是经验丰富的数据仓库实践者。他在世界各地演讲和授课,撰写数据仓库相关内容,并通过Oakton软件有限责任公司提供数据仓库咨询服务。 作为一名咨询专家,Christopher与各个行业的客户一起工作,一开发数据仓库战略,识别并确定项目优先顺序,设计并修改解决方案,以及管理实现。他服务的客户包括财富500强的公司、政府机关和数据仓库软件提供商。 Christopher在世界范围内为成千上万学生讲授多维设计。他是The Data Warehousing Institute(TDWI)的教员,为重要会议提供现场讲座,并且提供网络教学。 Christopher撰写了许多有关数据仓库的文章和书籍。他是Mastering Data Warehouse Aggregates(Wiley,2006)一书的作者,并与人合著了Data Warehouse Design Solutions(Wilev,1998)一书。他撰写有关数据仓库的文章并为读者解答问题的博客网址为www.StarSchemaCentral.com.
书籍目录
第1部分 基础
第1章 分析型数据库与维度设计
1.1 维度设计
1.2 星型模式
1.3 星型模式的应用
1.4 指导原则
1.5 本章小结
1.6 补充阅读
第2章 数据仓库体系结构
2.1 inmon的企业信息化工厂
2.2 kimball的维度数据仓库
2.3 独立型数据集市
2.4 体系结构和维度设计
2.5 本章小结
2.6 补充阅读
第3章 星型模式与多维数据集
3.1 维度表特性
3.2 事实表特性
3.3 缓慢变化维
3.4 多维数据集
3.5 本章小结
3.6 补充阅读
第2部分 多种星型模式
第4章 过程处理中的事实表
4.1 事实表与业务过程
4.2 具有不同时间的事实
4.3 具有不同粒度的事实
4.4 从多个事实表中分析事实
4.5 本章小结
4.6 补充阅读
第5章 维度一致性问题
5.1 星型模式之间的协同
5.2 维度与横向钻取
5.3 一致性维度
5.4 结构与一致性
5.5 本章小结
5.6 补充阅读
第3部分 维度设计
第6章 深入学习维度表
6.1 将维度分组到表中
6.2 分解大型维度
6.3 角色维度和别名使用
6.4 避免空值
6.5 行为维度
6.6 本章小结
6.7 补充阅读
第7章 层次结构与雪花模式
7.1 钻取
7.2 属性层次和钻取
7.3 雪花模式
7.4 支架表
7.5 本章小结
7.6 补充阅读
第8章 深入学习缓慢变化技术
8.1 时间戳维度
8.2 类型3变化
8.3 混合缓慢变化
8.4 本章小结
8.5 补充阅读
第9章 多值维度与桥接表
9.1 标准的一对多关系
9.2 多值维度
9.3 多值属性
9.4 本章小结
9.5 补充阅读
第10章 递归层次与桥接表
10.1 递归层次
10.2 递归层次的扁平化
10.3 层次桥接表
10.4 变化与层次桥接表
10.5 关于层次桥接表的相关讨论
10.6 本章小结
10.7 补充阅读
第4部分 事实表设计
第11章 事务、快照和累积快照
11.1 事务事实表
11.2 事实表快照
11.3 累积快照事实表
11.4 本章小结
11.5 补充阅读
第12章 无事实的事实表
12.1 无事实的事件
12.2 条件、范围或资格
12.3 本章小结
12.4 补充阅读
第13章 特殊类型的星型模式
13.1 特殊类型属性
13.2 核心和自定义星型模式
13.3 使用通用属性
13.4 本章小结
13.5 补充阅读
第5部分 性能
第14章 导出模式
14.1 重构维度数据
14.2 融合事实表
14.3 旋转事实表
14.4 切片事实表
14.5 集合操作事实表
14.6 本章小结
14.7 补充阅读
第15章 聚集
15.1 聚集的基础知识
15.2 使聚集不可见
15.3 可选的汇总设计方法
15.4 本章小结
15.5 补充阅读
第6部分 工具及文档
第16章 设计与商业智能
16.1 商业智能与sql生成
16.2 适用于语义层的指导原则
16.3 使用商业智能工具的sql生成器
16.4 使用基于多维数据集的商业智能
16.5 本章小结
16.6 补充阅读
第17章 设计与etl
17.1 etl过程
17.2 加载星型模式
17.3 优化加载
17.4 清理数据
17.5 内部处理列
17.6 本章小结
17.7 补充阅读
第18章 如何设计并文档化维度模型
18.1 维度设计与数据仓库生命周期
18.2 设计活动
18.3 文档化维度模型
18.4 本章小结
18.5 补充阅读
章节摘录
版权页: 插图: 由于非可加的事实并未存储在事实表中,需要注意不要丢失这些事实。在许多业务过程中,比率是非常重要的度量,没有它们,系统会存在许多缺陷。作为模式设计的一部分,非可加事实应该被文档化,在第18章“如何设计并文档化维度模型”中将详细讨论。 注意: 关于非可加性的讨论还没有结束。除了非可加及可加的事实之外,还存在半可加的事实。关于半可加事实将在第11章“事务、快照和累积快照”中讨论。 3.2.3 粒度 事实表行所表达的细节层次被称为粒度。清楚地声明事实表的粒度是模式设计过程中的一个重要工作。明确的粒度能够确保对事实表中行的意思的理解不会产生混淆,保证所有的事实按照同样的细节层次记录。 可以采用多种方式描述粒度。许多模式设计者采用简单地枚举相关维度的方式来描述粒度。例如,图3—1所示的订单事实表(ORDER FACTS)的粒度可以描述为“按照每天、销售人员、产品、客户排序”。 以上方式听起来好像说清楚了,它揭示了星型模式的重要信息。在此方式下,粒度的声明包含以下隐含意思:对给定的某天,如果一个客户在同一销售商处,就同一产品提交了多个订单,那么这些订单将被组合到同一行中。这样的聚合可能抛弃了有用的信息。 多数情况下,模式设计者会避免在将数据加载到事实表之前聚合数据。尽可能地保持最细粒度的数据,星型模式就能解决范围更加宽泛的分析型需求。初期的业务需求可能不需要详细数据,但分析型的需求往往具有变化的趋势,一旦构建了聚集模式,对详细信息的需求将就此展开。 无论采用何种数据仓库结构,这一指导原则都普遍适用。对多维数据仓库来说,事实表包含粒度数据至关重要,因为多维数据仓库是细节数据的集中存储仓库。如果性能成为关注的焦点,可以在细粒度事实表中附带聚合信息,第15章中将会讨论该问题。针对企业信息化工厂体系结构来说,这一指导原则可以宽松一些,因为不同的仓库均包含粒度数据。在此环境下,数据集市的事实表可以聚集数据,而不用担心丢失信息的问题。不过,对研究粒度数据的新需求可能会导致重新开发数据集市。 技巧: 尽可能将事实表的粒度设置为最详细的数据粒度级别。这一原则有助于确保分析型应用具有最大的灵活性。假如能够有不同的仓库保存不同粒度的数据,则可以降低要求,但这种方式可能会对未来的应用带来限制。
编辑推荐
《Star Schema完全参考手册:数据仓库维度设计权威指南》由清华大学出版社出版。
图书封面
图书标签Tags
无
评论、评分、阅读与下载