(二)概念模型设计
确定主题和主题域边界
概念模型设计:主要是确定数据仓库中应该包含的数据类及其相互关系
1.界定系统边界
要做的决策类型有哪些?
决策者感兴趣的是什么问题?
这些问题需要什么样的信息?
要得到这些信息需要包含原有数据库系统的哪些部分的数据?
2.确定主要的主题域
主题:在一个较高层次上将企业信息系统中的数据进行综合、归类和分析利用的一个抽象概念
描述主题域
分析主题时所关心的事实
分析主题时的各种观察角度
主题域之间的联系
事实及观察主题团的属性组、公共码键
数据仓库的概念模型一般采用多维数据模型来建模
多个星形模型
维度:观察事实的角度
度量:观察得到的事实数据
分析原有数据库的数据“怎样组织”、“如何分布”
(三)逻辑模型设计
逻辑模型设计:用一系列的关系模式来表达数仓概念模型中的事实实体和维度实体
分析主题域,确定当前要装载的主题
确定粒度层次划分
粒度越小,级别越低,数据越详细
粒度越大,级别越高,数据综合度越高
粒度划分参考方面
细节数据的数据量
多维分析的最低要求
确定数据分割策略
数据分割:把逻辑统一的数据分割成较小的、可以独立管理的物理单元进行存储,以便重构、重组和回复。
考虑因素
数据量(而非记录行数)
数据分析处理的实际情况
简单易行以及粒度划分策略等
关系模式定义
(四)物理模型设计
*前置条件
全面了解所选用的数据库管理系统,特别是存储结构和存取方法
了解数据环境、数据的使用频度、使用方式、数据规模及响应时间要求等<br>
了解外部存储设备的特性,如分块原则、块大小的规定、设备的I/O特性等
估计存储容量
确定存储结构
确定索引结构
合理对表进行归并
优化存储分配
(3)数据可视化设计
根据设计出来的数据指标,并根据最终数据类型和目的,选择最佳的数据可视化方案,将每个数据指标美观并且直观地呈现出来
(2)数据指标设计
根据需求分析 结果,制定出用户最感兴趣、易于理解,并且最能够体现问题本质的数据指标
所需撰写文档
商业需求文档(Business Requirements Document,BRD)
内容涉及市场分析,销售策略,盈利预测等, <br>通常是和老大们阐述PPT,<br>比较短小精炼,没有产品细节
市场需求文档(Market Requirements Document,MRD)
有更细致的市场与竞争对手分析,<br>通过哪些功能来实现商业目的,<br>功能/非功能需求分哪几块,功能的优先级等等
产品需求文档(Prpduct Requirements Document,PRD)
侧重于从产品角度看待需求。<br>通常特点和功能需求上更深入细节,<br>并也坑你包括屏幕截图和界面流程                  
功能详细描述文档(Functional Specifications Document,FSD)
把焦点集中在实现,<br>定义产品功能需求全部细节