1、 数 据 仓 库 课 程 设 计 说 明 书 题 目 pubs 出版物分析系统 系 (部) 信息与计算科学 专业(班级) 信息与计算科学(2)班 姓 名 学 号 指导教师 起止日期 2011-5-20 到 2011-5-24 数据仓库课程设计任务书 专 业 信息与计算科学 班 级 09 级 1、2 班 指 导 老 师 任务书发出时间 2012-5-9 信息与计算科学系 2012 年 5 月 9 日 课课 程程 设设 计计 任任 务务 书书 课程 数据仓库课程设计数据仓库课程设计 题目 pubs 出版物分析系统出版物分析系统 序号 8 8 主 要 内 容 基于 pubs 数据库,创建数据库仓库并
2、进行数据分析,要求满足以下分析需求。 (说明: 销售情况指销售总额、销售数量) 1. 按时间级别分析不同出版社(按国家、洲、城市、具体出版社)的销售情况; 2. 按时间级别分析各书店(按国家、洲、城市、具体出版社)的销售情况; 3. 按时间级别分析不同作者的销售情况; 4. 按时间级别分析不同雇员的销售情况; 5. 按时间级别分析不同折扣的销售情况; 6. 通过浏览器和报表方式分析以上需求。 要 求 基本要求 1. 按需求完成详细的设计,包括事实表和维度的设计; 2. 按设计方案选择相关数据表以及各表的字段,表之间的关系; 3. 有详细的数据准备方案,包括验证、清理、转换、装载等; 4. 合并
3、 employee 中 lname 和 fname 字段为 name; 5. 将 discounts 的 discount 字段值划分为高、中、低、无等四个等级; 6. 按设计方案构建多维数据集; 7. 按需求分析数据。 高级要求 可分析销售总额的年增长率; 工 作 计 划 及 进 度 提前两周:分组、选题; 提前一周:明确需求分析、组内分工; 第一天:与指导老师讨论,确定需求、分工,并开始设计; 第二四天:构建多维数据集、分析数据; 第五天:完成设计说明书,答辩; 第六天:针对答辩意见修改设计说明书,打印、上交。 指导教师签字 谭义红 陈治平 赵碧海 2012 年 5 月 3 日 教 研 室
4、 审 定 意 见 同意实施 签字 陈治平 2012 年 5 月 5 日 长沙学院课程设计鉴定表 姓名 学号 专业 信息与计算科学 班级 2 设计题目 pubs 出版物分析系统 指导教师 指导教师意见: 评定等级: 教师签名: 日期: 答辩小组意见: 评定等级: 答辩小组长签名: 日期: 教研室意见: 教研室主任签名: 日期: 系(部)意见: 系主任签名: 日期: 说明 课程设计成绩分“优秀” 、 “良好” 、 “及格” 、 “不及格”四类; 长沙学院课程设计鉴定表 姓名 学号 专业 信息与计算科学 班级 2 设计题目 Pubs 出版物分析系统 指导教师 指导教师意见: 评定等级: 教师签名:
5、日期: 答辩小组意见: 评定等级: 答辩小组长签名: 日期: 教研室意见: 教研室主任签名: 日期: 系(部)意见: 系主任签名: 日期: 说明 课程设计成绩分“优秀” 、 “良好” 、 “及格” 、 “不及格”四类; 目 录 第第 1 1 章章 系统需求系统需求 1 1 1.1 1.1 系统背景系统背景 1 1.2 1.2 系统需求系统需求 1 第第 2 2 章章 数据仓库设计数据仓库设计 3 3 2.1 2.1 问题域的确定问题域的确定 3 2.2 2.2 识别事实数据和维度数据识别事实数据和维度数据 4 2.3 2.3 事实表设计事实表设计 4 2.4 2.4 粒度设计粒度设计 5 2.5 2.5 维度设计维度设计 5 3.1 3.1 数据表的筛选数据表的筛选 7 3.2 3.2 数据验证数据验证 7 3.2 3.2 数据清理数据清理 8 3.2.1 冗余数据的处理 . 8 3.2.2 空值的处理 9 3.2.3 不规范数据的处理 . 9 3.3 数据转换数据转换. 10 3.3.1 数据类型的转换 . 10 3.3.2 对象名的转换 10 第第 4 4 章章 多维数据集构建多维数据集构建 1111 4.1 4.1 创建项目创建项目 .11 4.2 4.2 创建多维数据集创建多维数据集11 4.3 4.3 创建数据源和视图创建数据源和视图 . 15 4.4 4.4 替