1、 毕毕 业业 设设 计(论计(论 文)文) 题 目: 基于 Hadoop 的电子商务数据存储 架构的研究与设计 院 系: 经济与管理学院 物流电子商务系 专 业: 电子商务 班 级: 学生姓名: 导师姓名: 职称: 讲师 起止 时间:2014 年 12 月 20 日至 2015 年 06 月 20 日 毕业设计毕业设计( (论文论文) ) 选题审批表选题审批表 申报人 xx 职称 讲师 学院 经济与管理学院 题目名称 基于 Hadoop 的电子商务数据存储架构的研究与设计 题目来源 科研 教学 其它 题目类型 硬件设计 软件设计 论文 艺术作品 题目性质 实际应用 理论研究 题目 简述 电子商
2、务网站每日交易量巨大,传统的数据库已经无法满足对海量数据实时统计、查询、分析的 要求,为了能够对电子商务网站中的商业数据进行挖掘、分析,找到 有价值的数据,需要能够处 理海量数据的数据库技术,该题目使学生掌握如何建立大数据处理中用到的数据存储技术,使学 生掌握如何建立合理的存储系统来满足电 子商务网站数据分析挖掘的目的 对学 生知 识与 能力 要求 掌握电子商务的基本知识、管理信息系统、Java EE、Hadoop 大数据等相关理论及技术 预期 目标 应完成工作 1、查阅电子商务的基本知识、管理信息系统、Java EE、Hadoop 大数据等相关资料, 学习相关技术 2、研究电子商务中商品管理
3、的基本原理,学习 JavaEE 和 Hadoop 等技术的应用原 理。 3、搭建开发环境 4、根据研究结果,完成开发 5、撰写论文 成果 1、论文 2、基于 Hadoop 的电子商务数据存储架构的程序 时间 进度 2014.12.20-2015.03.24 收集资料 2015.03.24-2015.03.31 撰写开题报告 2015.04.01-2015.04.07 搜集资料、形成大纲 2015.04.08-2015.04.28 论文撰写、 形成初稿 2015.04.29-2015.05.25 修改、完成论文二稿 2015.05.26-2015.06.01 完成定稿、打印装订 2015.06.
4、02-2015.06.06 指导教师签署意见 2015.06.07-2015.06.10 评阅教师签署意见 2015.06.11-2015.06.20 行答辩、 签署 结论 系(教研室)主任 签字 年 月 日 主管院长 签字 年 月 日 xx 本科毕业设计(论文)开题报告 学号 xx 姓名 xx 导师 xx 题目 基于 Hadoop 的电子商务数据存储架构的研究与设计 选题目的(为什么选该课题) 电子商务网站每日交易量巨大,传统的数据库已经无法满足对海量数据实时统计、查 询、分析的要求,为了能够对电子商务网站中的商业数据进行挖掘、分析,找到有价值的 数据,需要能够处理海量数据的数据库技术。 现
5、今电子商务网站数据的重要发展方向是大数据,而大数据的主要实现方式之一就是 通过 Hadoop 技术来实现。所以电子商务数据和 Hadoop 技术密切相关。 前期基础(已学课程、掌握的工具,资料积累、软硬件条件等) 已学课程:电子商务基础知识、JavaEE、管理信息系统 掌握工具:Java 开发工具 Eclipse 资料积累:Hadoop 相关理论及技术 软硬件条件:三台服务器(一台作为 namenode,两台作为 datanode),实验室内部局域网, 操作系统 Linux,分布式文件系统 Hadoop 要解决的问题(做什么) 如何建立合理的分布式文件系统来存储电子商务网站数据,实现对海量数据
6、的实时统 计、查询、分析,以帮助企业找到有价值的数据。 工作思路和方案(怎么做) 1、对课题研究的项目背景、技术背景、国内外研究现状进行分析, 2、研究分布式文件系统的关键技术,包括目前现有的分布式存储架构和关键算法。 3、掌握分布式文件系统 HDFS 和并行编程 MapReduce。针对电子商务数据存储,分析 Hadoop 架构的不足,给出改进方案并实现。 4、通过 VMware、Linux 操作系统、Hadoop,建立分布式文件系统。 5、通过 Java 语言,以及 Hadoop 相关技术,实现对海量数据的存储、挖掘、查询、分 析。 6、通过 Mahout 进行数据挖掘,寻找有价值的数据。 指导教师意见 xxxx 毕业设计毕业设计 ( (论