1、 毕 业 设 计 (论文 ) 外 文 文 献 翻 译 专业 计算机科学与技术 学生姓名 班级 学号 指导教师 博雅 学院 1 中文译文 数据挖掘技术简介 摘要 :微软 SQL Server2005 中 提供用 于创建和使用数据挖掘模型的集成环境的工作。本教程使用的四种情况: 有针对性的邮件 预测; 顺序分析和聚 类;演示如何使用挖掘模型算法; 挖掘模型查看器和数据挖掘工具。 介绍 数据挖掘教程旨在通过创建走在 Microsoft SQL Server 2005的 数据挖掘 模型的过程。数据挖掘算法,并在 SQL Server 2005工具 可以很容易地建立一个项目,包括市场购物篮分析各种全面的
2、解决方案,预测分析,有针对性的邮件分析。这些解决方案的情景更详细的解释在后面的教程。 SQL Server 2005最明显的部分是用来创建和处理数据挖掘模型的工作室。在线分析处理( OLAP )和数据挖掘工具被统一为两个工作环境:商业智能开发工作室和 SQL Server 管理工作室。通过商业智能开发工作室,您可以在与服务器断开连接的情况下建立一个服务项目分析。当项目已经准备就绪,您可以发布到 服务器上。您也可以直接面向服务器工作。 SQL Server 管理工作室的主要职能是管理服务器。之后将有针对每一个环境的详细说明。欲了解更多关于从两个环境中选择的信息,请参看 SQL Server联机丛
3、书中的“在 SQL Server 工作室和商业智能开发工作室中选择”。 数据挖掘工具都存在于数据挖掘的编辑。使用编辑器,您可以管理挖掘模型,创造新模式,查看模型,比较模型,并建立在现有模型的预测。 当你创建一个挖掘模型,你会想要去探索它,寻找有趣的模式和规则。在编辑器中的每个挖掘模型查看器是自定义进行探讨,以特定的 算法建立的模型。如需观众的信息,请参看 SQL Server联机丛书中的“查看数据挖掘模型”。 您的项目往往会包含多个挖掘模型,所以才能使用的模式创建的预测,你要能够确定哪些模式是最准确的。出于这个原因,编辑包含一个模型比较工具挖掘精度的图表标签。使用此工具,您可以比较准确的预测模
4、型和您确定最佳模式。 为了建立数据预期,你将使用一种 DME语言, DMX扩展了传统的 SQL语法,包含了一些创建修改和建立数据预期的命令,关于 DMX的详细信息,请参考 SQL BOL中的 “ Data Mining Extensions (DMX) Reference”章节。因为建立一个数据预期可能比较复杂,所以数据挖掘编辑器包含了一个工具叫做 “ Prediction Query Builder”, 该工具可以让你在一个图形化的界面下编辑 DMX查询语句,你也可以在该工具中可以查看自动生成的 DMX语句。 了解了前面介绍的实现数据挖掘的工具之外,同等重要的是了解数据挖掘模型的结构本身,建
5、立一个数据模型的关键是数据挖掘算法,该算法在你操作的数2 据中寻找我们需要的部分,并且转换这些数据成为一个可操作的数据模型。 一些很重要的建立数据挖掘解决方案的 步骤是用来整理准备那些用于建立数据模型的数据, SQL2005包含一个 DTS的工作环境以及一些 DTS的工具用于清理验证准备数据,关于 DTS的更多信息请查看 SQL BOL中的 DTS Data Mining Tasks and Transformations 章节。 Adventure 数据库 AdventureWorksDW 数据库是基于一个虚构的自行车制造公司而建立,公司的名称叫做 “ Adventure Works Cyc
6、les”(简称 AW公司)。 AW公司生产并向北美,欧洲和亚洲的商业市场销售金属和复合材 料的自行车,主要的工作都在华盛顿 Bothell完成,那里拥有 500 员工,以及一些地区销售部门遍及各地。 AW公司通过 INTERNET批发和零售他们的产品,本教程中的数据模型实例需要你使用这些网络销售数据作为数据模型。 关于 AW公司数据库的更多信息请参考 SQL Server联机丛书中的如下章节: Sample Databases and Business Scenarios 。 数据库详细信息 网络销售数据构架包含 9242个客户的信息,这些客户分布在 6个国家,并被合并为 3个区域: 南美 (
7、83%) 欧洲 (12%) 澳大利亚 (7%) 该数据库包含三个财政年度的数据: 2002年, 2003年和 2004年。数据库中的产品根据子类别,型号和产品来分类。 商业智能开发工作室 商业智能开发工作室是一套用于创建商务智能项目的工具。由于商业智能开发工作室是创建于 IDE环境中的,在该环境中,你可以在脱机状态下创建一个完整地解决方案。你可以想改多少数据挖掘对象就改多少,但是在你发布该项目前,这些改变将不会反映在服务器上。 一个 SSAS数据库用于集成多种技术,这个数据库作为数据挖掘模型以及OLAP等技术的基础。你可以 使用商业智能 建立和修改一个 SSAS项目并部署这个项目到一个或多个 SSAS服务如果你在开发一个 SSAS项目你也可以使用商业智能开发工作室直接连接数据库,这样你所作的改动可以立刻影响到数据库中。 SQL Server 管理工作室 SQL Server管理工作室是一个行政和脚本工具与 Microsoft SQL Server组件工作的集合。此工作区的不同之处,你是在互联环境中工作的行动是在传播到服务器只要您保存您的工作从商务智能开发工作室中。 在数据被清理并为数据挖掘准备好后,大多数和创建苏局挖掘解决方 案相关联的工作都在商业智能开发工作室中工作。通过使用商业智能开发工作室,你可