1、 1 电子商务中数据挖掘方法研究与应用电子商务中数据挖掘方法研究与应用 一、一、综述综述 电子商务是指个人或企业通过 Internet 网络,采用数字化电子方式进行商务数据交换和开展 商务业务活动。电子商务与传统商务相比具有投资低廉、方便有效、安全可靠、时空限制等优势, 因而电子商务成为当今国际经济领域活动中的主流,目前在国内外已经得到广泛的应用,像网上购 物、网上银行、网络结算等。而 Internet 的电子商务迅猛发展使信息量急剧增长,从而导致信息 过量,这些过量的数据背后隐藏着许多重要的认识,出现了“数据爆炸但知识贫乏”的现象,因此, 需要有新一代的技术和工具来对海量数据进行合理及更高层
2、次的分析,做出归纳性推理,从中挖掘 出潜在的模式,提取有用的知识,帮助电子商务企业决策者调整市场策略,进行商业预测,做出正 确的决策,从而提高信息利用率,降低风险,给企业带来巨大的利润。数据挖掘就是为顺应这些需 要应运而生发展起来的数据处理技术。 数据挖掘(Data Mining,简称 DM) ,也称知识发现,是从海量数据中提取有价值信息的工具, 描述为从数据中抽取出隐含的、具有潜在用途的、人类可理解的样式。数据挖掘通过发掘有用的新 规律和新概念,提高人们对大量、看似不相关数据的更加深层次的理解、认识以及应用。数据挖掘 技术是目前国际上数据库 信息决策领域最前沿的研究方向之一,同时也是学术界和
3、商业界共同关 注的热点问题。 数据挖掘技术的发展以及数据库应用的普遍,数据的数量越来越多,数据如同爆炸般增长,这 些数据中隐藏着许多重要的信息,为了更好的利用这些数据,就要进行筛选和分析。数据库系统虽 然可以进行录入,查询,统计等功能,但是不能发现数据中存在的关系和规则,无法对数据现有的 情况进行分析,从而预测出未来的走向和发展,缺乏挖掘隐藏在数据背后之间的关联。 ,导致了数据 虽多但是信息缺乏的现象。 数据可以用数据库来存储数据,用机器的方法来分析,使得数据库中的知识发下的产生, 。 1989 年 8 月在美国底特律召开的第 11 届国际人工智能联合会议的专题讨论会上首次出现 KDD 这个术
4、语。数据挖掘使数据库技术进入了一个更高的阶段,它能对过去的数据进行查询和遍历,能 够找出过去数据间的潜在联系,从而促进信息的传递。数据挖掘是数据仓库系统中最重要的部分。 数据挖掘,就是从大型数据库的数据中提取人们有兴趣的知识。这些知识是隐含的的有用信息,提 取的知识可表示为规律(Regulations),模式(Patterns)概念(Concepts),等形式。事实上,更 广泛说,数据挖掘就是在一些事实的集合中寻找模式的决策支持过程。数据挖掘是一个多学科的交 叉领域,它涉及到数据库技术、人工智能、神经网络、统计学、模式识别、机器学习、知识库系统、 信息检索、高性能计算和数据可视化等学科。 现在为止,会议召开多次,由原来的专题讨论变成了国际大会,研究重点也转向了系统应用, 注重了发现策略和技术集成以及多个学科间的渗透。公司大多意识到数据挖掘在提高公司收益,公 司决策能力,企业竞争力方面发挥的重要作用,也发现数据挖掘在统计学,知识工程,数据库方面 的广泛应用。使得专家对于它产生了浓厚的兴趣。 数据挖掘的常见模型有一下几种: (1)分类发现模型。 分类的目的是学会一个分类函数(分类器) ,