1、基于挖掘的电子商务应用研究 摘要 近年来,随着 Internet/Web 技术的快速普及和迅猛 发展 ,使各种信息可以以非常低的成本在 网络 上获得,由于 www 在全球互连互通,可以从中取得的数据量难以 计算 ,而且 www 的发展趋势继续看好,特别是 电子 商务的蓬勃发展为网络应用提供了强大支持,如何在 www 这个全球最大的数据集合中发现有用信息正在成为数据挖掘研究的热点。 关键词 web 数据挖掘 电子商务 一、引言 随着以数据库、数据仓库等数据仓储技术为基础的信息系统在各行各业的应用,使海量数据不断产生。随之而来的问题是如此多的数据让人难以消化,无法从表面上看出他们所蕴涵的有用信息。
2、如何从大量的数据中找到真正有用的信息成为人们关注的焦点,数据挖掘技术也正是伴随着这种需求从研究走向应用。 近年来,随着 Internet/Web 技术的快速普及和迅猛发展,使各种信息可以以非常低的成本在网络上获得,由于 Internet/WWW 在全球互连互通,可以从中取得的数据量难以计算,而且 Internet/WWW 的发展趋势继续看好, 特别是电子商务的蓬勃发展为网络应用提供了强大支持,如何在 WWW 这个全球最大的数据集合中发现有用信息无疑将成为数据挖掘研究的热点。 二、 Web 挖掘概述 数据挖掘就是从数据库中抽取隐含的、以前未知的、具有潜在应用价值的信息的过程。 Web 挖掘是将数
3、据挖掘的思想和方法应用到 Web页面内容、页面之间的结构、用户访问信息等各种 Web 数据中,从中抽取隐含的、以前未知的、具有潜在应用价值的信息。 Web 挖掘对在浩瀚的网络中发现有价值的知识、改进网站设计、提供更好的网上服务有重要的作用。 Web 挖掘是针对包括 Web 页面内容,页面之间的结构,用户访问信息等在内的各种 Web 数据源。在一定基础上应用数据挖掘的方法以发现有用的隐含的知识的过程。 Web 挖掘与传统的数据挖掘相比有其自身的特点。 Web 本身是半结构化或无结构的数据,缺乏机器可理解的语义 ,Web 挖掘的对象是大量,异质,分布的 Web 文档,对 Web 服务器上的日志、用户信息等数据所开展的挖掘工作也属于 Web 数据挖掘的范畴。 Web 信息的多样性决定了挖掘任务的多样性。按照 Web 处理对象的不同 ,一般将 Web 挖掘分为三类 : Web 内容挖掘, Web 结构挖掘和 Web使用记录挖掘。 1.Web 内容挖掘 Web内容挖掘是指对 Web页面及后台交易数据库进行挖掘,从 Web文档内容及其描述中的内容信息中获取有价值的知识的过程。它是数据挖掘技术在网络信息处理上的应用,主要方法有 IR( information retrieve)