网页序列分析系统课程设计论文
《网页序列分析系统课程设计论文》由会员分享,可在线阅读,更多相关《网页序列分析系统课程设计论文(33页珍藏版)》请在毕设资料网上搜索。
1、 目录 第一章 绪论 1 第二章 数据基本分析 . 2 2.1 数据说明 2 2.2 质量分析 2 2.3 基本描述分析. 2 第三章 数据预处理 . 4 3.1 数据处理过程. 4 3.2 数据预处理方法 . 4 3.3 数据预处理结果 . 6 第四章 数据模型构建 . 8 4.1 数据流的构建. 8 第五章 模型结果分析 . 12 5.1 结果的分析处理 12 5.2 结果合理性分析 . 13 第六章 应用系统设计 . 16 6.1 模型接口 16 6.2 人机接口 19 6.3 软件测试 24 结论 . 30 参考文献. 31 结束语 . 32 1 第一章 绪论 由于网站的结构设计, 对
2、特定用户而言信息获取的代价与所经过的浏览路径 长度成正比, 这些位于路径中间的不必要的文档就无疑增加了用户获取信息的代 价。本文利用 Clementine 数据挖掘的方法和技术对用户所访问的页面序列进行 挖掘,构建网页推荐的模型,实现对当前站点排序方式的优化,从而最大限度地 优化用户访问体验,提高当前站点信息获取的整体效率。 关键词 网页推荐;Clememtine 数据挖掘;访问序列 传统的 Web 网站以系统自身为中心,为了容纳大量的信息,以图结构组织网 站,页面之间存在着比较复杂的层次关系。这些预先设计好的浏览路径(网站的 结构)严格按照设计者编辑好的层次返回页面,因此,为了获取特定的信息
3、,从 同一页面出发的所有用户都不得不重复地经过很多与自己毫无关系的、 不希望看 到的中间链接页面,使得用户为了获取少量的信息付出较大的代价。如果在确保 网页内容的前提下,实现网站物理结构的调整和再组织,就可以避免混乱。站点 路径优化实际上就是站点管理者优化其站点结构, 它的出现就是为了提高用户的 访问效率以及用户对站点的忠诚度。 2 第二章 数据基本分析 2.1 数据说明 本数据来自网络信息服务(IIS)网站 和 1999 年 9 月 28 日全天日志记录,每行连续数据表示单个用户 24 小时内浏览网页的记录,连续 数据中的数字表示用户对相应网页的浏览请求, 该访问请求不会被记录成详细的 记
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中设计图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网页 序列 分析 系统 课程设计 论文
