毕业设计---网络爬虫设计与实现
《毕业设计---网络爬虫设计与实现》由会员分享,可在线阅读,更多相关《毕业设计---网络爬虫设计与实现(36页珍藏版)》请在毕设资料网上搜索。
1、 毕业设计(论文)说明书毕业设计(论文)说明书 学学 院院 软件学院软件学院 专专 业业 软件工程软件工程 年年 级级 2007 姓姓 名名 指导教师指导教师 毕业设计(论文)任务书毕业设计(论文)任务书 题目:网络爬虫设计与实现 一、原始依据(包括设计或论文的工作基础、研究条件、应用环 境、工作目的等。 ) 互联网是一个庞大的非结构化的数据库, 将数据有效的检索并组织呈现出来 有着巨大的应用前景。 搜索引擎作为一个辅助人们检索信息的工具成为用户访问 万维网的入口和指南。但是,这些通用性搜索引擎也存在着一定的局限性。不同 领域、不同背景的用户往往具有不同的检索目的和需求,通用搜索引擎所返回的
2、结果包含大量用户不关心的网页。 所以需要一个能基于主题搜索的满足特定需求 的网络爬虫。 为了解决上述问题,参照成功的网络爬虫模式,对网络爬虫进行研究,从而 能够为网络爬虫实现更深入的主题相关性,提供满足特定搜索需求的网络爬虫。 二、参考文献 1Winter中文搜索引擎技术解密:网络蜘蛛 M北京:人民邮电出版社, 2004 年 2Sergey 等The Anatomy of a Large-Scale Hypertextual Web Search Engine M北京:清华大学出版社,1998 年 3WisenutWiseNut Search Engine white paper M北京:中国
3、电力出版 社,2001 年 4Gary R.Wright W.Richard StevensTCP-IP 协议详解卷 3:TCP 事务协议, HTTP,NNTP 和 UNIX 域协议 M北京:机械工业出版社,2002 年 1 月. 5罗刚 王振东自己动手写网络爬虫M北京:清华大学出版社,2010 年 10 月. 6李晓明,闫宏飞,王继民搜索引擎:原理、技术与系统华夏英才基金 学术文库M北京:科学出版社,2005 年 04 月. 三、设计(研究)内容和要求(包括设计或研究内容、主要指标 与技术参数,并根据课题性质对学生提出具体要求。 ) 本课题的主要目的是设计面向主题的网络爬虫程序, 同时需要满
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中设计图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 网络 爬虫 设计 实现
