1、 XXXXXXX 学院学院 专科毕业论文 题 目 搜索模块的研究与开发 学生姓名 XXXXX 专业班级 XXXXXXXX 学 号 XXXXXXXXXX 院 (系) XXXXXXXXXXXXXX 指导老师 XXX 完成时间 20XX 年 X 月 XX 日 I 搜索模块的研究与开发 摘 要 企业在激烈的竞争中如果不能或不会利用互联网的话, 那是会被迟早淘汰掉 的。企业利用互联网的一个实例就是网站。个人如果想在互联网展现自己的话也 是频繁使用个人网站形式。网站相对于应用程序的一个主要的好处就是部署简 单,升级方便,制作成本低,PS,你不会指望用户想看一条新闻而下一个客户端 软件吧。 搜索在当今互联网
2、时代已成为不可或缺的一部分, 它就相当于一个目录, 可以方便的导航到自己喜欢的部分。如果本论文没有目录的话,假如你想找这篇 论文内的核心算法部分,你就需要拖着长长的滚动条上下来回翻动,你会感慨如 果有一个目录来导航该多好啊。更进一步,如果有一个班的论文要看,如果想要 找到里面的一篇某某人写的文章,需要一篇一篇打开看吗?如果有 1 万篇文章 呢?搜索尤其适合于这种内容庞大,又有其特点的方面。 互联网是一个神奇的东西, 世界上第一个网站由蒂姆 伯纳斯-李创建于 1991 年 8 月 6 日1,在 2011 年 3 月的调查中,Netcraft 在侦测时收到了 298,002,705 个站点的反馈信
3、息。我国域名总数为 3,388,575 个。2010 年末全国总人口数为 134100 万人2, 中国网民规模预计为 4.77 亿, 互联网普及率为 35.6%, 截至 2011 年 3 月 28 日, 中国大陆 IPv4 地址数量约为 3.18 亿个, 居全球第二位。 就在 2011 年 2 月 3 日,全球互联网数字分配机构(IANA)正式宣布已经将 IPv4 地址库剩 余的 5 个 A 地址平均分配给包括 APNIC 在内的五个地区性互联网注册管理机构 (RIR) ,标志全球现有的 IPv4 地址资源已经分配完毕,流传多年的“IPv4 地址 耗尽”预言终于成真3。 关键字 搜索模块/导航
4、与搜索/C# 搜索模块的研究与开发 II 目目 录录 摘 要 . I 目 录 II 1 搜索引擎简介 . 1 1.1 搜索引擎发展史 . 1 1.2 搜索引擎的工作原理 2 2 程序设计 . 3 2.1 程序原理. 3 2.2 结构设计. 4 2.2.1 数据类结构.5 2.2.2 逻辑类结构6 2.2.3 接口类结构8 3 接口文档 . 9 3.1 接口 9 3.2 事件 .10 结束语 . 11 致 谢 .12 参考文献13 附 录 .14 1 1 1 搜索引擎简介搜索引擎简介 1.1 搜索引擎搜索引擎发展史发展史 1990 年初当时万维网还未出现,为了查询散布在各个分散的主机中的文件,
5、曾有过 Archie、Gopher 等搜索工具,随着互联网的迅速发展,基于 HTTP 访问 的 web 技术的迅速普及,他们就不再能适应用户的需要。在 1994 年 1 月,第一 个既可搜索又可浏览的分类目录 EINet Galaxy(Tradewave Galaxy)上线,它还 支持 Gopher 和 Telnet 搜索。同年 4 月,Yahoo 目录诞生,随着访问量和收录链 接数的增长, 开始支持简单的数据库查询。 这就是我们说的早期的目录导航系统, 他们的缺点是网站收录/更新都要靠人工维护,所以在信息量剧增的条件下,就 不是非常受用了。 1994 年 7 月,Lycos 推出了基于 ro
6、bot 的数据发掘技术,并支持搜索结果相 关性排序,并且他第一个开始在搜索结果中使用了网页自动摘要。Infoseek 也是 同时期的一个重要代表,他们是搜索引擎史上一个重要的进步。 1995 年,一种新的搜索引擎工具出现了中介搜索引擎(Meta Search Engine)或称为元搜索引擎,第一个中介搜索引擎是华盛顿大学的学生开发的 Metacrawler。 用户只需提交一次搜索请求, 由中介搜索引擎负责转换处理后提交 给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果, 集中起来处理后再返回给用户。 1995年12月才登场亮相的AltaVista推出了大量的创新功能使它迅速到达当 时搜索引擎的顶峰,它第一个支持自然语言搜索的搜索引擎,具备了基于网页内 容分析,智能处理的能力,第一个实现高级搜索语法的搜索引擎(如 AND、OR、 NOT 等),同时 AltaVista 还支持搜索新闻组,搜索图片等具有划时代意义的功 能。同时期还有 inktomi、HotBot 等搜索引擎。 1997