欢迎来到毕设资料网! | 帮助中心 毕设资料交流与分享平台
毕设资料网
全部分类
  • 毕业设计>
  • 毕业论文>
  • 外文翻译>
  • 课程设计>
  • 实习报告>
  • 相关资料>
  • ImageVerifierCode 换一换
    首页 毕设资料网 > 资源分类 > DOC文档下载
    分享到微信 分享到微博 分享到QQ空间

    网络爬虫毕业设计(含外文翻译)

    • 资源ID:1418394       资源大小:1.15MB        全文页数:69页
    • 资源格式: DOC        下载积分:100金币
    快捷下载 游客一键下载
    账号登录下载
    三方登录下载: QQ登录
    下载资源需要100金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

    网络爬虫毕业设计(含外文翻译)

    1、 I 摘要 目前即使通讯软件在平时的生活中有着十分广泛的应用, 但是对绝大部分的软件 来说,都必须应用在互联网上,必须在一个 INTERNET 环境下才能使用。有时候单位 内部的员工,同学,在没有互联网环境下或因其他原因希望不用 INTERNET 就可以进 行信息交互,这样开发局域网通信就有了必要性。本文提出了局域网信息交互的需求, 并详细对网络协议 TCP/IP 协议族进行了介绍和研究, 如 TCP, UDP, 广播等相关技术。 并对网络信息交互原理惊醒了说明,在此基础上利用 SOCKET 网络编程实现了一种基 于 WINDOWS 平台的局域网信息交互功能。 网络爬虫是一种自动搜集互联网信息

    2、的程序。 通过网络爬虫不仅能够为搜索引擎采集网 络信息, 而且可以作为定向信息采集器, 定向采集某些网站下的特定信息, 如招聘信息, 租房信息等。 本文通过 JAVA 实现了一个基于广度优先算法的多线程爬虫程序。为何要使用多线 程,以及如何实现多线程;系统实现过程中的数据存储;网页信息解析等。 通过实现这一爬虫程序,可以搜集某一站点的 URLs,并将搜集到的 URLs 存入数 据库。将解析的网页存入 XML 文档。 【关键词】 网络爬虫; SOCKET 编程;TCP/IP;网络编程 ;JAVA II Abstract Instant message software in our daily

    3、lives has a very wide range of application , However ,most of the software must be used in the Internet , and it must be used in a Internet environment .Sometimes Internal staff, students ,may not have the Internet environment or other reasons do not wish to be able to communicate on the Internet .T

    4、his development will have a need for LAN communication program .Therefore ,this paper presents the needs of local area network exchange information Software ,And details of the network protocol TCP/IP protocol suite are introduced and research such as TCP, UDP, broadcast ,and other technologies . an

    5、d network information exchange theory is discussed . Base on this condition I use of Socket Network programming based on Windows platform to develop a LAN chat application . SPIDER is a program which can auto collect informations from internet. SPIDER can collect data for search engines, also can be

    6、 a Directional information collector, collects specifically informations from some web sites, such as HR informations, house rent informations. In this paper, use JAVA implements a breadth-first algorithm multi-thread SPDIER. This paper expatiates some major problems of SPIDER: why to use multi-threading, and how to implement multi-thread; data structure; HTML code parse. etc. This SPIDER can collect URLs from one web site, and store URLs into database. 【KEY WORD】SPIDER; JAVA;;Socket programmi


    注意事项

    本文(网络爬虫毕业设计(含外文翻译))为本站会员(毕***)主动上传,毕设资料网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请联系网站客服QQ:540560583,我们立即给予删除!




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们
    本站所有资料均属于原创者所有,仅提供参考和学习交流之用,请勿用做其他用途,转载必究!如有侵犯您的权利请联系本站,一经查实我们会立即删除相关内容!
    copyright@ 2008-2025 毕设资料网所有
    联系QQ:540560583