毕业论文---微博信息抓取系统
《毕业论文---微博信息抓取系统》由会员分享,可在线阅读,更多相关《毕业论文---微博信息抓取系统(24页珍藏版)》请在毕设资料网上搜索。
1、微博信息抓取系统 第 0 页 共 26 页 微博信息抓取系统微博信息抓取系统 【摘要】【摘要】针对微博中庞大的数据量和用户关系群,本文提出并实现了基于新浪开放平 台与 Oauth2.0 的微博信息抓取系统。 该系统主要实现的功能有: (1)微博大厅的滚动微博及 其评论的抓取(2)微博用户的好友及其相互关系的抓取。通过线程池和数据库实现了微博信 息的抓取和存储, 并通过 prefuse 的 API, 图形化的显示出用户关系。 从实际运行效果分析, 该抓取系统能够满足各种 SNS 应用的内容填充,及网络用户社会网络关系分析。 【关键词】【关键词】Oauth2.0;新浪开放平台;社会网络关系;pre
2、fuse 1 1 引言引言 1.11.1 研研究背景究背景及及意义意义 随着移动互联网的发展,中国迎来了真正的微博时代。微博由于其内容简短,写作门槛 低,发布渠道便捷化,多样化,同步化,使得信息生产趋于零时间。与其他信息交流模式不 同,微博最大的特点在于技术上的便携性。2009 年,3G 牌照的发放标志着移动互联网时代 的到来, 移动手机和互联网这两种在中国发展最为迅速的媒介开始融合在一起, 为微博的快 速扩张做了技术上的准备,与传统博客相比,微博对用户能够产生很强粘性的原因,就在于 其在技术上无可比拟的便携性。用户可以通过各种方式登陆微博,发表微博。尤其是手机和 微博的绑定使得这以新媒介对微
3、博用户的接近性满足了 4A 的元素, 即 Anything, anywhere, anyone,anytime。任何用户可以在任何时间任何地点发布任何内容。从此,人们的信息交 流得到了空前的大解放。微博信息抓取系统通过开放平台的 API 抓取我们所需要的信息, 为各式各样的 SNS1社区应用在运营初期充实其数据量和用户量, 以吸引更多的用户关注和 使用。SNS 社区交友是现在网络用户之间相互交流的最主要方式。当前最流行的 SNS 网络 莫过于开心网,人人网,以及各大微博了,其中以新浪微博的活跃用户量最为庞大,本课题 主要以新浪微博为主要研究和抓取对象, 实现信息抓取的功能。 整个系统的框架拥有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中设计图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业论文 信息 抓取 系统
