基于Hdoop平台的个性化新闻推荐系统的设计与实现-开题报告
-
资源ID:1443302
资源大小:58KB
全文页数:6页
- 资源格式: DOC
下载积分:50金币
快捷下载

账号登录下载
三方登录下载:
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
|
基于Hdoop平台的个性化新闻推荐系统的设计与实现-开题报告
1、 毕业设计(论文)开题报告 题 目: 基于 Hadoop 平台的个性化 新闻推荐系统设计与实现 系 别: 电气与计算机工程系 专业班级: 姓 名: 学 号: 指导教师: 一、一、 选题的背景和意义(所选课题的历史背景、国内外研究现状和发展趋势) 在计算机信息计算高速发展的今天,信息科技的不断进步。人们已经将互联网作为一 个日常沟通,生活不可或缺的平台,互联网在快捷。方便地带来大量信息的同时,也带来 了一大推的问题;诸如信息量过大,人们难以消化难以选择;信息真假难辨;信息形式不 一致难以处理等等。如何快速。准确的获得对人们有价值的网络信息成为了当代一个需要 解决的问题,正因为这些问题促使着数据挖
2、掘领域的出现与不断的发展。技术地发展随之 而生了大量各式各样的互联网模式,自然而然地网上浏览新闻成为人们生活的一部分,面 对海量的新闻如何帮用户推荐出用户想看的,过滤掉用户不敢兴趣的,新闻推荐系统能让 人们的生活更高效、更快捷。 现在人们的生活节奏越来越快,在线实时观看高清电影,在几年前还是难以想象的, 现在却变得已习以为常了。网络的接入方式也从有线连接向高速无线连接的方式转变。毫 无疑问,网络带宽和大规模存储技术的高速持续发展,为大数据时代提供了廉价的存储和 传输服务。信息基础设施持续完善,包括网络带宽的持续增加、存储设备性价比不断提升, 犹如高速公路之于物流,为大数据的存储和传播准备物质基
3、础。信息的时效性在当今显得 尤为重要,如何能从超大的新闻量的数据库中找到及时的符合用户关心的话题的新闻,如 今也成为各大新闻门户网站所关注的问题,也成为了各大新闻巨头吸睛的关键点。 新闻作为大家了解世界了解外界信息的桥梁,在生活中的作用体现得尤为重要。目前, 我国的网络新闻与西方发达国家相比,实力悬殊。据统计,在整个因特网的信息输入、输 出的流量中,我国目前仅占 01和 005,美国已有 55的杂志推出了网络版,而 我国报刊上网率只有 10左右。 现在全球 80以上的网上信息和 95以上的服务信息由美 国提供。全球具有较大影响的媒体,如 cnn、纽约时报、华盛顿邮报、华尔街日报、今日美 国等许
4、多新闻网站, 不论从访问量到访问人群方面均可称上 “世界最有影响力的新闻网站” 。 2014 年,互联网的三大巨头腾讯、网易和搜狐先后公布,新闻客户端的用户超过了 1 亿用 户,与 2012 年相比有明显的增加,取得了非常大的成就。除此之外,根据调研公司发布的 数据,新闻客户端排名前三位是搜狐、网易和腾讯,之后出现的是凤凰、今日头条、新浪 新闻、百度新闻和央视新闻。前三名的新闻客户端用户数量远远超过了其他新闻了客户端, 占据了上市场的大部分位置,这也说明了新闻客户端在我国发展得速度非常快,竞争压力 也非常大。 二、二、 研究的基本内容和拟解决的主要问题 该系统设计的目标是通过于 Hadoop 平台采用 Java 语言开发,根据需求分析与系统功 能设计目标,结合实际情况本系统功能模块拟设计如下几个功能模块: (1)将新闻上传至 HDFS 上。 (2)利用 Hadoop 将 HDFS 上的数据进行分词处理,并批量聚类新闻数据,将新闻聚类成 簇 (3)分析聚类