基于内容的个性化新闻推荐系统数据抓取与实现-开题报告
-
资源ID:1453196
资源大小:41.50KB
全文页数:4页
- 资源格式: DOC
下载积分:50金币
快捷下载

账号登录下载
三方登录下载:
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
|
基于内容的个性化新闻推荐系统数据抓取与实现-开题报告
1、 学士学位论文开学士学位论文开题题报告报告 论文题目: 基于内容的个性化新闻推荐系统数据抓取与实现 (外 文): Data Capture for Content-based News Recommendation System and System Implementation 姓 名: 学 号: 院 系: 信息科学学院 专 业: 信息管理与信息系统 指导教师: 毕毕 业业 论论 文文 开开 题题 报报 告告 1研究意义 随着互联网的迅猛发展,网络数据量不断增长,新闻资讯的数量以近乎爆炸的速度增长,大量 的新闻资讯网站为人们提供了充足的信息,与此同时,也为用户带来了新的问题与挑战。用户往往
2、不会只喜好或需要一个单一分类的新闻信息,而是一般都同时关注数个类别的新闻,这就需要用户 同时关注数个网站的更新情况,而如此做法,无论是时间上,还是精力上,都会给用户带来负担。 广大网络新闻的读者正受到“信息过载”和“信息迷航”问题的困扰。 个性化新闻推荐系统将个性化推荐应用于新闻信息的推荐。它根据用户的兴趣特点和行为, 使用户从海量信息中轻松获得自己感兴趣的内容,并帮助用户发现感兴趣的内容,节约了大量的时 间成本,充分实现了新闻网站及网站用户的利益双赢,具有广阔的应用前景。 目前,众多的个性化新闻推荐系统中具有代表性的有基于主题的个性化新闻推荐系统,基于内 容推荐,协同过滤等推荐方法。 所谓基
3、于用户的协同过滤的新闻推荐方法的依据是: 相同兴趣的用户关注的新闻具有较强的推 荐价值。它根据用户之间历史行为选择的相似性,识别出一组具有相似兴趣的用户,将他们之间最 感兴趣新闻的推荐给对方。但是,协同过滤是一种基于存储的算法,需要给定足够的信息。否则, 随着用户以及新闻数量的增加,数据稀疏性的问题就随之而来,从而导致冷启动问题,最终降低了 推荐的效果。 基于内容推荐的主要思想是:根据新闻内容,结合用户的历史行为数据对用户进行兴趣建模, 通过新闻内容的特征属性匹配计算出候选新闻与目标用户兴趣间的相似度并进行排名, 将相似度排 名最高的新闻推荐给目标用户。其优势是不需要其它用户的数据,没有冷开始
4、问题和稀疏问题,能 为具有特殊兴趣爱好的用户进行推荐,没有新项目问题。但是,只有当候选新闻与用户偏好新闻相 似时才推荐,有“过拟合”现象,用户资料模型可能随着用户的偏好改变而发生变化。 本课题的目标是建立这样一个推荐系统:使用基于内容的推荐方法,将被推荐对象(即新闻) 用其内容的特征(如关键词、关键词个数、主题等)进行表示,系统通过学习用户的兴趣,比较用 户模型(可以主要是通过记录用户浏览新闻的分类、阅读的时间、每天的次数、是否分享等因素来 构建)与被推荐新闻的的相似度来产生推荐结果,无需强制用户对新闻做出评分。同时设置时间控 制,不断引入最新新闻,并过滤旧新闻。 通过这样的新闻推荐系统,提高了新闻推荐的准确率,使用户可以轻松得到自己感兴趣的新闻, 对众多新闻网站来说具有一定的商业价值。 2研究内容 本课题的目标是基于主题的混合算法向用户提供个性化的新闻推荐服务。根据用户或