1、 毕 业 设 计 ( 论 文 ) 文 献 综 述毕 业 设 计 ( 论 文 ) 文 献 综 述 毕 业 设 计 ( 论 文 ) 题 目毕 业 设 计 ( 论 文 ) 题 目 基于基于 ASPASP 的个人图书管理系统的个人图书管理系统 文献综述题目文献综述题目 个性化推荐算法的研究综述个性化推荐算法的研究综述 学学 院院 计算机学院计算机学院 专专 业业 软件工程软件工程 姓姓 名名 班班 级级 学学 号号 指导教师指导教师 个性化推荐算法的研究综述 一、前言一、前言 随着互联网的出现和普及,Web 已经成为现代人类获取信息的一个重要途径。我 们也逐渐从信息匮乏的时代进入到信息超载的时代,由于
2、 Web 信息的日益增长,人们 不得不花费大量的时间去寻找自己想要的信息。尤其是网络小说的兴起,使得无数的 写手投入到写小说的队伍中。导致网络上的小说的质量参差不齐。人们很难在其中找 到自己合意的小说。仅通过现有的 Google、百度等搜索引擎来搜索有用信息就好像 是大海捞针。而各个小说网站也不够齐全,各有各的偏重点,很难从一个中找出所有 满意的。这就需要有一个具有良好用户体验的系统,会将海量信息进行筛选、过滤, 将用户最关注最感兴趣的信息展现在用户面前 1。 在此背景下,推荐系统出现了,推荐系统的任务就是解决上述的问题,联系用户 和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能
3、够展现在对他 感兴趣的人群中,从而实现信息提供商与用户的双赢。一个成功个性化推荐系统,往 往选择了合适的推荐算法作为系统核心。 推荐算法在很大程度上决定了推荐系统类型 和性能的优劣。除此之外,能否处理好新用户的冷启动问题和数据过多导致的稀疏问 题,也是推荐系统面临的一大挑战。因此,开发人员在选择一种推荐算法之前,必须 综合考虑实际应用场景、 各推荐算法的特征与性能等要素。 下文选择了几种推荐算法, 就他们的特点以及优缺点进行分析综述。 二、主题二、主题 (1)推荐算法特点 1)基于内容的推荐 基于内容的信息推荐方法的理论依据主要来自于信息检索和信息过滤, 所谓的基 于内容的推荐方法就是根据用户
4、过去的浏览记录来向用户推荐用户没有接触过的推 荐项。 它的核心思想 2是根据推荐物品或内容的元数据, 发现物品或者内容的相关性, 然后基于用户以往的喜好记录,推荐给用户相似的物品。系统首先对物品(图 1 中举 电影的例子)的属性进行建模 3,图中用类型作为属性。在实际应用中,只根据类型 显然过于粗糙,还需要考虑演员,导演等更多信息。通过相似度计算,发现电影 A 和 C 相似度较高,因为他们都属于爱情类。系统还会发现用户 A 喜欢电影 A,由此得 出结论,用户 A 很可能对电影 C 也感兴趣。于是将电影 C 推荐给 A。这种推荐系统 4 多用于一些资讯类的应用上,针对文章本身抽取一些 tag 作
5、为该文章的关键词,继而 可以通过这些 tag 来评价两篇文章的相似度。 图 1 基于内容的推荐举例 2)基于协同过滤的推荐 协同过滤是一种在推荐系统中广泛采用的推荐方法。这种算法 5基于一个“物以 类聚,人以群分”的假设,喜欢相同物品的用户更有可能具有相同的兴趣。基于协同 过滤的推荐系统 6一般应用于有用户评分的系统之中,通过分数去刻画用户对于物品 的喜好。协同过滤被视为利用集体智慧的典范,不需要对项目进行特殊处理,而是通 过用户建立物品与物品之间的联系。这种算法主要分为 3 个步骤 7: 一,用户评分。可以分为显性评分和隐形评分两种。显性评分就是直接给项目评 分(例如给百度里的用户评分),隐
6、形评分就是通过评价或是购买的行为给项目评分 (例如在有啊购买了什么东西)。 二,寻找最近邻居。这一步就是寻找与你距离最近的用户,测算距离一般采用以 下三种算法: 1.皮尔森相关系数。 2.余弦相似性。 3 调整余弦相似性。 调整 余弦 相似性似乎效果会好一些。 三,推荐。产生了最近邻居集合后,就根据这个集合对未知项进行评分预测。把 评分最高的 N 个项推荐给用户。 这种算法存在性能上的瓶颈,当用户数越来越多的 时候,寻找最近邻居的复杂度也会大幅度的增长。 图 2 协同过滤推荐流程 3)基于关联规则推荐 基于关联规则 8的推荐是以关联规则为基础,把已购商品作为规则头,规则体为 推荐对象。关联规则挖掘可以发现不同商品在销售过程中的相关性,在零售业中已经 得到了成功的应用。 关联规则就是在一个交易数据库中统计购买了商品集 X 的交易中 有多大比例的交易同时购买了商品集 Y,其直观的意义就是用户在购买某些商品的时 候有多大倾向去购买另外一些商品。比如购买牛奶的同时很多人会同时购买面包。 4)其他推荐 基于效用