电子商务推荐系统主要推荐技术研究(2)
和基于内容的过滤方法相比,协同过滤方法具有如下优点:
(1)对信息内容没有特殊要求。协同过滤不考虑的具体内容类型,因此可以很好地分析图形、图像、视频、音乐等类型的信息。
(2)推荐结果具有一定的新颖性。协同过滤不考虑内容属性的差异,因此推荐结果可能是用户事先预料不到的。
目前,协同过滤技术已经得到了广泛应用。但是网站商品信息量和用户人数在不断攀升,网站的结构也越来越复杂,因此基于协同过滤的推荐系统面临着一系列问题,其中比较受关注的有稀疏性、冷启动和可扩展性3个问题[2]。
(1)数据稀疏性问题。在一些大型网站如亚马逊,用户评价过的项目质量相对网站中总项目数量可谓是冰山一角,这就导致了用户-项目评分矩阵中数据的极度稀疏,当数据量较少时计算用户间的相似度,其结果准确度不高,得到的最近邻集合不可靠。
(2)冷启动。冷启动包括系统冷启动、用户冷启动和项目冷启动。系统冷启动问题主要解决如何在一个新开发的网站上设计个性化推荐系统,从而在网站刚发布的时候就能让用户体验到个性化推荐服务。用户冷启动主要解决的是在没有新用户的行为数据时如果为其提供个性化推荐服务。项目冷启动主要解决将新上架的项目推荐给可能对它感兴趣的用户。
(3)扩展性问题。电子商务网站、商品、用户的数量都在不断增加,推荐系统将面临严重的可扩展性问题。
2.4 混合推荐技术
上述的三种推荐算法各有优缺点,为了更好地提高推荐质量,可以将几种推荐技术组合在一起,尽管在理论上有多种结合方式,但在实际应用中并不是每一种结合方式都有效,因此要根据实际情况选择适当结合方式。
在结合方式上,Robin提出了七种思路[3]:
(1)加权。为多种推荐技术产生的结果设置合理的权重,将各项累加计算出最终结果。
(2)变换。每次推荐要根据实际情况选取一种最优的推荐策略。
(3)混合。将采用每种推荐技术产生的结果都提供给用户,用户可以从中选择自己最满意的项目。
(4)特征组合。组合来自不同推荐数据源的特征,将其应用到一种推荐算法中。
(5)层叠。将采用一种推荐技术得到的结果作为使用第二种推荐技术的基础。
(6)特征扩充。将利用一种技术产生附加的特征信息作为另一种推荐技术的特征输入数据。
(7)元级别。用一种推荐方法产生的模型作为另一种推荐方法的输入。
3 推荐系统的评价指标
评估推荐系统性能的指标有很多,这些指标包括用户满意度、预测精确度、覆盖率、多样性、新颖性、实时性和健壮性等。用户满意度无法离线计算,只能通过用户调查或者是在线实验获得。多样性能够满足用户的广泛兴趣需求,是衡量推荐系统性能的重要指标。新颖的推荐是指给用户推荐那些他们以前没有听说过的项目。很多网站中的内容比如新闻、微博等具有很强的实时性,所以需要在项目还具有时效性时就将它们推荐给用户。推荐系统的实时性包括两个方面,一个方面是推荐系统需要实时地更新推荐列表来满足用户新的行为变化;另一方面是推荐系统需要能够将新加入系统的项目推荐给用户。健壮性指标是用来衡量推荐系统抗击作弊的能力。下面重点讲述覆盖率和预测精确度这两个指标。
覆盖率可以表示推荐项目所覆盖的领域范围。覆盖率最简单的定义是推荐系统推荐的项目占总项目集合的比例,但是该种定义过于粗略,在信息论和经济学中有两个著名的指标可以用来定义覆盖率。
推荐结果的准确率定义为第一个是信息熵:
其中,p(i)是项目 的流行度除以所有项目流行度之和。第二个指标是基尼系数:
其中,ij是按照项目流行度p()从小到大排序的项目列表中第j个物品。
预测精确度可以表示一个推荐系统或者推荐算法预测用户行为的能力。很多提供推荐服务的网站都有一个让用户给项目评分的功能,推荐系统可以利用这些评分记录推测出用户的兴趣模型,为用户提供推荐项目。预测用户对项目的评分行为称为评分预测。评分预测的预测准确度一般通过均方根误差(RMSE)和平均绝对误差(MAE)计算。对于测试集T中的一个用户U和项目i,令rui表示用户U对项目i的实际评分值, 是推荐算法计算出的预测评分,那么RMSE的定义为:
MAE采用绝对值计算预测误差,它的定义为:
网站在提供推荐服务时,一般是给用户一个个性化的推荐列表,这种推荐成为TOPN推荐。TOPN推荐的预测准确率一般通过准确率(Precision)/召回率(Recall)度量。根据用户在训练集上的行为给用户作出的推荐列表用R(u)表示,用户在测试集上的行为列表用T(u)表示。那么推荐结果的召回率定义为:
推荐结果的准确率定义为:
4 结束语
电子商务推荐系统已经取得了很好的研究成果,在亚马逊、淘宝、当当等大型网站都得到了广泛应用,但是电子商务推荐系统仍然存在一些问题,现有的推荐算法仍需要改进和完善。
参考文献:
[1]刘晓波.基于关联规则的电子商务商品推荐系统研究[J].中国市场,2008(52):78-79.
[2]王桂芬.电子商务个恺化推荐系统中协同过滤算法的研究与应用[D].南昌大学,2012.
[3]ROBIN B.Hybrid recommender systems:survey and experiments[R].Department of Information Systems and Decision Sciences,California State University,Fullerton.
期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。
【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。
投稿辅导服务咨询与期刊合作加盟
陆老师联系QQ: 913775405(普刊)
蒋老师联系QQ: 867306987(核心)
刘老师联系QQ: 271374912(核心)
联系电话:18015016272
17327192284
投稿辅导投稿邮箱:zgqkk365@126.com
期刊推荐
- 《课程教育研究》 旬刊 国家级
- 《网络空间安全》(信息安全与技术)月刊 国
- 《价值工程》旬刊 国家级 科技统计源期刊
- 《高教论坛》 月刊 省级
- 《法制与社会》旬刊 省级
- 《中国教育学刊》月刊 14版北大核心
- 《语文建设》 旬刊 14版北大核心
- 《中国绿色画报》 月刊 国家级
- 《社科纵横》季刊 社科类优秀期刊
- 《求索》月刊 14版北大核心期刊
- 《财会月刊》旬刊 14版北大核心
- 《艺术品鉴》 月刊 省级
- 《中华建设》月刊 国家级 建设类优秀期刊
- 《教学与管理》旬刊 北大核心
- 《当代经济》 旬刊 省级
- 《新课程研究》旬刊 省级 教育类优秀学术期
- 《文教资料》 旬刊 省级
- 《学术界》 月刊 双核心
- 《吉林教育》旬刊 省级 教育类学术期刊
- 《中国农业资源与区划》 月刊 14版北大核心
- 《继续教育研究》月刊 北大核心期刊
- 《财经界(学术版)》半月刊 国家级
- 《电影评介》半月刊 14版北大核心
- 《公路交通科技》 月刊 北大核心
- 《新闻传播》月刊 省级 新闻类优秀期刊