电子商务推荐系统主要推荐技术研究
摘要:推荐系统作为解决信息超载问题的有效工具,受到国内外研究者的广泛关注。本文简要描述了推荐系统的定义以及作用,重点介绍了基于规则的推荐、基于内容的推荐和协同过滤推荐这三种算法,分析了每种算法的优缺点,并描述了混合推荐技术的基本思路。文中列出了几种评价推荐系统性能的重要指标。
关键词:电子商务;推荐算法;评价指标
中图分类号:TP311
目前网络交易已逐渐得到人们的认可,成为人们日常生活中的重要部分。众多企业开始创建电子商务网站,希望通过网络交易的低廉成本获得更大的商业利润。目前,电子商务网站数量不断增多,网站的用户对其提供的服务质量要求也越来越高。因此更好地了解用户的需求,提供更优质、个性化的服务成为各大电子商务网站竞争的有利条件。推荐系统就是在这样的环境中产生的。
1 电子商务推荐系统的作用
著名的电子商务网站亚马逊积极地应用和推广了个性化推荐系统,至于推荐系统究竟给亚马逊带来了多少经济利润,目前亚马逊官方还没有明确公开过,但亚马逊的前科学家Gerg Linden在他博客里曾说过,在他离开亚马逊的时候,亚马逊至少有20%(之后的一篇博文则变更为35%)的销售额来自推荐算法。研究表明,电子商务的销售行业,尤其在书籍、电影或者日用百货等商品价格相对较低而且种类繁多的行业,推荐系统能有效提高企业的销售额。推荐系统之所以能给商家带来巨大的经济效益,其优势在于它能分析用户的行为数据,概括出用户的爱好特征,从而可以根据用户自身的需求提供推荐列表项目。如果网站中的商品或者用户兴趣倾向发生改变, 推荐系统也可以进行实时更新,自动改变推荐列表。
推荐系统的作用主要有几下几点[1]:
(1)挖掘潜在用户。用户购买意向不强时可能只是随意地浏览商品,如果此时推荐系统的推荐结果能够引起用户的兴趣,浏览者就很有可能变成购买者。
(2)提高网站连锁销售的几率。用户在网购过程中,如果推荐系统能向用户提供一些他极有可能会购买的商品,这样就能够促进商品的连锁销售。比如那些用户需要但一时还没想起购买的商品。
(3)增加忠实用户的数量。如果推荐系统能够为用户提供优质的服务,就会增加用户对网站的访问次数,最终发展成为忠实顾客。
2 主要的推荐算法
2.1 基于规则的推荐
基于规则的推荐就是通过挖掘关联规则寻找可以用于推荐的项目。所谓关联规则挖掘是一种在大规模交易中识别类似规则关系模式的通用技术。这种技术的典型应用就是从超市里经常购买的商品中发掘成对或成组的商品。假如用集合表示所有商品,集合T表示已经购买的商品,其中,集合T是集合P的子集。关联规则经常写成X=>Y的形式,X和Y都是P的子集,并且X和Y交集为空。关联规则X=>Y表示只要交易T中包含X集合中的元素,那么Y集合中的元素就非常有可能也在相同的交易T中。关联规则的衡量标准是支持度和可信度。关联规则X=>Y的支持度是X和Y同时出现在一次交易中的概率,可信度是对应给定条件X时Y的条件概率。用公式可表示为:
;
。
简单的关联规则推荐算法过程如下:
(1)使用关联规则发现算法,确定与目标用户相关的关联规则X=>Y的集合,即目标用户买过或者喜欢的集合X中的所有元素;
(2)计算出这些规则的Y集合中用户没有购买过的商品集S;
(3)按照规则的可信度从高到低的顺序对集合S中的商品进行排序。如果多条规则都推荐一个商品,则选取可信度最高的那条规则;
(4)输出排序列表中最前面的N个元素作为推荐结果。
2.2 基于内容的推荐算法
基于内容的推荐:根据用户历史行为信息(如评价、分享、收藏过的文档)构造该用户的爱好倾向模型,计算其他推荐项目与爱好倾向模型中文档的相似度,将比较相似的几个项目推荐给用户。基于内容的推荐系统的典型应用就是文档推荐,通过比较待选文章的主要关键词和用户过去高度评价过的其他文章中出现的关键词来推荐新文章。这些关键词能够明确表现出文档的特征。
基于内容的推荐算法依赖项目和用户兴趣偏好的额外信息,但是该算法不需要大量的用户评分记录,即使只有一个用户也可以产生推荐列表,因此不会受到稀疏性问题的影响。另外该推荐算法根据的是项目或用户偏好的描述信息,因此推荐结果能够解释为什么系统会选择这些项目推荐给用户,让用户能更直观的感受推荐系统带来的便利。但是基于内容的推荐算法仍然具有一定的局限性:
(1)对内容分析的不够深入。在推荐网页时,仅仅看文本内容可能无法确定网页的质量和偏好,比如美观、可用性、时效性或者超链接的正确性都能够决定网页的质量。另外目前的超文本文档中越来越多地包含多媒体元素的信息,比如图片、音频和视频序列,纯粹的基于内容的推荐算法却无法收集这些类型(图形、图像、音频、视频)的内容信息。
(2)推荐结果缺乏新颖性。基于内容的推荐系统是给用户推荐那些与他评价较高的项目相似的项目,因此推荐结果往往与用户熟知的项目太相似,缺乏新颖性。
(3)获取评分存在一定的困难。尽管基于内容推荐技术不需要大量的用户雀替,但至少需要来自用户的初始评分集合,一般来说是显式的“喜欢”和“不喜欢”标注集合。在所有的过滤技术中,推荐精确度会随着评分数量增加而提高,但在很多领域,用户可能不愿意在使用系统之前就给过多的项目评分。
2.3 协同过滤推荐算法
协同过滤以其特有的优势成为众多专家和学者关注的焦点,目前在各大电子商务网站得到广泛应用。该算法的思想是:根据已有的评分记录计算用户或者项目的相似度;根据相似性结果找出当前用户(或项目)的最近邻;根据最近邻中用户(或项目)的评分预测当前用户评分情况,最终根据评分值大小确定是否将该项目推荐给用户。
协同过滤推荐算法可以分基于用户的协同过滤(UCF)与基于项目的协同过滤(ICF)两种。这两个算法的共同点在于二者都基于用户-项目评分矩阵来建立推荐系统模型,进而为用户提供推荐服务的。区别在于UCF是根据用户之间的相似性找到目标用户的最近邻集,也就是在评分矩阵的行之间进行计算的,然后根据该集合中用户的评分情况确定将哪些项目推荐给用户。而ICF则是通过分析项目之间的相似性,也就是在评分矩阵的列与列之间进行计算,最终确定将哪些项目推荐给用户。
期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。
【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。
投稿辅导服务咨询与期刊合作加盟
陆老师联系QQ: 913775405(普刊)
蒋老师联系QQ: 867306987(核心)
刘老师联系QQ: 271374912(核心)
联系电话:18015016272
17327192284
投稿辅导投稿邮箱:zgqkk365@126.com
期刊推荐
- 《课程教育研究》 旬刊 国家级
- 《网络空间安全》(信息安全与技术)月刊 国
- 《价值工程》旬刊 国家级 科技统计源期刊
- 《高教论坛》 月刊 省级
- 《法制与社会》旬刊 省级
- 《中国教育学刊》月刊 14版北大核心
- 《语文建设》 旬刊 14版北大核心
- 《中国绿色画报》 月刊 国家级
- 《社科纵横》季刊 社科类优秀期刊
- 《求索》月刊 14版北大核心期刊
- 《财会月刊》旬刊 14版北大核心
- 《艺术品鉴》 月刊 省级
- 《中华建设》月刊 国家级 建设类优秀期刊
- 《教学与管理》旬刊 北大核心
- 《当代经济》 旬刊 省级
- 《新课程研究》旬刊 省级 教育类优秀学术期
- 《文教资料》 旬刊 省级
- 《学术界》 月刊 双核心
- 《吉林教育》旬刊 省级 教育类学术期刊
- 《中国农业资源与区划》 月刊 14版北大核心
- 《继续教育研究》月刊 北大核心期刊
- 《财经界(学术版)》半月刊 国家级
- 《电影评介》半月刊 14版北大核心
- 《公路交通科技》 月刊 北大核心
- 《新闻传播》月刊 省级 新闻类优秀期刊