基于用户聚类的异构社交网络推荐算法(2)
GCCR算法旨在根据弱关系社交网络中用户对不同主题的兴趣程度,为用户推荐其可能喜欢的主题内容.通过分析从用户-主题喜好矩阵和用户自身发表内容的中体现出的用户喜好信息,并将二者综合利用,提高在稀疏数据集上的推荐效果.同时利用图摘要算法中的类模糊性,保证冷启动条件下推荐的多样性.GCCR主要步骤包括预处理、核心聚类、全用户聚类、主题推荐阶段.
(1)预处理阶段.筛选出兴趣向量非零值比例大于密度阈值A的核心用户集合.根据核心用户对应的兴趣向量提取构造出原兴趣矩阵的密集子矩阵.
(2)核心聚类阶段.根据核心用户的兴趣矩阵构成的订阅关系图进行图摘要计算,利用摘要迭代的过程生成满足模糊度和独立性约束的核心聚类.
(3)全用户聚类阶段.利用上一步中生成的核心聚类,提取核心聚类内容特征向量,同时提取非核心用户所发表微博的内容特征向量,根据内容特征向量的相似度不断迭代,将非核心用户加入到己有的聚类集合中,直至完成对所有用户的聚类.
(4)根据聚类结果以及每个用户在聚类内部的相似度和类兴趣特征,生成类成员内部的推荐向量,同时根据不同主题在不同聚类间的兴趣差异,形成跨类推荐向量,两者综合排序之后的结果作为最终推荐结果.
推荐算法执行过程中,对于训练数据集进行(1)(3)离线计算生成聚类结果和类兴趣向量,对于任何新加入的用户,只需进行(3)中的聚类归属计算和(4)中的推荐过程.通过将离线和在线处理运算尽可能的分离,可以使算法达到更高的在线推荐计算效率.
4聚类推荐算法
4.1问题建模
(1)对于N个用户,M个主题,可分别表示为用户^集U-{叫,^2,}与^主^题集S-{^152,*…,Sm}对于每个用户M,,有对应兴趣向量V,=(fli,《2,…,m),所有用户的兴趣向量可构成NXM的兴趣矩阵m,对于存在订阅关系的用户w,和主题{,对应元素a,,>0,表示用户m,对主题{兴趣度,如不存在订阅关系,则对应一
(2)基于兴趣矩阵m的兴趣图Gm可表示为有向图G(Y,E),其中V为用户和主题节构成的集合:V-UUS,
(3)对于每个用户m,定义其兴趣密度值心,m为兴趣向量V中非零元素所占的比例,那么对于<i,(M,)大于密度阈值A(通常取10%)的用户M,定义为核心用户
由核心用户兴趣向量构成的兴趣矩阵为密集子矩阵m%基于密集子矩阵可构造出核心兴趣图Gw.
4.2核心聚类
图摘要算法通常用于从拥有大量节点的复杂图中提取隐含信息,发现主体结构和普遍规律.不同于以往基于统计的图摘要方法,Tmn等人[11]提出了一种基于节点聚合的方法々-SNAP来进行图摘要计算.该算法优势在于,图的摘要计算过程中不会丢失任何原始节点的信息,同时,可以自由地调整图摘要的聚合程度和迭代次数,得到对图不同粒度的分析结果.我们注意到,々-SNAP在图摘要迭代过程中同时完成了对节点的聚类,每个节点聚类是一系列与外部节点拥有相似连接度的节点的聚合.因此,我们认为通过对用户兴趣图进行々-SNAP摘要,可以对用户节点实现兴趣聚类.基于々-SNAP,我们设计了SNAP-Cluster算法,使得(1)聚合过程仅发生在用户节点之间;(2)仅将々-SNAP算法应用于核心兴趣图,以保证能产生足够多有效信息的聚类;(3)通过计算模糊度和差异性指数来表示聚类结果的特征,并以此来估计对最终推荐结果的影响.
基于之前的定义,我们给出图摘要聚类算法SNAP-Cluster的过程.
算法1.SNAP-Cluster图摘要聚类算法.
输入:核心用户集LT,主题集S,核心兴趣图Gm.
输出:核心聚类lu
1.Clus=U,,?7taxAmb=0,srcCi=null,arget=n\Al;
2.whileAmb-0或达到目标迭代次数是
3.forCinludo
对于最优聚类的选择,我们基于这样观察:当差异性指数越大时,表明类间的兴趣越不相同,这使得每一个聚类的兴趣特征越明显,增加了对兴趣预测的精确性.相反,模糊值越大,则在一个聚类的内部保留了更大的差异性,因而增加了产生多样性推荐的可能.因此我们考虑将二者综合考虑,在最后的实验中我们也将验证上述结论.图 4(a)展示了一个来自于新浪微博中500个用户和50个主题所构成的兴趣图(平均兴趣密度72%),图4(b)是通过SNAP-Cluster计算之后的核心聚类图(平均密度15%,小点为主题,大圆为用户聚类,中心数字为聚类大小).
4.3全用户聚类
得到用户核心聚类Szmrt之后,我们需要提取核心聚类以及非核心用户的内容特征向量.
期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。
【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。
投稿辅导服务咨询与期刊合作加盟
陆老师联系QQ:
蒋老师联系QQ:
刘老师联系QQ:
联系电话:18015016272
17327192284
投稿辅导投稿邮箱:zgqkk365@126.com
期刊推荐
- 《校园英语》旬刊 省级 教育类学术期刊
- 《吉林教育》旬刊 省级 教育类学术期刊
- 《文教资料》 旬刊 省级
- 《科技风》半月刊 省级 科技类优秀期刊
- 《价值工程》旬刊 国家级 科技统计源期刊
- 《中国实验方剂学杂志》 半月刊 北大核心
- 《电影评介》半月刊 14版北大核心
- 《社科纵横》季刊 社科类优秀期刊
- 《求索》月刊 14版北大核心期刊
- 《中华建设》月刊 国家级 建设类优秀期刊
- 《继续教育研究》月刊 北大核心期刊
- 《网络空间安全》(信息安全与技术)月刊 国
- 《新闻传播》月刊 省级 新闻类优秀期刊
- 《财会月刊》旬刊 14版北大核心
- 《体育文化导刊》月刊 体育类双核心期刊
- 《机械研究与应用》双月刊 省级 机械应用类
- 《公路交通科技》 月刊 北大核心
- 《教学与管理》旬刊 北大核心
- 《新课程研究》旬刊 省级 教育类优秀学术期
- 《中国医药指南》 旬刊 国家级
- 《高教论坛》 月刊 省级
- 《课程教育研究》 旬刊 国家级
- 《语文建设》 旬刊 14版北大核心
- 《教育发展研究》 半月刊 双核心
- 《学术界》 月刊 双核心


