期刊库

教育   经济   科技   财会   管理   
医学   法学   文史   工业   建筑   
农学   水利   计算机   更多>>
 首 页    论文大全   论文精品    学术答疑    论文检测    出书咨询    服务流程    诚信通道    关于我们 

基于核函数的谱嵌入聚类算法(2)

人气指数: 发布时间:2015-04-08 10:17  来源:http://www.zgqkk.com  作者: 王伟东等
分享到:

 


  其中,u和γg是两个正则化参数,第一个参数描述簇分配矩阵与低维空间的线性关系的强弱,第二个参数描述簇分配矩阵被放松处理后的F与低维线性空间的不匹配程度;J(F=tr(FTLF指的是传统谱聚类算法的目标函数。在式(4上对W和b分别进行求导,使其结果等于0得:
  W=(XXT+γgId-1XF
  b=1nFT1n(5
  将式(5代入式(4后进行化简,优化问题便转化为:
  minFTF=IcJ(F+uP(F(6
  其中
  P(F=tr(FTLgF。
  Lg=Hn-XT(XXT+γgId-1X(7
  其中
  Hn=In-1n1n1Tn。
  这时,与传统的谱聚类算法同理,对簇分配矩阵的求解进行放松处理便转化为对L+uLg的特征分解问题了,取前c个最小特征值对应的特征向量构建特征空间,在新的特征空间中对数据进行划分,就成功地实现了对高维数据的准确聚类。
  3基于核函数的谱嵌入聚类算法
  3.1核函数
  经典的核学习理论指出,低维空间中线性不可分的模式通过一种非线性映射到高维特征空间后,就能够实现线性可分。但是,如果直接采用这种非线性映射技术在高维空间进行分类或者回归,就必然面临着映射函数的形式和参数的确定问题,而且很有可能引发“维数灾难”,这时采用核函数可以有效地解决这一问题。设x,z∈X,X属于R(n空间,非线性函数Φ实现了低维空间中数据X到高维的特征空间F的映射,其中F属于R(m,(nm空间,则核函数[11]定义为:
  k(x,z=〈Φ(x,Φ(z〉(8
  其中
  〈〉表示内积,k(x,z表示核函数。
  式(8表明核函数将m维(高维空间里的内积运算转化成了n维(低维空间里的核函数计算,从而解决了数据的“高维”带来的维数灾难问题,而且核函数不需要知道非线性变换函数Φ的形式和参数,引入方便。本文选用高斯核函数来完成非线性数据到高维的映射过程,同时该函数也是在谱聚类算法开始时构造亲和度矩阵的径向基函数。
  3.2KSEC算法
  根据以上分析,基于核函数的谱嵌入聚类算法(KSEC引入一个非线性的核函数yi=f(xi=∑nj=1αik(xi,xj,将非线性的不可分数据映射到高维的特征空间实现可分,这里的核函数选用高斯核函数,与式(1定义相同。
  KSEC算法使用核化的映射函数将高维非线性数据X映射后,将其簇分配矩阵嵌入到一个线性低维空间,设置目标函数为:
  minF,W,bFTF=IcJ(F+u(‖Kα-F‖2+γgtr(ααT(9
  在目标函数式(9上,把对α的求导结果置为0可得α=(K+γgIn-1F∈Rn×c。根据矩阵的2范数和矩阵迹的关系,式(9可以转化为:
  minF,W,bFTF=IcJ(F+u(tr[(Kα-F(Kα-FT]+γgtr(ααT(10
  将α代入式(10,目标函数的优化问题转化为式(6所列形式,其中P(F=tr(FLgFT,注意这里:
  Lg=In-(K+γgIn-1(11
  至此,KSEC算法的理论推导便转化为了对Lsym+uLg的特征求解问题了。算法1详细介绍了KSEC算法的实现流程。
  核化的映射函数对数据的处理不再局限于线性可分数据,它对使用线性映射函数难以处理的数据,例如高维数据和稀疏数据都能够很好地进行映射以便实现可分,当然对线性可分数据它依然适用。对比式(7和式(11发现核函数的引入大大精简了待求式的中间量如In和1n,简化了Lg的计算,提高了算法效率。从算法复杂度上来分析,算法第1步构造亲和度矩阵时的时间复杂度为O(n2,第4步进行矩阵分解时的时间复杂度为O(n2+1,所以该算法的整体时间复杂度为O(n2+1+n2,即O(n2。
  算法1KSEC算法。
  输入:数据集X={x1,x2,…xn}∈Rd×n,参数σ,类别数c,正则化参数u、γg。
  输出:数据的类标签。

期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
  本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。


  【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

 
QQ在线咨询
投稿辅导热线:
180-1501-6272
微信号咨询:
fabiaoba-com
咨询电话:18015016272 投稿邮箱:zgqkk365#126.com(#换成@)
本站郑重声明:文章只代表作者观点, 并不意味着本站认同。所载文章、数据仅供参考,使用前请核实,风险自负。
部分作品系转载,版权归原作者或相应的机构   若某篇作品侵犯您的权利,请来信告知.版权:周口博闻教育咨询有限公司 
Copyright © 2005-2023 . 期刊库 版权所有