在线客服系统

期刊库

教育   经济   科技   财会   管理   
医学   法学   文史   工业   建筑   
农学   水利   计算机   更多>>
 首 页    论文大全   论文精品    学术答疑    论文检测    出书咨询    服务流程    诚信通道    关于我们 

基于浏览行为的用户身份认证方法研究

人气指数: 发布时间:2016-03-08 10:51  来源:http://www.zgqkk.com  作者: 张鸿博
分享到:

 

  摘要:为了解决当前普遍存在的用户身份认证问题,通过分析用户浏览行为,为每个用户以时间相似性为基础划分浏览过程,建立了基于支持度或提升度的特征向量的行为模型,通过向量间距离判定新浏览序列是否属于该用户。系统的误报率较低,且算法时间复杂度为O(n),可以配合其他身份认证手段共同使用。
  关键词:身份认证;浏览行为;支持度;提升度;特征向量
  Abstract: In order to solve user authentication problem, this paper analyzed the user browsing history, divided browsing process for each user based on the similarity of time, established the feature vector model based on the degree of support or lift, and determined whether new browser sequences belonging to the user by the distance between vectors. The system has low false positive rate, and the time complexity of the algorithm is O(n), and can be used with other authentication methods.
  Key words: authentication; browsing behavior; support; lift; feature vector
  1 概述
  在电子商务所面临的安全性威胁中,用户身份盗用是一类发生率较高但仍未有有效防治策略的问题。目前,利用用户的浏览行为来对用户的身份进行认证是研究的一个热点[1]。在利用用户浏览行为建立用户模型方面,主要包括用Web日志挖掘用户行为模式[2]、基于用户查询意图识别的模型[3]、基于Web数据挖掘的用户浏览兴趣路径模型[4]、马尔科夫模型[5]及加权马尔科夫模型[6]等。然而,以上认证方法普遍存在误报率过高的问题。本文为了尝试解决当前用户身份认证系统中误报率过高的问题,设计了用户浏览行为模型及身份认证算法,并通过实验验证系统效果。
  2 用户行为模型及身份认证方法
  2.1 用户行为模型总体设计
  本文使用提取特征向量的方法来为每个用户建立统计模型。对于每个用户的浏览记录,我们按照时间相似性将其划分为多个浏览过程。接下来,我们根据这些浏览过程,为每个用户挖掘5个最能代表该用户的域名。我们将所有用户挖掘到的所有域名的并集作为特征向量的分量。所有用户共享特征向量的分量,因此特征向量的分量本身并不能表示用户之间的区别。对于每个用户,我们计算特征向量中的每个域名对该用户的支持度或提升度,并将其作为该用户特征向量的值。这样,我们就为每个用户建立了特征向量,也就是该用户的行为模型。当我们需要验证一个新的浏览序列是否属于某个用户时,首先按照上文所述的方法为新的浏览序列求出特征向量的值,通过计算新的浏览序列特征向量与该用户特征向量间的距离判断新的序列是否属于该用户。如果新的浏览序列通过了认证,系统对用户特征向量进行更新,以反映用户习惯的变化。模型整体设计如图1所示。
  2.2 建立用户行为模型
  我们首先对用户的浏览记录划分浏览过程。用户浏览过程是指用户一次连续不间断浏览网页的过程,通常是指从浏览器打开到浏览器关闭期间浏览的网页。根据时间上的相似性,用户一次浏览过程中浏览网页的时间间隔总是小于一个值。因此,我们可以根据这一特性划分浏览过程。如果连续的网页浏览记录之间的时间间隔小于30分钟,将这些网页归为同一浏览过程;否则,划分为不同的浏览过程。
  接下来需要建立用户特征向量。用户特征向量是本文用来表示用户浏览习惯的模型。用户特征向量的分量是域名,分量对应的值是该域名对用户的支持度或提升度。系统从每个用户的浏览记录中挖掘5个出现频率最高的域名,对于n个用户,共有5n个域名。系统以这5n个域名的并集中的域名作为特征向量的分量。由于域名可能重复出现,因此特征向量的分量数小于等于5n。设特征向量的分量数为m,在这里我们将特征向量中的域名表示为。我们以特征向量中的域名对用户的支持度(support)或提升度(lift)作为用户特征向量的值。支持度与提升度的定义如文献[7]所示。

期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
  本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。


  【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

 
QQ在线咨询
投稿辅导热线:
180-1501-6272
微信号咨询:
fabiaoba-com
咨询电话:18015016272 投稿邮箱:zgqkk365#126.com(#换成@)
本站郑重声明:文章只代表作者观点, 并不意味着本站认同。所载文章、数据仅供参考,使用前请核实,风险自负。
部分作品系转载,版权归原作者或相应的机构   若某篇作品侵犯您的权利,请来信告知.版权:周口博闻教育咨询有限公司 
Copyright © 2005-2023 . 期刊库 版权所有