期刊库

教育   经济   科技   财会   管理   
医学   法学   文史   工业   建筑   
农学   水利   计算机   更多>>
 首 页    论文大全   论文精品    学术答疑    论文检测    出书咨询    服务流程    诚信通道    关于我们 

基于移动互联网的质检信息采集与聚类分析技术浅析(3)

人气指数: 发布时间:2015-02-05 10:42  来源:http://www.zgqkk.com  作者: 于新雨等
分享到:

 


  通过对质检部门需求和投诉举报数据领域内特征的调查和分析,发现投诉信息自动分类的核心需求是建立对质检部门需求的目标投诉举报数据辨识度高的分类模型。因而通过理顺分类模型的建立过程,质检职能部门与分类类别的对应关系等过程,设计出能够由质检部门自由标记样本文件、灵活选择目标字段、按具体情况选择算法和设置分类参数的投诉举报信息自动分类与推送系统的机制和方案,构建由质检部门依据自己的专业知识支撑分类模型建立和判定分类结果满意度的服务平台,从而提高自动分类的准确度和适应性。

  模型通过质检用户标识目标样本并确定挖掘字段,来划定当前用户关注的当前类别的学习样本;通过学习、去噪、抽取类特征词集和开放类特征词集,用户修改接口来创建和调整分类空间;为用户提供多种分类算法的选择权限以及提供参数修改权限来实现计算和优化分类结果的目的;通过记录用户行为,主要是记录哪位用户(或哪个用户部门)标记了哪些样本,来确定这批样本代表的投诉举报类别与用户(或用户部门)之间的映射关系,从而建立自动推送模型,以实现分类结果订阅和自动推送的功能。

  模型通过建立分类空间,并结合不同的分类算法和参数值建立分类模型,分类模型的建立具有依赖部门或质检用户专业知识的特点,因而可以贴合质检用户真正的需求。分类模型是指导自动分类的标准,由于投诉举报信息自动分类数据源和目标结果的强专业性和精细的领域性,因此分类模型也必须具有随时根据用户需求的演变而灵活调整的性质。

  质检用户根据自身需求标记样本,对样本经过分词处理、去噪和预处理后,确定分类空间,形成分类模型和推送模型,在两模型的指导下对从投诉举报信息收集平台输入的投诉数据完成自动分类和推送的全过程,使部门和用户可以节约大量时间并,及时获得最新的隶属于当前质检用户关注类别的投诉举报信息。最后正确分类的投诉举报信息就可以在闭环系统中流动起来,在不同部门之间传递并最终解决。

  移动互联网的质检投诉举报信息智能分析模型可按照其具体逻辑功能,分为六大核心部门。

  投诉举报信息收集平台:提供与投诉信息闭环管控系统的数据交互接口,不同来源的投诉信息在这部分进行汇集和整合,是投诉信息自动分类与推送系统的数据总源。

  存储单元:投诉举报信息收集平台获得的信息来源广、内容复杂,经过去噪将用户真正关心的内容筛选出来并经过分词和构建索引后存储在系统内部,经预处理将数据转化为方便读取和计算的形式。存储采用增量存储的方式,允许数据不断累加,这同时也是对投诉信息收集平台的数据提供灾备支撑。

  类别计算中心:这部分是整个系统的核心部分,指导数据分类过程,具有反馈调整的特性。

  信息推送中心:这部分记录类别与质检用户或质检部门的映射关系,当类别计算中心完成自动分类运算后,信息推送中心执行信息从系统内部到用户或用户部门的传输,支撑运算结果的发送功能。

  服务接口层:是人机接口和核心计算平台传递数据的通道,执行用户端和服务器端的数据交互功能。

  人机接口:是用户使用系统、参与操作、查询数据和接收结果的接口,具有载入数据、标注样本、算法选择、选择目标字段、参数设置、调整类别特征词集、推送结果展示共7个部分。

  5 结语

  基于移动互联网的质检信息采集与聚类分析技术对网络质检信息的解读、剖析、统计、处理等,对我国城市安全管理、供热锅炉和压力管线等特种设备的安全性、稳定性、具有重大的现实意义,也是创建和谐社会的应有内涵。在此体系的指导下,将对互联网中存在的海量质检信息自动实时的监控分析产生极大的推动作用,同时这些技术也可以被广泛应用于企业竞争情报系统、个人及企业知识门户等领域。

  参考文献:

  [1]田鹤楠,杜军平.产品质量食品安全互联网舆情监控系统设计[C].中国电子学会第十七届信息论学术年会论文集,2010,76-80.

  [2]田鹤楠.质检总局舆情监控系统中信息抽取的研究[D].北京:北京邮电大学,2011.

  [3]张红云.基于页面分析的主题网络爬虫的研究[D].武汉:武汉理工大学,2010.

  [4]曾伟辉,李淼.深层网络爬虫研究综述[J].计算机系统应用,2008,(5):122-126.

  [5]周德懋,李舟军.高性能网络爬虫:研究综述[J].计算机科学,2009,36(8):26-29.

期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
  本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。


  【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

 
QQ在线咨询
投稿辅导热线:
180-1501-6272
微信号咨询:
fabiaoba-com
咨询电话:18015016272 投稿邮箱:zgqkk365#126.com(#换成@)
本站郑重声明:文章只代表作者观点, 并不意味着本站认同。所载文章、数据仅供参考,使用前请核实,风险自负。
部分作品系转载,版权归原作者或相应的机构   若某篇作品侵犯您的权利,请来信告知.版权:周口博闻教育咨询有限公司 
Copyright © 2005-2023 . 期刊库 版权所有