在线客服系统

期刊库

教育   经济   科技   财会   管理   
医学   法学   文史   工业   建筑   
农学   水利   计算机   更多>>
 首 页    论文大全   论文精品    学术答疑    论文检测    出书咨询    服务流程    诚信通道    关于我们 

面向网络舆情的检索系统设计研究(3)

人气指数: 发布时间:2013-09-10 09:45  来源:http://www.zgqkk.com  作者: 安靖
分享到:

 

  (2)舆情热点的发现。

  舆情热点发现模块在大量文本中将内容相似的文本归为一个类。通过对典型的基于划分文本聚类算法和凝聚层次聚类算法研究之后发现其各有优缺点。KMeans 这样的基于划分的聚类算法,利用整个文本集的全局信息,具有速度快、易于实现的特点,适用于文本聚类分析,但它在聚类初始中随机选择热点,需要给定聚类个数,聚类结果会产生较大的波动。Canopy这种凝聚层次聚类算法在聚类过程中,更多利用的是文本集的局部特征,能很方便地将文本分类。基于这些考虑,本文采用Mahout提供的Canopy和KMeans算法对同一项目下的文本聚类,首先采用Canopy获得初始聚类结果,再用KMeans优化。

  参考文献:

  [1] KLAUS ZEEHNER.A literature survey on information extraction and text summarization[R].Carnegie Mellon University,1997.

  [2] WANG YIDA, YANG JIANG MING, LAI WEI, et al. Exploring traversal strategy for web forum crawling[C].Proceedings of the 31St annual International ACM SIGIR Conference on Research and Development in Information Retrieval,2008.

  [3] 刘毅.略论网络與情的概念、特点、表达与传播[J].理论界,2007(1).

  [4] 丁杰,徐俊刚.IPSMS:一个网络舆情监控系统的设计与实现[J].计算机应用与软件,2010(4).

 


期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
  本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。


  【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

 
QQ在线咨询
投稿辅导热线:
180-1501-6272
微信号咨询:
fabiaoba-com
咨询电话:18015016272 投稿邮箱:zgqkk365#126.com(#换成@)
本站郑重声明:文章只代表作者观点, 并不意味着本站认同。所载文章、数据仅供参考,使用前请核实,风险自负。
部分作品系转载,版权归原作者或相应的机构   若某篇作品侵犯您的权利,请来信告知.版权:周口博闻教育咨询有限公司 
Copyright © 2005-2023 . 期刊库 版权所有