在线客服系统

期刊库

教育   经济   科技   财会   管理   
医学   法学   文史   工业   建筑   
农学   水利   计算机   更多>>
 首 页    论文大全   论文精品    学术答疑    论文检测    出书咨询    服务流程    诚信通道    关于我们 

面向网络舆情的检索系统设计研究

人气指数: 发布时间:2013-09-10 09:45  来源:http://www.zgqkk.com  作者: 安靖
分享到:

 

  0 引言

  随着Web2.0技术的不断发展和Web终端的迅速普及,越来越多的民众参与到网上交流活动中来,互联网已逐渐成为舆情产生和传播的主要场所。

  舆情是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,由较多群众所表达的信念、态度、意见和情绪等等行为的总和。网络舆情是舆情在互联网上的存在形式,是网民对自己关心或与自身利益紧密相关的各种公共事务所持有的多种情绪、态度和意见交错的总和。其中,最为重要的一种形式是网络言论,它通过网站、新闻组、在线聊天、博客等途径进行传播。网络的开放性和虚拟性决定了网络舆情具有以下特点:

  (1)表达自由。通过论坛、新闻点评和博客网站,网民可以以匿名的方式随时随地发表意见,民意表达畅通无阻。

  (2)传播迅速。网络舆论的形成往往形成于某一突发事件,一个事件的存在加上一种情绪化的意见,就可以迅速地成为一个舆论热点。

  (3)身份隐蔽。网民数量巨大,发言者身份隐蔽,缺少规则限制和有效监督,从而导致网络舆情的监控工作难以有效开展。

  网络舆情监测系统不仅可以减少各级政府部门在网络舆情监测方面的人力和物力方面的投入,还能提高网络舆情监测效果。

  1 舆情检索系统核心技术

  网络舆情监测系统是一个复杂而庞大的系统,涉及很多技术。从总体上看,其核心技术可以分为网络信息采集技术、网络文本信息抽取技术。

  1.1 网络信息采集技术

  目前已有的舆情监测系统主要利用元搜索技术和网络爬虫的方法采集舆情信息。

  元搜索通过将多个单一搜索引擎集成在一起,将用户的检索提问同时提交给多个独立的搜索引擎,同时检索多个索引库,将多个搜索引擎的检索结果进行二次加工,如对检索结果去重、排序、过滤等,其搜索到的结果将比搜索单一搜索引擎的检索结果数量更多,信息更全。同时,采用元搜索技术不需收录整个互联网中的信息就可以获得查询结果,其复杂度较低。

  爬虫(Crawler) 是一种按照若干规则,自动抓取万维网信息的程序或者脚本。根据预先设定的一个或若干初始种子URL开始,以此获得初始网页上的URL列表,在爬行过程中不断地从URL队列中获得新的URL,进而访问并下载该页面。页面下载完成之后网页信息抽取程序将页面信息保存,同时将当前页面上抽取到的新的URL,保存到URL抓取队列,直到满足系统停止条件。


期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
  本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。


  【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

 
QQ在线咨询
投稿辅导热线:
180-1501-6272
微信号咨询:
fabiaoba-com
咨询电话:18015016272 投稿邮箱:zgqkk365#126.com(#换成@)
本站郑重声明:文章只代表作者观点, 并不意味着本站认同。所载文章、数据仅供参考,使用前请核实,风险自负。
部分作品系转载,版权归原作者或相应的机构   若某篇作品侵犯您的权利,请来信告知.版权:周口博闻教育咨询有限公司 
Copyright © 2005-2023 . 期刊库 版权所有