面向网络舆情的检索系统设计研究
0 引言
随着Web2.0技术的不断发展和Web终端的迅速普及,越来越多的民众参与到网上交流活动中来,互联网已逐渐成为舆情产生和传播的主要场所。
舆情是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,由较多群众所表达的信念、态度、意见和情绪等等行为的总和。网络舆情是舆情在互联网上的存在形式,是网民对自己关心或与自身利益紧密相关的各种公共事务所持有的多种情绪、态度和意见交错的总和。其中,最为重要的一种形式是网络言论,它通过网站、新闻组、在线聊天、博客等途径进行传播。网络的开放性和虚拟性决定了网络舆情具有以下特点:
(1)表达自由。通过论坛、新闻点评和博客网站,网民可以以匿名的方式随时随地发表意见,民意表达畅通无阻。
(2)传播迅速。网络舆论的形成往往形成于某一突发事件,一个事件的存在加上一种情绪化的意见,就可以迅速地成为一个舆论热点。
(3)身份隐蔽。网民数量巨大,发言者身份隐蔽,缺少规则限制和有效监督,从而导致网络舆情的监控工作难以有效开展。
网络舆情监测系统不仅可以减少各级政府部门在网络舆情监测方面的人力和物力方面的投入,还能提高网络舆情监测效果。
1 舆情检索系统核心技术
网络舆情监测系统是一个复杂而庞大的系统,涉及很多技术。从总体上看,其核心技术可以分为网络信息采集技术、网络文本信息抽取技术。
1.1 网络信息采集技术
目前已有的舆情监测系统主要利用元搜索技术和网络爬虫的方法采集舆情信息。
元搜索通过将多个单一搜索引擎集成在一起,将用户的检索提问同时提交给多个独立的搜索引擎,同时检索多个索引库,将多个搜索引擎的检索结果进行二次加工,如对检索结果去重、排序、过滤等,其搜索到的结果将比搜索单一搜索引擎的检索结果数量更多,信息更全。同时,采用元搜索技术不需收录整个互联网中的信息就可以获得查询结果,其复杂度较低。
爬虫(Crawler) 是一种按照若干规则,自动抓取万维网信息的程序或者脚本。根据预先设定的一个或若干初始种子URL开始,以此获得初始网页上的URL列表,在爬行过程中不断地从URL队列中获得新的URL,进而访问并下载该页面。页面下载完成之后网页信息抽取程序将页面信息保存,同时将当前页面上抽取到的新的URL,保存到URL抓取队列,直到满足系统停止条件。
期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。 【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。
本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。
投稿辅导服务咨询与期刊合作加盟
陆老师联系QQ:
蒋老师联系QQ:
刘老师联系QQ:
联系电话:18015016272
17327192284
投稿辅导投稿邮箱:zgqkk365@126.com
期刊推荐
- 《校园英语》旬刊 省级 教育类学术期刊
- 《吉林教育》旬刊 省级 教育类学术期刊
- 《文教资料》 旬刊 省级
- 《科技风》半月刊 省级 科技类优秀期刊
- 《价值工程》旬刊 国家级 科技统计源期刊
- 《中国实验方剂学杂志》 半月刊 北大核心
- 《电影评介》半月刊 14版北大核心
- 《社科纵横》季刊 社科类优秀期刊
- 《求索》月刊 14版北大核心期刊
- 《中华建设》月刊 国家级 建设类优秀期刊
- 《继续教育研究》月刊 北大核心期刊
- 《网络空间安全》(信息安全与技术)月刊 国
- 《新闻传播》月刊 省级 新闻类优秀期刊
- 《财会月刊》旬刊 14版北大核心
- 《体育文化导刊》月刊 体育类双核心期刊
- 《机械研究与应用》双月刊 省级 机械应用类
- 《公路交通科技》 月刊 北大核心
- 《教学与管理》旬刊 北大核心
- 《新课程研究》旬刊 省级 教育类优秀学术期
- 《中国医药指南》 旬刊 国家级
- 《高教论坛》 月刊 省级
- 《课程教育研究》 旬刊 国家级
- 《语文建设》 旬刊 14版北大核心
- 《教育发展研究》 半月刊 双核心
- 《学术界》 月刊 双核心