自然语言实时交通信息与位置信息的融合方法(2)
2.1.2自动分词处理分词算法
汉语自动分词是自然语言理解的关键因素。目前的自动分词算法主要有:一是机械匹配法,如正向最大匹配法(MM)、逆向最大匹配法等[10]。机械匹配法不需要任何的词法、句法、语义知识,不需要复杂的数据结构,执行起来简单,但要求有一个很大的匹配字典,不能很好地解决歧义问题。二是基于统计的分词方法,如N元文法模型、隐Markov模型、最大熵模型等[11]。此类分词法不需要一个机器可读词典,但需要大量的训练文本。三是人工智能法,如神经网络模型分词法、专家系统分词法等[12]。
正向最大匹配法是一种常用的分词方法,是基于一定词库的机械分词方法,其核心思想是长词优先原则,即在语句切分过程中字数较多的词优先被匹配切分,以得到的词汇数量最少时为最佳切分结果。其切分步骤为:假定最大词长为M,首先从待切分句子的句首取长度为M的子字串进行匹配,如果匹配成功则切分此字串为一个词,如果匹配不成功则减去字串的最后一个字继续进行匹配,按此方法直至匹配成功或字串减至为空;按此过程对下一个子字串进行匹配切分直至句尾。此方法设计思想简单,在计算机上容易实现,且时间复杂度较低,但是最大词长M的大小难以确定,定得过大,则切分时匹配效率太低,算法的时间复杂度明显增加;M定得太小,则会对切分的正确率产生影响。
2.2自然语言交通信息与交通网络的融合方法
自然语言交通信息中的空间位置信息是模糊的,并没有坐标信息,为此对于得到的自然语言交通信息要能对交通流进行诱导,必须让自然语言交通信息与路网进行融合,只有使自然语言交通信息具有了地理位置信息才能分析此位置发生的交通事件对交通流的影响。
如上述分析,交通网络是由边和节点组成,交通事件是发生在路网上。自然语言交通信息的定位方式有以道路交叉口(路口)或道路名来定位,有以离网络边或网络节点很近的地物来描述交通事件发生的地点。道路交叉口(路口)对应着交通网络上的节点,对于以道路交叉口(路口)来定位的交通信息可以直接与交通网络匹配融合;对于偏移交叉口(路口)一定距离的,可以沿着网络边按偏移方向加上偏移量然后取得定位点的坐标。交通事件都是发生在网络中,并不是发生在地物这个位置上,人们只是习惯于用最近的地物表示发生交通事件的位置,由于地物并不对应着网络上的节点或边,所以对于以地物定位的自然语言交通信息首先要找到与地物最近的网络边或节点,如果没有偏移量就直接获取与交通网络最近点的坐标,如果有偏移量就从最近点按偏移方向加上偏移量然后取得定位点的坐标。具体的匹配融合方法如图1所示。
3实验
以南京市交通网络为例,南京市交通网络由2668条路段和1677个节点组成(如图2所示)。选择2012年9月8日早上8点半到下午17点半这一时间段内南京交通广播电台播送的实时交通信息,共计327条。
4结束语
自然语言交通信息是以自然语言表达与交通相关的信息,用来说明交通事件中反映出的交通特征。本文通过对大量自然语言交通信息的分析,总结出自然语言交通信息的表达方式,设计了一最大匹配分词算法来对自然语言交通信息进行切分处理,此方法不仅遵照长词优先的原则,而且提高了切分的效率。本文还提出了自然语言交通信息与交通网络的位置信息进行融合的方法。
充分利用实时语言交通信息对提高交通网络的效率有着重要的作用,对缓解交通的拥堵具有一定的意义。充分利用各渠道发布的实时交通信息,发展实时动态导航技术,是智能交通导航的发展趋势和主要形式。本文的研究有望实现大量的实时自然语言交通信息能高效地运用于出行诱导。
在交通网络中,由于道路的修建等原因,常出现地名的增加或者更改,使得在进行自然语言理解时会出现未登录词,这会影响分词的准确性,为此在自然语言交通信息的解析中,要处理好未登录词的切分。自然语言交通信息与空间信息融合后,如何用来预测行程时间等还需进一步研究。
参考文献:
[1]张海东.实时路况分析系统在治理交通拥堵中的应用[J].计算机时代,2013.7:40-42
[2]黄睿.Dijkstra算法在物流中的优化与实现[J].计算机时代,2012.2:10-12
[3]杨兆升.基础交通信息融合技术及其应用[M].中国铁道出版社,2005.
[4]陈传彬,陆锋,励惠国等.自然语言表达实时路况信息的路网匹配融合技术[J].中国图象图形学报,2009.14(8):1669-1676
[5]孔庆杰.信息融合理论及其在交通监控信息处理中的应用[D].上海交通大学,2010.
[6]WangZhengyou,GuoChunhua.IntelligentTransportationSystem(ITS)informationfusion:Concept,analysisandimplementation[C].IEEEInternationalConferenceonServiceOperationsandLogistics,andInformatics,2006:999-1003
[7]Nour-EddinElFaouzi,HenryLeung,AjeeshKurian.Datafusioninintelligenttransportationsystemsprogressandchallengeasurvey[J].InformationFusion,2011.12(1):4-10
[8]Qing-JieKong,ZhipengLi,YikaiChen,etal.Anapproachtourbantrafficstateestimationbyfusionmultisourceinformation[J].IEEETransactionsonIntelligentTransportationSystems,2009.10(3):499-511
[9]张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005.17(1):138-143
[10]赵曾贻,陈天娥,朱兰.一种基于语词的分词方法[J].苏州大学学报,2002.18(3):44-48
[11]石佳,蔡皖东.基于N元语法的汉语自动分词系统研究[J].微电子学与计算机,2009.26(7):98-101
[12]尹锋.基于神经网络的汉语自动分词系统的设计与分析[J].情报学报,1998.17(1):41-49
期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。
【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。
投稿辅导服务咨询与期刊合作加盟
陆老师联系QQ: 913775405(普刊)
蒋老师联系QQ: 867306987(核心)
刘老师联系QQ: 271374912(核心)
联系电话:18015016272
17327192284
投稿辅导投稿邮箱:zgqkk365@126.com
期刊推荐
- 《课程教育研究》 旬刊 国家级
- 《网络空间安全》(信息安全与技术)月刊 国
- 《价值工程》旬刊 国家级 科技统计源期刊
- 《高教论坛》 月刊 省级
- 《法制与社会》旬刊 省级
- 《中国教育学刊》月刊 14版北大核心
- 《语文建设》 旬刊 14版北大核心
- 《中国绿色画报》 月刊 国家级
- 《社科纵横》季刊 社科类优秀期刊
- 《求索》月刊 14版北大核心期刊
- 《财会月刊》旬刊 14版北大核心
- 《艺术品鉴》 月刊 省级
- 《中华建设》月刊 国家级 建设类优秀期刊
- 《教学与管理》旬刊 北大核心
- 《当代经济》 旬刊 省级
- 《新课程研究》旬刊 省级 教育类优秀学术期
- 《文教资料》 旬刊 省级
- 《学术界》 月刊 双核心
- 《吉林教育》旬刊 省级 教育类学术期刊
- 《中国农业资源与区划》 月刊 14版北大核心
- 《继续教育研究》月刊 北大核心期刊
- 《财经界(学术版)》半月刊 国家级
- 《电影评介》半月刊 14版北大核心
- 《公路交通科技》 月刊 北大核心
- 《新闻传播》月刊 省级 新闻类优秀期刊