APP下载

基于共词分析的国内智能交通系统研究可视化分析

2020-08-11张乐瑶

科学技术创新 2020年25期
关键词:共词交通灯词频

张乐瑶

(大连海事大学航运经济与管理学院,辽宁 大连116033)

1 背景

智能交通系统(Intelligent Traffic System,ITS)[1],指的是在较完善的基础设施之上集成了先进的科学技术(包括信息技术、数据通讯传输技术、电子传感技术、电子控制技术以及计算机处理技术等)而建立起的一种在大范围、全方位发挥作用的实时、准确、高效的综合运输和管理系统。它使得交通系统中“人、车、路”三者的关系以新的方式呈现,有利于缓解交通堵塞、降低交通事故发生率和减少环境污染。目前国内对智能交通的研究主要集中在以下几个方面:

1.1 智能交通系统涉及的相关实现技术的研究

郁梅、蒋刚毅、郁伯康在《智能交通系统中的计算机视觉技术应用》中讨论了计算机视觉技术在智能交通系统中的应用,提出了一种基于背景差的车辆监测算法。胡滢滨、李丽华在《物联网前沿技术在智能交通中的应用研究》中研究了物联网的前沿技术与智能交通系统的有机结合。张黄慧在《大数据技术在智能交通中的应用》中详细研究了智能交通中大数据技术的应用。

1.2 对当前国内环境下智能交通的发展现状与未来发展的分析研究

谭慧芳在《中国智能交通系统的现状和发展对策》中选取了智能交通系统框架中的部分领域进行现状分析,并提出了发展对策。洪中荣在《浅析我国智能交通系统发展现状与前景》中通过中国与美欧日在ITS 发展现状的对比,综合分析我国ITS 趋势与建设ITS 路上所面对的挑战,并提出了相应对策。

1.3 对基于智能交通产业的研究

李正熙在《宏观城市智能交通系统产业化发展趋势》中指出智能交通系统集成、交通大数据、车联网、移动互联网应用将是中国城市智能交通系统产业化发展的重要领域。岳建明在《我国智能交通产业的发展及技术创新模式探讨》中指出制约我国智能交通产业的主要因素在关键技术创新、技术标准和产业链整合方面,并探讨了智能交通产业的产业化发展和技术创新问题和提出了发展建议。

2 构建关键词矩阵

2.1 提取高频关键词并统计词频

本研究以中国知网(CNKI)作为数据源,以“智能交通系统”为主题词,在2010 年1 月1 日到2019 年12 月31 日的时间范围内,从CNKI 数据库中搜索得到4464 篇中文文献。经过人工删除无摘要、无关键词,并筛选剔除与智能交通系统主题无关的文献,共得到2293 篇有效文献,每个关键词单独占有一列。使用统计筛选功能进行关键词的词频统计,获得原始关键词9207个,去除重复项后得到4215 个关键词及其词频。因为本文研究的是国内智能交通系统的研究重点,故剔除与主题完全重合的“智能交通系统”和“ITS”这两个关键字,之后选取词频不小于12 的关键词,共得到76 个高频关键词及其词频。其中“智能交通”词频为553 次,为出现频率最高的关键词。此外,“物联网”、“大数据”和“车联网”等关键词的出现频率也很高,表明这些方向国内智能交通系统研究的热点与重点。

2.2 构建高频关键词的共词矩阵

在根据高频关键词表得知近十年国内智能交通系统的研究频率较高的重点方向后,现构建这些关键词的共词矩阵来探究它们的出现是否有相关关系:在关键词总表中用VLOOKUP 函数筛选除去高频关键词之外的其他关键词,之后将几个关键词列两两组合后形成两列的关键词表,最后运用数据透视表分析得到高频关键词的共词矩阵(部分)[1]。

2.3 构建关键词相似矩阵

在获得共词矩阵之后,可以观察到该共词矩阵内的频次差距较为悬殊,不利于后面运用多元统计方法进行计算,故此处使用Ochiia 系数将共词矩阵转化为相似矩阵。将每个单元格的数据进行变换,计算公式如下:

在关键词相似矩阵中的数据可以表示其所对应的行和列的两个关键词的相似程度,取值范围为0 到1:数值越接近于1,表明关键词之间的相似度越大,也即一起出现的频率越高;反之,数值越接近于0 表明关键词之间的相似度越小,一起出现的频率越小。而对角线上的数据表示关键词与自己本身的相似度,均为1。

2.4 构建关键词相异矩阵

在获得相似矩阵后,观察到相似矩阵内的0 值过多,为避免因此导致在统计时误差过大,现用1 与全部相似矩阵中的数据相减,得到表示两关键词相异程度的相异矩阵。

在关键词相异矩阵中的数据可以表示其所对应的行和列的两个关键词的相异程度,取值范围为0 到1:数值越接近于1,表明关键词之间的相异程度越大,也即一起出现的频率越低;反之,数值越接近于0 表明关键词之间的相异程度越小,一起出现的频率越高。而对角线上的数据表示关键词与自己本身的相异程度,均为0。

3 数据分析

用SPSS 软件对之前得到的76 个高频关键词进行因子分析的降维处理。由所得的总方差解释表可以看出,前34 个因子的特征值较大,均大于1,且前34 个因子的旋转载荷平方和累计为62.990%;再观察图1 的碎石图,可以认为碎石图从35 个因子开始趋于平缓,故选取前34 个因子为主因子,如表1 所示。

表1 主因子关键词表

图1 碎石图

去掉重复的代表因子,最后形成的主因子关键词共30 个。将筛选后得到的主因子关键词的相异矩阵导入SPSS 进行组间联接法的系统聚类,根据聚类结果将因子分析得到的30 个主因子关键词分为7 个类团,如表2 所示。

表2 聚类结果的类团表

4 结论

本文通过对2293 篇文献的关键词进行因子分析与聚类分析,得到了7 个智能交通系统的研究热点。现综合分析结果与相关文献对这7 个方面进行阐释。

4.1 交通灯的实现技术。交通信号灯在调节交通流量、维持交通平稳状态方面起着关键性作用。交通灯主要涉及技术主要包括PLC 控制技术与检测技术。其中大多数的检测技术是利用地磁线圈的检测技术,而随着人工智能与计算机视觉技术的发展,视频检测技术逐渐成为交通灯检测技术研究的新方向。

4.2 交通灯智能控制系统的设计。交通灯控制系统的研究通常包括选择和优化控制算法、选择合适的控制硬件等。随着科学技术的发展,交通灯的控制算法也由最开始的常规的时间顺序控制方法向深度学习、模糊控制等智能算法方向转变[2]。

4.3 智能交通系统的检测与定位技术。智能交通系统识别“人、车、路”之间的矛盾的主要依据就来源于车流量检测了。随着计算机视觉技术的发展,视频检测技术[3]逐渐成为研究热点,其中基于深度学习等人工智能算法的发展更为迅速。

4.4 城市交通系统的智能化。当前在我国只有少数几个大城市建立了先进的智能交通系统,所以未来一段时间内城市智能交通系统仍是国内智能交通系统的主要应用方向,随着一些类似计算机视觉的人工智能技术加入,国内的城市智能交通系统会有很大的研究空间。

4.5 智能交通系统中的交通管理与控制。智能交通系统中的交通管理与交通控制也是解决城市交通问题的必要方式,而GPS 技术和人工智能技术的运用则会使交通管理与交通控制变得更加智能与高效,从而可以更好地解决交通问题,实现交通系统的智能化。

4.6 交通拥堵的识别、解决及管理。在智能交通系统中,解决交通拥堵是其首位功能要求,所以智能交通系统中采用了云计算、物联网等先进技术对拥堵进行识别和监控,之后通过智能交通管理系统进行解决。

4.7 交通信息的采集与使用。智能交通系统内交通信息的采集与使用也是智能交通系统中的研究重点。信息的来源除了最基本的直接获取,还可以通过车联网、物联网等途径,利用无线通信技术等手段为智能交通系统提供信息来源。

猜你喜欢

共词交通灯词频
基于词频比的改进Jaccard系数文本相似度计算
基于单片机的交通灯模糊控制器研究
基于遗传算法的智能交通灯控制研究
词汇习得中的词频效应研究
为什么交通灯是红黄蓝三种颜色?
图书馆与档案馆信息公开研究重点及趋势比较研究
基于Matlab的共词矩阵构造
基于单片机的LED模拟交通灯设计
词频,一部隐秘的历史
基于GEPHI的共词可视化分析:以文献计量学作者合作关系为例