城市交通事故的局部相关性可视分析方法
2019-11-13刘新月谢文军尹成胜陈金光罗月童
刘新月,谢文军,尹成胜,陈金光,刘 璐,罗月童
城市交通事故的局部相关性可视分析方法
刘新月1,谢文军1,尹成胜2,陈金光2,刘 璐1,罗月童1
(1. 合肥工业大学计算机与信息学院,安徽 合肥 230601;2.合肥市公安局交通警察支队,安徽 合肥 230009)
交通事故数据蕴含有交通事故规律,如交通事故与天气、时间、道路等因素的关联规律,值得深入挖掘。虽然天气、时间、道路等因素对交通事故均有影响,但对不同区域交通事故的影响不尽相同,即具有局部相关性。挖掘局部相关性能更好地揭示这些因素与交通事故之间的相关性。为此提出一套分析挖掘交通事故数据中所蕴含的局部相关性的方法。首先基于交通事故数据提取事故多发路段,每个事故多发路段包含有位置、时间以及相关的交通事故信息;然后提出一套聚类支持的局部相关性可视分析方法分析事故多发路段:①以待分析因素直方图(如天气直方图、时间直方图)刻画事故多发路段;②基于直方图相似性对事故多发路段进行聚类分析;③在多关联视图支持的交互环境中进一步观察、分析聚类结果以挖掘待分析因素与交通事故之间的局部相关性。通过分析安徽省合肥市2015—2018年交通事故接警数据,取得了一些有意义的分析结果,验证了该方法的有效性。
交通事故;可视分析;局部相关性;事故多发路段
随着城市化进程的不断推进,城市人口集聚度不断增加,尤其是近年来汽车等交通工具的保有量的不断增加,导致城市交通事故频发。频发的交通事故不仅造成巨额生命财产损失,也加剧城市交通拥堵程度,影响城市通行效率。因此如何预防和减少交通事故已成为城市管理者关心的重要问题之一。
随着信息化及智能交通的普及,城市管理部门积累了大量基础数据[1],其中包括各种交通事故数据,如安徽省合肥市一年的交通事故接警记录数据约有60万条。这些数据蕴含有交通事故的规律,通过深入分析和理解这些数据以掌握交通事故规律,进而对帮助城市管理者分析治理交通事故具有重要意义。
影响交通事故的可能因素众多,如天气、时间(是否周末、是否高峰期)、道路(车道数、岔路口数),准确掌握这些因素和交通事故的相关性是更深入分析交通事故的基础。但很多因素和交通交通事故是局部相关的,简单的全局统计分析难以揭示,图1(a)是安徽省合肥市2015—2018年交通事故数据与天气因素的统计结果,显示天气和交通事故无关,但对合肥市的部分路段进行统计却得知雨天更易发生交通事故,如图1(b)所示。揭示了局部相关性可对交通事故数据更深刻的理解、可给相关部门提供参考,因此本文研究发现交通事故数据中局部相关性的方法。
(a) 数据全集直方图(b) 数据子集直方图
局部相关性分析是数据挖掘中的重要问题[2],虽然学者已经提出很多自动方法,但主要还很依赖人的知识和经验,如超参数选取等。可视分析通过交互将人的经验、知识和判断融入分析过程,能实现机器智能和人类智能有效互补[3],因此已经成为分析局部相关性的重要方法[4]。本文针对交通事故中的局部相关性问题,提出一套可视分析系统,在一系列自动分析功能的支持下,通过多个关联视图允许用户快速发现交通事故数据中蕴含的局部相关性,从而回答诸如哪些路段雨天容易发生交通事故、哪些路段周末交通事故更频发等具体问题,为相关部门进行更深入分析奠定基础。
1 相关工作
本文针对交通事故数据,研究基于可视分析方法揭示其内在局部相关性。可从交通事故可视分析和局部相关性分析2个方面介绍相关工作。
1.1 交通事故可视分析
PACK等[5]设计了一组关联视图以可视化交通事故的空间、时间及高维属性数据,主要提供交通事故数据的浏览功能;PIRINGER等[6]用可视化的方法直观地展现所有时间的当前状态、历史状态和预测的未来状态,辅助用户做决策,更好地处理交通事故;ANWAR等[7]提出一种可视化方法分析交通事故对交通拥堵的影响;FAN等[8]结合基于事件的可视分析和基于位置的可视分析方法,分析交通事故的发生情况和事故类型之间的关系,并试图分析天气和驾驶员特征的影响;ALOMAR等[9]评估不同可视化方法分析交通数据的效果。
上述工作证明可视化/可视分析可应用在交通事故数据浏览、辅助事故处理、多因素相关性分析等多个方面。本文采用可视分析并侧重分析、挖掘交通事故中的局部相关性,有别于上述所有工作。
1.2 局部相关性分析
局部相关性在整个数据集中往往被掩盖,只有在合适的数据子集上才能表现出来。子空间聚类方法常被用于自动分析局部相关性:常用子空间聚类方法包括PROCLUS[10],PreDeCon[11],CLIQUE[12],SUBCLU[13]等。但是,自动子空间聚类方法得到的结果往往高度冗余,并且难以解释和理解。
可视分析通过可视交互界面将人类智能和机器智能相结合,有利于克服自动化方法的不足,已成为数据挖掘的重要方法,马昱欣等[14]对相关工作做了详细的综述。在局部相关性分析方面:文献[15]提出了对于自动子空间聚类结果的交互式可视化方案;TURKAY等[16-17]提出在数据空间与维度空间同时对高维数据进行探索;YUAN等[18]提出了层次化的交互式子空间可视分析方法;与文献[14-18]缺乏引导、主要依赖用户试错探索不同,文献[2]主动向用户推荐可能存在局部相关性的内容,引导用户分析,提高交互效率。本文方法也是交互局部相关性分析方法,但针对交通数据问题进行了专门设计。
2 数据和事故多发路段抽取
本文所用交通事故数据为安徽省合肥市交通事故接警数据。所用数据已经去除人员信息、车辆信息等脱敏处理,主要用于交通事故方面的学术研究。
2.1 交通事故接警数据
交通事故接警数据记录车主的报案信息,如交通事故地点、时间、涉案车辆数、是否有人员伤亡等。本文选用2015—2018年的5 464 339条记录,通过去除无效数据等数据清洗工作后,保留2 499 581条有效记录。
原始数据包含事故发生的时间、地理位置、报警人性别、报警内容、车牌号等字段。因为本文主要关注交通事故的时空特性以及天气影响,所以从原始数据中抽取时间、位置(文字描述、GPS)字段。交通事故接警数据中不包含天气信息,从中国气象网(http://lishi.tianqi.com/hefei/index.html)获取气候信息,并和交通事故接警数据相融合,见表1。
表1 本文所有交通事故数据的结构
2.2 事故多发路段
基于事故发生率检测事故多发路段是最常用方法之一,通常将事故发生率超过一定阈值的路段认定为事故多发路段[19]。本文亦采用基于事故发生率的阈值法检测事故多发路段,其中事故发生率为
其中,(,)为路段在时间段内发生的交通事故数;||为路段的长度(单位为m);||为时间段的长度(单位为d)。
2.2.1 基于时空域扫描的事故多发路段检测
图2 时空域扫描过程示意图
表2 事故多发路段的数据结构
经过和领域专家交流,本文所有实验中各参数取值见表3。对安徽省合肥市512条主要道路的2015—2018年期间全部数据进行处理,共提取246 714条事故多发路段。由扫描算法可知,该数据有大量冗余,且所提取的很多事故多发路段会连接在一起,所以将对事故多发路段进行合并,消除冗余,尽量获得距离更长的事故多发路段。
表3 事故多发路段扫描算法的参数取值
2.2.2 事故多发路段合并
事故多发路段合并遵循以下原则:
(1) 同一道路原则。只有属于同1条道路的2个事故多发路段S和S才可以进行合并。
(2) 首尾相连原则。2个事故多发路段S和S的首尾间距小于给定阈值时,才对S和S进行合并。本文所有实验中=10 (m)。
假设由1,2,···,S合并而得,且对应的时间段1,2,···,T并不一定总是相连的时域,所以将1,2,···,T合并成若干个不相连的时间段,即可能对应于多个时间段,如图3所示。这种支持多时间段的表示方法有利于表示和发现交通事故周期性高发的路段,比如某个路段每年3月、6月、9月、12月4个月事故高发,但全年平均事故发生率并不高,则可用该表示法进行刻画。
图3 事故多发路段时间合并示意图
用加权平均法计算的事故发生率,即
3 局部相关性可视分析
本文遵循KEIM[20]所提出的“Analyze First - Show the Important - Zoom, Filter and Analyze Further - Details on Demand”的分析范式。首先基于聚类技术初步分析用户选定因素(比如天气、时间)的局部相关性;然后在图4所示多个关联视图中进一步交互分析。
图4 系统整体界面图((a) 地图视图;(b) 类簇视图;(c) 统计视图;(d) 详细视图)
整体界面如图4所示,主要由4个关联视图组成:①地图视图基于地图进行事故多发路段可视化,便于用户直接观察事故多发路段并与之交互(图4(a));②类簇视图提供矩阵布局和t-SNE投影布局2种方式对聚类结果进行可视化,用户还可以通过一系列交互进一步操作和分析聚类结果(图4(b));③统计视图展示一组统计信息,并允许用户用危险度等属性过滤事故多发路段(图4(c));④详细视图用表格展示事故多发路段的详细属性(图4(d))。第4节的应用案例将展示图4中4个视图如何相互配合完成分析任务。本节介绍界面背后的相关方法和技术。
3.1 事故多发路段的聚类分析
因为每个事故多发路段均对应一组交通事故数据()={1,2,···,a},每个变量a可代表事故多发路段在某条件下发生的一起事故,如分析事故多发路段与天气的相关性时,()中各项可表示事故多发路段在各个天气条件下发生的事故,且本文认为()={1,2,···,a}的分布能用于刻画,所以当用户分析某个因素(如天气、时间)的局部相关性时,计算()={1,2,···,a}关于因素的直方图((),),以此作为特征刻画事故多发路段。如果因素是离散量,那么每个取值对应直方图中的一个Bin,如果是连续量,则将的取值范围划分为若干个区间,每个区间对应一个Bin,则无论因素是离散量还是连续量,都可设={1,2,···,f}。因为不同事故多发路段对应交通事故的数目不尽相同,而本文主要关注的是交通事故的分布特性,所以通过对直方图进行归一化以消除交通事故数的影响,直方图((),)的((),f)具体计算方法如式(3)。图5(a),(b)分别表示安徽省合肥市徽州大道3 200~3 900 m路段关于天气和时间周期的直方图。
其中,(aj, fi)为判断事故aj是否从属于因素fi,从而对事故多发路段S中所有在因素fi下发生的事故累加求和,并最终进行归一化处理得到S在因素fi下的直方图Bin的值。
基于特征((),),本文采用层次凝聚聚类算法(hierarchical agglomerative clustering, HAC)[21]对事故多发路段进行聚类,初步分析因素和事故多发路段的局部相关性。选用分层聚类算法是因为无需指定类簇数目,且允许用户在后续分析中交互地选择合适的聚类粒度,能更好地发挥用户善于进行探索分析能力的优势。
聚类过程中,本文采用卡方法度量直方图1和2之间的距离,如式(4)。也可采用任何其他合适的距离度量公式。
3.2 类簇的可视化、布局和交互
类簇是后续交互分析的主要对象,本文将从可视化、布局和交互方法介绍类簇。
3.2.1 类簇的可视化
和事故多发路段类似,本文采用直方图(,)刻画类簇,并用图6雷达图进行可视化表示:
(1) 直方图特征编码。雷达图的轴对应直方图的一个bin;
(2) 类簇大小的编码。同时用雷达图的大小编码表示类簇的大小,用类簇包含的多发路段数表示其大小,即
其中,||为类簇包含的事故多发路段数;为基础尺寸以防止||较小时雷达图过小,本文设=1。
(3) 类簇事故发生率编码。雷达图的填充色表示类簇的事故发生率(),由式(6)表示。雷达图采用半透明填充,以改进视觉效果,即
3.2.2 类簇的布局
本文支持2种布局方式:①行列整齐排列的矩阵布局法,如图7(a)所示;②基于t-SNE投影的布局方法,如图7(b)所示。
(a) 矩阵布局(b) 投影布局
2种布局方法各有优缺点:矩阵布局法整齐美观,当类簇较少时,建议用户采用;投影布局法能更好地表达类簇之间的相似性,适合类簇较多时采用。用户根据需要可以在2种布局方式之间进行切换。
3.2.3 类簇的交互
本文主要支持以下4类交互:
(1) 粒度选择。用户通过滑动条调整聚类粒度,观察聚类结果,选定合适的聚类粒度再深入分析。图8展示了不同层次的聚类结果。
(a) 粒度7(b) 粒度12(c) 粒度16
(2) 选中操作。用户双击类簇符号,则选中该类族,高亮显示,同时图4(a)和图4(d)中只显示该类族对应的事故多发路段。
(3) 合并操作。用户按住鼠标将类簇′拖动至类簇的位置,则类簇′和将合并形成新的类簇。图9(a)为合并操作的示意图。
(4) 分裂操作。用户用鼠标右键双击类簇的符号,类簇则分裂为′和。使用K-Means聚类方法将类簇所包含的所有事故多发路段分成2组,即′和。图9(b)为分裂操作的示意图。
(a) 合并(b) 分裂
3.3 事故多发路段可视化
本文基于地图展示事故多发路段,提供基于线的可视化和基于符号2种可视化方式:
(1) 基于线的可视化。用沿道路的线段表示事故多发路段:线的起点、终点分别对应于事故多发路段的起点、终点;线条的宽度用于表征事故多发路段的时间跨度,具体映射关系如式(7);线段的颜色用于表示事故多发路段的事故发生率。该可视化方法能较好地展现事故路段的主要信息:时空信息和事故发生率。图10(a)采用线可视化方式展示了2个事故多发路段。
其中,||为事故多发路段的时间跨度(天);为基础尺寸以防止线段过细,本文所有实验中=1。如图10(a)中1比2的时间跨度大,则表示1的线段比较粗。
(2) 基于符号的可视化。本文采用和3.2.1介绍类簇的类似可视化策略可视化事故多发路段:用雷达图表示事故多发路段的某个属性(如天气、周时间);雷达图的大小表示事故多发路段的时间跨度,映射关系如式(8);颜色对应事故多发路段的事故发生率。用户可指定符号放置在事故多发路段的起点、中点和终点处。图10(b)采用符号可视化方式展示了2个事故多发路段。
其中,||为事故多发路段的时间跨度(天);为基础尺寸以防止线段过细,本文所有实验中=1。
(a) 线可视化
(b) 符号可视化
4 案例分析
本文收集整理了安徽省合肥市的路网数据、2015—2018年交通事故接警记录、气象数据,利用本文方法分析了天气和时间周期2个因素与交通事故的局部相关性。
4.1 天气相关性分析
一般认为雨、雪等恶劣天气会引发更多交通事故,但事实上可能因为人们减少外出、小心驾驶,所以宏观统计结果可能显示恶劣天气并未引发更多交通事故。是否不同路段的表现不一样?本文试图用系统挖掘出感兴趣模式,然后对相关模式进一步分析。
因为需要分析天气相关性,所以首先采用天气直方图刻画事故多发路段,考虑“晴天、阴天、雨天、雪天”4种天气,然后对所有事故多发路段进行层次聚类,完成初步分析,用户在此基础上进行交互分析。
用户在图4(b)中观察聚类结果,此时采用矩阵排列法。首先交互选择聚类层次(图11),观察到层次3时类簇数比较合理,且观察到感兴趣类簇,因此选定该层次,并进一步分析。观察如图12(a)所示感兴趣类簇,发现其显示雪天事故发生比例比较高,表明相应路段雪天易于发生事故。
(a) 层次1 (类簇数4)(b) 层次2 (类簇数8) (c) 层次3 (类簇数12)(d) 层次4 (类簇数16)
(a) 类簇A(b) 类簇A′
通过将图4(b)切换到如图13所示的投影布局模式,发现类簇周围的几个类簇,也是雪天占比很高,和比较类似;将,拖入A中进行合并,形成如图12(b)所示的新类簇′。选中类簇′,在图4(a)和图4(c)中进一步观察具体的事故多发路段。
图13 投影模式类簇可视化
本文认为类簇'对应雪天易发事故路段,并将雪天事故比例最高的10条事故多发路段选择出来(表4)。在图4(a)中分别用2种方式可视化该10条路段,结果如图14所示。
表4 雪天易发交通事故的路段
经领域专家观察、分析结果发现:表4中路段的共同特点为南北走向。进而分析雪天当地风向多为北风,南北走向的路面更容易积雪结冰,且迎面的风雪更易影响司机的视线,所以该路段雪天更易发生交通事故。
4.2 时间周期相关性分析
在长期的生产实践中,人类将时间按不同周期性方式进行组织,如一天24小时、一周7天、一年12个月。那么交通事故发生和时间周期是否相关? 和天气类似,直接统计很难发现准确规律,所以本文以“周”为例,分析交通事故与时间周期的局部相关性。
(a) 线可视化
(b) 符号可视化
图14 雪天易发交通事故的路段可视化
通过每周7天bin的直方图刻画事故多发路段。和4.1节中天气相关性分析类似,本文获得如图15所示10个模式,其中模式显示周六、周日事故高发,通过模式选中,系统将在图4(b)和图4(c)中展示相关事故多发路段,如图16所示。观察发现其中一条路为九华山路。九华山路是安徽省合肥市有名的美食一条街,本文推断市民周末前往美食一条街消费,人流增加是引起交通事故增加的原因。
图15 时间周期性模式
图16 周六、周日易发交通事路段可视化
5 结束语
道路、车辆、天气、时间等众多因素均会影响交通事故的发生,但有些因素可能对不同区域/路段的影响不尽相同,即存在局部相关性。发现和理解这些局部相关性,有助于理解和掌握交通事故的规律,为交通事故防治工作提供依据。
本文试图挖掘出交通事故数据中所蕴含的局部相关性,为此设计了一套可视分析方法,主要贡献有:①提出基于事故多发路段的分析方法,和基于事故发生点分析方法相比,本文方法能从更高层次开展分析;②设计了一套聚类支持的多关联视图分析系统,在友好交互环境中半自动发掘局部相关性,充分发挥人类智能和机器智能的各自优势;③对安徽省合肥市2015—2018年交通事故接警数据进行分析,取得了一些有意义的结论。
本文的分析方法考虑了交通事故的位置、时间和天气,而交通事故还有事故类型、严重程度、道路情况等其他属性,未来将更全面地考虑相关属性,以便做出更深入、精细的分析;另外本文方法只支持单因素的局部相关性分析,而用户可能需要联合分析2个或多个因素,因此未来计划研究支持多因素的联合分析方法;本文目前采用“聚类+交互”的分析方法,虽然取得了不错的效果,但学术界提出了很多其他局部相关性分析方法,未来将从中选择更合适有效的方法来提升本文方法。
[1] ZHENG Y, CAPRA L, WOLFSON O, et al. Urban computing: Concepts, methodologies, and applications[J]. ACM Transactions on Intelligent Systems and Technology (TIST), 2014, 5(3): 38.
[2] GÜNNEMANN S, FÄRBER I, VIROCHSIRI K, et al. Subspace correlation clustering: Finding locally correlated dimensions in subspace projections of the data [C]//Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining. New York: ACM Press, 2012: 352-360.
[3] COOK K A, THOMAS J J. Illuminating the Path: The research and development agenda for visual analytics [M]. United States: National Visualization and Analytics Center, 2005: 4-5.
[4] 夏佳志, 张亚伟, 张健, 等. 一种基于子空间聚类的局部相关性可视分析方法[J]. 计算机辅助设计与图形学学报, 2016, 28(11): 1855-1862.
[5] PACK M L, WONGSUPHASAWAT K, VANDANIKER M, et al. ICE-visual analytics for transportation incident datasets [C]//Proceedings of the 10th 2009 IEEE International Conference on Information Reuse and Integration. New York: IEEE Press, 2009: 200-205.
[6] PIRINGER H, BUCHETICS M, BENEDIK R. Alvis: Situation awareness in the surveillance of road tunnels [C]//Proceedings of the 2012 IEEE Conference on Visual Analytics Science and Technology (VAST). New York: IEEE Press, 2012: 153-162.
[7] ANWAR A, NAGEL T, RATTI C. Traffic origins: A simple visualization technique to support traffic incident analysis [C]//Proceedings of the 2014 IEEE Pacific Visualization Symposium.New York: IEEE Press, 2014: 316-319.
[8] FAN X, HE B, BRÉZILLON P. Context-aware big data analytics and visualization for city-wide traffic accidents [C]//International and Interdisciplinary Conference on Modeling and Using Context. Heidelberg: Springer Press, 2017: 395-405.
[9] ALOMAR A, ALRASHED N, ALTURAIKI I, et al. How visual analytics unlock insights into traffic incidents in urban areas [C]//International Conference on Social Computing and Social Media. Heidelberg: Springer Press, 2017: 378-393.
[10] AGGARWAL C C, WOLF J L, YU P S, et al. Fast algorithms for projected clustering [C]//Proceedings of the ACM SIGMOD International Conference on Management of Data. New York: ACM Press, 1999: 61-72.
[11] BOHM C, RAILING K, KRIEGEL H P, et al. Density connected clustering with local subspace preferences [C]// Proceedings of the 4th IEEE International Conference on Data Mining. Los Alamitos: IEEE Computer Society Press, 2004: 27-34.
[12] AGRAWAL R, GEHRKE J, GUNOPULOS D, et al. Automatic subspace clustering of high dimensional data [J]. Journal of Data Mining and Knowledge Discovery, 2005, 11(1): 5-33.
[13] KRÖGER P, KRIEGEL H P, KAILING K. Density-connected subspace clustering for high- dimensional data [C]//Proceedings of the 4th SIAM International Conference on Data Mining. Los Alamito: IEEE Computer Society Press, 2004: 246-257.
[14] 马昱欣, 曹震东, 陈为. 可视化驱动的交互式数据挖掘方法综述[J]. 计算机辅助设计与图形学学报, 2016, 28(1): 1-8.
[15] FARBER I, TATU A, KEIM D, et al. Subspace search and visualization to make sense of alternative clusterings in high-dimensional data [C]//Proceedings of the IEEE Conference on Visual Analytics Science and Technology. Los Alamito: IEEE Computer Society Press, 2012: 63-72.
[16] TURKAY C, FILZMOSER P, HAUSER H. Brushing dimensions-a dual visual analysis model for high-dimensional data [J]. IEEE Transactions on Visualization and Computer Graphics, 2011, 17(12): 2591-2599.
[17] TURKAY C, LUNDERVOLD A, LUNDERVOLD A J, et al. Representative factor generation for the interactive visual analysis of high-dimensional data [J]. IEEE Transactions on Visualization and Computer Graphics, 2012, 18(12): 2621-2630.
[18] YUAN X R, REN D H, WANG Z C, et al. Dimension projection matrix/tree: Interactive subspace visual exploration and analysis of high dimensional data [J]. IEEE Transactions on Visualization and Computer Graphics, 2013, 19(12): 2625-2633.
[19] QIU C, XU H, BAO Y. Modified-DBSCAN clustering for identifying traffic accident prone locations [C]// International Conference on Intelligent Data Engineering and Automated Learning. Heidelberg: Springer Press, 2016: 99-105.
[20] KEIM D A. Information visualization and visual data mining [J]. IEEE Transactions on Visualization and Computer Graphics, 2002, 8(1): 1-8.
[21] ZEPEDA-MENDOZA M L, RESENDIS-ANTONIO O. Hierarchical agglomerative clustering [J]. Encyclopedia of Systems Biology, 2013, 43(1): 886-887.
Visual Analytics Method forLocal Correlation of Urban Traffic Accidents
LIU Xin-yue1, XIE Wen-jun1, YIN Cheng-sheng2, CHEN Jin-guang2, LIU Lu1, LUO Yue-tong1
(1. School of Computer Science and Information Technology, Hefei University of Technology, Hefei Anhui 230601, China; 2. Traffic Police Division, Public Security Bureau of Hefei Municipality, Hefei Anhui 230009, China)
Traffic accident data may contain meaningful patterns of traffic accident, such as correlations between traffic accident and weather, time, road, etc. It is worthy of in-depth study. In general, the traffic accidents are correlated with weather, time and road. However, the correlation effect is different among various regions, which means there are local correlations between those factors and traffic accidents. It is valuable to reveal the relation between these factors and traffic accidents by analyzing local correlations. The paper presents a method to discover local correlations in traffic accidents. Firstly, the method extracts accident-prone road segments, each of which contains location, time and some other related accident information. A cluster-supported local correlation visual analysis method is presented to analyze accident-prone road segments: some histograms of these factors (weather histogram, time histogram) are used to feature accident-prone road segments, and a cluster algorithm is applied to analyze accident-prone road segments based onthe similarity of histograms. The cluster results are further interactively analyzed in linked-views to discover local correlations. The method is used to analyze traffic accident data of Hefei by specialists, and some meaningful local correlations are found, which demonstrates the method’s effectiveness.
traffic accidents; visual analysis; local correlations; accident-prone road segments
TP 391
10.11996/JG.j.2095-302X.2019050843
A
2095-302X(2019)05-0843-09
2019-06-10;
2019-06-24
安徽省科技攻关计划项目(1604d0802009);国家重点研发计划项目(2017YFB1402200);国家自然科学基金项目(61602146);安徽省高等学校省级质量工程项目(2017jyxm0045);中央高校基本科研业务费专项(JZ2017HGBH0915)
刘新月(1995-),男,湖北潜江人,硕士研究生。主要研究方向为可视分析。E-mail:xinyue.hfut@qq.com
谢文军(1984-),男,安徽合肥人,讲师,博士后。主要研究方向为计算机图形学。E-mail:wjxie@hfut.edu.cn