数据挖掘技术在突发事件应急系统中的应用与研究
2014-10-29钱昭勇陈梅
钱昭勇 陈梅
摘 要
处理突发事件需要多个部门相互合作,现阶段,针对信息的共享以及综合利用还存在欠缺,尤其是多维属性的数据方面。本文针对城市突发事件应急系统中的数据挖掘技术进行研究。
【关键词】数据挖掘 应急系统 突发事件
1 背景及相关技术介绍
现阶段,地理信息技术得到了广泛应用,由此使得各个行业存储了海量的数据,以上数据对指导和推动行业的发展起到了重要作用。下面通过相关技术介绍,为研究数据挖掘技术在突发事件应急系统中的应用奠定理论基础。
1.1 突发事件可视化表达
地理信息系统(GIS)立足于地理空间数据库的基础上,基于计算机软、硬件技术,对数据实施收集、整理、分析、判断,并加以模拟和显示,同时,借助于地理模型分析方法,适时提供多种空间和动态的地理信息,为地理研究、综合评价、管理、定量分析和决策服务而建立的一类计算机应用系统。在实际生活中,GIS被广泛运用到突发事件应用系统可视化表达中。
1.2 数据挖掘技术
数据挖掘中重要的组成部分包含聚类分析,利用聚类,人们可以对较为密集或者稀疏的区域进行区分,由此来辨别全局的分析模式和数据属性间的关联。聚类分析也即从给定的数据集中搜索数据对象之间的有价值联系。在数据分析中,通过聚类分析,将数据被划分成多个类,接着,在每个类中搜索模式或有价值的信息,在这种情况下,数据挖掘的其它技术将被运用到聚类分析的结果上。一般来讲,利用聚类算法,挖掘突发事件中的海量数据,发现突发事件高发或频发区域,同时,对某些事件的相关信息进行分析。
1.3 突发事件应急系统数据的模型设计
通常来说,城市突发事件空间信息模型包括以下概念。第一,地理位置。突发事件空间信息的基类,描述空间地理位置信息。包含信息名称描述以及空间信息的概括描述。第二,位置。描述地理位置的坐标值,包含经度以及维度。第三,地域。它主要描述一个具体的地理空间内容。第四,中心地区。城市突发事件空间信息中地域的中心区域。第五,区域范围。描述城市突发事件影响的空间的范围。第六,行政区划。描述事件发生地所属的行政区划。
2 突发事件应急系统数据挖掘算法设计
突发事件应急系统的数据库存储海量历史数据记录,通常来说,每条记录属性超过数十维,在这种情况下,如果想要高维显示事件,就需要对具体的数据记录规范实施分析,并从记录中自动提取文字描述的事件地点,接着,完成向GIS系统精确地理坐标的转换,同时,要实现其他属性数据在格式、内容上的变换,对转换后的属性信息进行帅选,使事件处置记录能融合到GIS系统中。本文重点介绍GeoCoding算法。
2.1 GeoCoding
借助GeoCoding算法,实现突发事件应急系统数据库地理信息自动精确转换。算法流程图如图1-1所示。
GeoCoding算法包含两方面。
(1)地址标准化。也就是把突发事件关联的街道、建筑等地址当成是标准化进行处理。例如,把街道地址变成较为熟悉、常用的格式等。
(2)地址匹配。也即确定具有地址事件的空间位置并且将其绘制在地图上,地址匹配的目标是为任何输入的地址数据返回最准确的匹配结果。首先它在街道级别的地址范围内进行精确匹配,如果没有找到匹配的地址,它会在上一级的地址范围内进行搜寻,直到找到匹配结果为止。最后,完成匹配的地址数据建立空间坐标,从而能够在地图上表示出此地址数据所代表的空间位置。
2.2 GeoCoding应用
对城市突发事件空间信息进行编码的时候,由于许多空间数据记录是非标准的,结果利用上述算法可能遇到如下问题:
(1)模糊地址,如果地图选择的对象以街道为基础,则有许多地址表达模糊,并且和多个街道地址相匹配。导致GeoCoding无法自动映射到准确的位置。如果地址粒度存在着差异,数据库中保存的地址数据的具体类型并不一直,由此所表达的空间范围大小也存在着差异。所以,需要确定数据属于街道地址级别抑或是城镇级别,或者是区域级别。
(2)精确度问题。基于数据库中地址数据所表达的地理准确度。假设试图定位到电缆、犯罪现场或者消防龙头,就要求较高的准确度,要基于街道一级的地址实施地理编码。
3 突发事件空间数据分析平台的实现
3.1 数据层
在数据层中,收集、整理人防、消防、公安、水利、电力等事件信息库作为包含时空信息的多维多类型事件库。
3.2 通用平台
通用平台实现算法和基础功能,为上层应用提供支撑,城市突发事件空间分析平台设计以开源的数据挖掘包WEKA作为基础,可提高设计、实现效率。通用平台包括基础算法库和通用组件层。基础算法库集成上述分析算法,通用组件层则是突发事件多维度时空挖掘、分析的公共基础。
3.3 应用支撑层
应用支撑层利用下层算法和通用组件提供的基础功能实现与业务相关的功能模块,为应急系统提供应用功能。第一,精确化指挥支持模块。第二,应急效率评估支持模块。第三,应急资源部署支持模块。第四,事件的时空模式预测支持模块。通过历史事件时间、空间模式的挖掘,实现对未来事件时空模式的预测支持。
参考文献
[1]何东.公共体育信息处理系统研究与开发[D].重庆大学,2009,123-128.
[2]张兴科,王浩.通过数据挖掘技术预测学生学习成绩[J].科技信息,2011,6(9):22-25.
[3]梁协雄,雷汝焕,曹长修.现代数据挖掘技术研究进展[J].重庆大学学报,2013,27(3):47-52.
作者单位
贵州大学计算机科学与技术学院 贵州省贵阳市 550025endprint
摘 要
处理突发事件需要多个部门相互合作,现阶段,针对信息的共享以及综合利用还存在欠缺,尤其是多维属性的数据方面。本文针对城市突发事件应急系统中的数据挖掘技术进行研究。
【关键词】数据挖掘 应急系统 突发事件
1 背景及相关技术介绍
现阶段,地理信息技术得到了广泛应用,由此使得各个行业存储了海量的数据,以上数据对指导和推动行业的发展起到了重要作用。下面通过相关技术介绍,为研究数据挖掘技术在突发事件应急系统中的应用奠定理论基础。
1.1 突发事件可视化表达
地理信息系统(GIS)立足于地理空间数据库的基础上,基于计算机软、硬件技术,对数据实施收集、整理、分析、判断,并加以模拟和显示,同时,借助于地理模型分析方法,适时提供多种空间和动态的地理信息,为地理研究、综合评价、管理、定量分析和决策服务而建立的一类计算机应用系统。在实际生活中,GIS被广泛运用到突发事件应用系统可视化表达中。
1.2 数据挖掘技术
数据挖掘中重要的组成部分包含聚类分析,利用聚类,人们可以对较为密集或者稀疏的区域进行区分,由此来辨别全局的分析模式和数据属性间的关联。聚类分析也即从给定的数据集中搜索数据对象之间的有价值联系。在数据分析中,通过聚类分析,将数据被划分成多个类,接着,在每个类中搜索模式或有价值的信息,在这种情况下,数据挖掘的其它技术将被运用到聚类分析的结果上。一般来讲,利用聚类算法,挖掘突发事件中的海量数据,发现突发事件高发或频发区域,同时,对某些事件的相关信息进行分析。
1.3 突发事件应急系统数据的模型设计
通常来说,城市突发事件空间信息模型包括以下概念。第一,地理位置。突发事件空间信息的基类,描述空间地理位置信息。包含信息名称描述以及空间信息的概括描述。第二,位置。描述地理位置的坐标值,包含经度以及维度。第三,地域。它主要描述一个具体的地理空间内容。第四,中心地区。城市突发事件空间信息中地域的中心区域。第五,区域范围。描述城市突发事件影响的空间的范围。第六,行政区划。描述事件发生地所属的行政区划。
2 突发事件应急系统数据挖掘算法设计
突发事件应急系统的数据库存储海量历史数据记录,通常来说,每条记录属性超过数十维,在这种情况下,如果想要高维显示事件,就需要对具体的数据记录规范实施分析,并从记录中自动提取文字描述的事件地点,接着,完成向GIS系统精确地理坐标的转换,同时,要实现其他属性数据在格式、内容上的变换,对转换后的属性信息进行帅选,使事件处置记录能融合到GIS系统中。本文重点介绍GeoCoding算法。
2.1 GeoCoding
借助GeoCoding算法,实现突发事件应急系统数据库地理信息自动精确转换。算法流程图如图1-1所示。
GeoCoding算法包含两方面。
(1)地址标准化。也就是把突发事件关联的街道、建筑等地址当成是标准化进行处理。例如,把街道地址变成较为熟悉、常用的格式等。
(2)地址匹配。也即确定具有地址事件的空间位置并且将其绘制在地图上,地址匹配的目标是为任何输入的地址数据返回最准确的匹配结果。首先它在街道级别的地址范围内进行精确匹配,如果没有找到匹配的地址,它会在上一级的地址范围内进行搜寻,直到找到匹配结果为止。最后,完成匹配的地址数据建立空间坐标,从而能够在地图上表示出此地址数据所代表的空间位置。
2.2 GeoCoding应用
对城市突发事件空间信息进行编码的时候,由于许多空间数据记录是非标准的,结果利用上述算法可能遇到如下问题:
(1)模糊地址,如果地图选择的对象以街道为基础,则有许多地址表达模糊,并且和多个街道地址相匹配。导致GeoCoding无法自动映射到准确的位置。如果地址粒度存在着差异,数据库中保存的地址数据的具体类型并不一直,由此所表达的空间范围大小也存在着差异。所以,需要确定数据属于街道地址级别抑或是城镇级别,或者是区域级别。
(2)精确度问题。基于数据库中地址数据所表达的地理准确度。假设试图定位到电缆、犯罪现场或者消防龙头,就要求较高的准确度,要基于街道一级的地址实施地理编码。
3 突发事件空间数据分析平台的实现
3.1 数据层
在数据层中,收集、整理人防、消防、公安、水利、电力等事件信息库作为包含时空信息的多维多类型事件库。
3.2 通用平台
通用平台实现算法和基础功能,为上层应用提供支撑,城市突发事件空间分析平台设计以开源的数据挖掘包WEKA作为基础,可提高设计、实现效率。通用平台包括基础算法库和通用组件层。基础算法库集成上述分析算法,通用组件层则是突发事件多维度时空挖掘、分析的公共基础。
3.3 应用支撑层
应用支撑层利用下层算法和通用组件提供的基础功能实现与业务相关的功能模块,为应急系统提供应用功能。第一,精确化指挥支持模块。第二,应急效率评估支持模块。第三,应急资源部署支持模块。第四,事件的时空模式预测支持模块。通过历史事件时间、空间模式的挖掘,实现对未来事件时空模式的预测支持。
参考文献
[1]何东.公共体育信息处理系统研究与开发[D].重庆大学,2009,123-128.
[2]张兴科,王浩.通过数据挖掘技术预测学生学习成绩[J].科技信息,2011,6(9):22-25.
[3]梁协雄,雷汝焕,曹长修.现代数据挖掘技术研究进展[J].重庆大学学报,2013,27(3):47-52.
作者单位
贵州大学计算机科学与技术学院 贵州省贵阳市 550025endprint
摘 要
处理突发事件需要多个部门相互合作,现阶段,针对信息的共享以及综合利用还存在欠缺,尤其是多维属性的数据方面。本文针对城市突发事件应急系统中的数据挖掘技术进行研究。
【关键词】数据挖掘 应急系统 突发事件
1 背景及相关技术介绍
现阶段,地理信息技术得到了广泛应用,由此使得各个行业存储了海量的数据,以上数据对指导和推动行业的发展起到了重要作用。下面通过相关技术介绍,为研究数据挖掘技术在突发事件应急系统中的应用奠定理论基础。
1.1 突发事件可视化表达
地理信息系统(GIS)立足于地理空间数据库的基础上,基于计算机软、硬件技术,对数据实施收集、整理、分析、判断,并加以模拟和显示,同时,借助于地理模型分析方法,适时提供多种空间和动态的地理信息,为地理研究、综合评价、管理、定量分析和决策服务而建立的一类计算机应用系统。在实际生活中,GIS被广泛运用到突发事件应用系统可视化表达中。
1.2 数据挖掘技术
数据挖掘中重要的组成部分包含聚类分析,利用聚类,人们可以对较为密集或者稀疏的区域进行区分,由此来辨别全局的分析模式和数据属性间的关联。聚类分析也即从给定的数据集中搜索数据对象之间的有价值联系。在数据分析中,通过聚类分析,将数据被划分成多个类,接着,在每个类中搜索模式或有价值的信息,在这种情况下,数据挖掘的其它技术将被运用到聚类分析的结果上。一般来讲,利用聚类算法,挖掘突发事件中的海量数据,发现突发事件高发或频发区域,同时,对某些事件的相关信息进行分析。
1.3 突发事件应急系统数据的模型设计
通常来说,城市突发事件空间信息模型包括以下概念。第一,地理位置。突发事件空间信息的基类,描述空间地理位置信息。包含信息名称描述以及空间信息的概括描述。第二,位置。描述地理位置的坐标值,包含经度以及维度。第三,地域。它主要描述一个具体的地理空间内容。第四,中心地区。城市突发事件空间信息中地域的中心区域。第五,区域范围。描述城市突发事件影响的空间的范围。第六,行政区划。描述事件发生地所属的行政区划。
2 突发事件应急系统数据挖掘算法设计
突发事件应急系统的数据库存储海量历史数据记录,通常来说,每条记录属性超过数十维,在这种情况下,如果想要高维显示事件,就需要对具体的数据记录规范实施分析,并从记录中自动提取文字描述的事件地点,接着,完成向GIS系统精确地理坐标的转换,同时,要实现其他属性数据在格式、内容上的变换,对转换后的属性信息进行帅选,使事件处置记录能融合到GIS系统中。本文重点介绍GeoCoding算法。
2.1 GeoCoding
借助GeoCoding算法,实现突发事件应急系统数据库地理信息自动精确转换。算法流程图如图1-1所示。
GeoCoding算法包含两方面。
(1)地址标准化。也就是把突发事件关联的街道、建筑等地址当成是标准化进行处理。例如,把街道地址变成较为熟悉、常用的格式等。
(2)地址匹配。也即确定具有地址事件的空间位置并且将其绘制在地图上,地址匹配的目标是为任何输入的地址数据返回最准确的匹配结果。首先它在街道级别的地址范围内进行精确匹配,如果没有找到匹配的地址,它会在上一级的地址范围内进行搜寻,直到找到匹配结果为止。最后,完成匹配的地址数据建立空间坐标,从而能够在地图上表示出此地址数据所代表的空间位置。
2.2 GeoCoding应用
对城市突发事件空间信息进行编码的时候,由于许多空间数据记录是非标准的,结果利用上述算法可能遇到如下问题:
(1)模糊地址,如果地图选择的对象以街道为基础,则有许多地址表达模糊,并且和多个街道地址相匹配。导致GeoCoding无法自动映射到准确的位置。如果地址粒度存在着差异,数据库中保存的地址数据的具体类型并不一直,由此所表达的空间范围大小也存在着差异。所以,需要确定数据属于街道地址级别抑或是城镇级别,或者是区域级别。
(2)精确度问题。基于数据库中地址数据所表达的地理准确度。假设试图定位到电缆、犯罪现场或者消防龙头,就要求较高的准确度,要基于街道一级的地址实施地理编码。
3 突发事件空间数据分析平台的实现
3.1 数据层
在数据层中,收集、整理人防、消防、公安、水利、电力等事件信息库作为包含时空信息的多维多类型事件库。
3.2 通用平台
通用平台实现算法和基础功能,为上层应用提供支撑,城市突发事件空间分析平台设计以开源的数据挖掘包WEKA作为基础,可提高设计、实现效率。通用平台包括基础算法库和通用组件层。基础算法库集成上述分析算法,通用组件层则是突发事件多维度时空挖掘、分析的公共基础。
3.3 应用支撑层
应用支撑层利用下层算法和通用组件提供的基础功能实现与业务相关的功能模块,为应急系统提供应用功能。第一,精确化指挥支持模块。第二,应急效率评估支持模块。第三,应急资源部署支持模块。第四,事件的时空模式预测支持模块。通过历史事件时间、空间模式的挖掘,实现对未来事件时空模式的预测支持。
参考文献
[1]何东.公共体育信息处理系统研究与开发[D].重庆大学,2009,123-128.
[2]张兴科,王浩.通过数据挖掘技术预测学生学习成绩[J].科技信息,2011,6(9):22-25.
[3]梁协雄,雷汝焕,曹长修.现代数据挖掘技术研究进展[J].重庆大学学报,2013,27(3):47-52.
作者单位
贵州大学计算机科学与技术学院 贵州省贵阳市 550025endprint