APP下载

标准地址模型在PGIS中的研究与应用

2014-06-30黄华国

关键词:编码定位数据库

摘要:本文从地理编码的角度出发,围绕当前PGIS未实现标准化地址库的现状,对标准化地址模型进行了建立,并据此设计了标准化地址数据库。本课题的研究,对于规范警用信息系统的标准地址数据库,解决警用信息系统中的地址匹配问题具有重要的意义。

关键词:地理编码 标准地址模型 PGIS

1 标准地址模型的建立

1.1 地址匹配分析

①地址匹配的概念

地址匹配,其实质是对空间的地理位置进行文字或口语描述与地图上位置的定位显示。在地址匹配过程中,需要将口语或文字描述进行计算机语言的转化处理,然后才能由计算机进行解析。

②地址匹配的基本条件

地址匹配,顾名思义就是指如何在空间信息中实现地址描述与真正位置的对应重合过程。地址匹配必须满足三个基本条件:一是被分析的空间对象需要具有必要的门牌地址;二是被分析的空间对象所处的空间位置必须包含在具有详细门牌地址的地区系统中;三是地址匹配的分析必须要求有一定的地理信息系统作为辅助。

区定位是最容易进行编码制定的,接着是段定位、物件定位,个体定位通常最难制定,但是从应用的角度来讲,个体定位显然最方便,而且能够随时向段定位、区定位转换。

1.2 标准地址模型

对我国的地址系统来说,都是比较复杂的,而且由于各地的历史发展轨迹不同,还缺乏一个适合我国现状的地址模型,各省或各地区的地址模型标准不一,无法进行完整的统一,尽管很多研究者就这方面的问题进行了很多城市的调研、总结,试图按照一定的规律建立标准的城市地址模型,但客观原因的存在,使很多尝试都搁浅。

1.3 标准地址模型的建立

标准化的对象包含对标准地址描述、路口描述、建筑物描述、路名加建筑物描述、路口加方向加距离描述,建筑物加方向加距离、标准地址加建筑物等七种描述,在这七种描述过程中,对于标准地址描述、路口描述、建筑物描述及标准地址加建筑物描述这四种来讲,其标准化的过程较为简单,只要进行一套标准的定位规范即可,定位方式采取在已经正规化的词库中进行各种字串的组合定位;而对于其余三种描述的方法,其标准地址模型的建立就较为复杂了。

如果将此三种描述的方法进行归纳总结的话,不难看出,这三种描述方法是利用某一参照物作为定位参考的,将这种参照物放置在空间信息描述中,可看作是一种空间的定位方向,那么,上述是那种空间描述的描述形态可简化为“标准方向”加“方向”加“距离”的模式,使用数学函数将其进行进一步表达为POT=(POT1 DIR1)*DIR2,在此公式中,POT1=(ROAD1+ROAD2)或者POT1=LAND1 or ADD1;DIR1=标准方向或者DIR1=(LAND2 for POT1)或者DIR1=(POT1 for LAND2);DIR2=NUM+UNIT。以上各式中每个参数所代表的含义具体如下:

POT1代表参照物的位置;POT2代表所描述空间目标的位置;DIR1代表方向变数;DIR2代表距离变数;ROAD1代表街道1;ROAD2代表街道2;LAND1代表建筑物1;LAND2代表建筑物2;NUM代表数字;UNIT代表单位;ADD1代表地址;*代表前进。

由前面的公式能够得出,如果方向变数为空值或零,并且距离变数也为空值或零的话,所描述的空间目标位置即等于参照物的空间位置。将上述情况进行综合,所表达的自然语言描述如下:空间任何位置的描述都可通过参照物的位置及其给定的方向并产生一定距离之后进行定位;而参照物位置则可以根据两条街道的交叉口或者建筑物或者标准地址进行确定。

2 地址数据库的设计与建立

地址数据库的建立是在标准地址模型基础上进行地址匹配的重要技术手段之一,也是地址匹配技术的根本所在。地址数据库设计的好坏直接影响着地址匹配执行的效率,同时该数据库也能够作为地址匹配算法设计的重要基础。

2.1 地址数据库设计的主要目标

地址数据库设计的目标非常简单,主要是根据人类自然语言所描述的一系列字符串,在其转换为标准地址之后,依据标准地址实现地图坐标的生成,从而进一步完善以地址描述为基础的空间定位技术,达到将空间坐标、计算机技术和自然语言三者的统一,实现对各种自然资源、社会环境的规划与安排,为各级政府部门提供空间与非空间的融合以及便捷的信息支撑功能。

2.2 地址数据库的结构设计

地址数据库的设计经过前人不断的进行研究,目前已经拥有了较为完善的设计方式,但是,标准地址模型描述的复杂性,使得地址数据库的设计也非常复杂,在实际的使用过程中,地址数据库的更新往往比较困难,这在一定程度上影响了地址匹配的准确度,也无法将地址数据库的作用发挥到最大。结合前文对标准地址模型的建立及地址描述的特点分析,想要通过地址数据库实现后续的地址匹配的精确查询,必须要建立一个适当范围大小的地址数据库,才能保证地址匹配的精确和效率。无论范围是过大还是太小,都会在很大程度上影响地址匹配,范围过大效率会降低,范围太小会无法满足需求。

针对地址数据库的设计,我国大多数地方都采取了GUID编码方式,此种编码方式具有使用简单,重复率低的优点,但它也具有不方便扩展的缺陷,为解决这一问题,本文采取了国际上较为流行的NAC地理编码方式进行地址数据库的设计。NAC地理编码是由加拿大科学家沈新航提出来的,此种编码不但在很大程度上保证了编码的低重复率,而且还具有了编码代表位置的特点,该方案设置中的每个位置都由独一无二的编码进行表示,可实现无限制的全世界范围内通用。其根本原理是把地球以及外部空间进行划分,划分以地心为中心进行,并根据划分的空间大小为其设置不同长度的编码,一般编码长度与精度成正比。当前,NAC的编码方式已经在全球超过30个的国家使用,它的通用性保证了它能够在今后进行更好的扩展。

本次研究采取NAC的结构设计方式,地址数据库具体的结构如下表1所示:

以上数据表的各个字段只是列举了地址数据库的核心字段,在保证这些字段都存在的基础上,使用者应根据区域数据的一些特点进行自身字段的增加,例如可增加邮编等字段进行查找定位的扩展。

3 地址匹配原型系统的设计与开发

3.1 系统开发环境

为实现本系统便捷、方便以及适应发展趋势的特点,满足对地址匹配算法的验证,本着开发简单、易于维护的需求,以及系统的普及性、容错性和可扩展性,本系统主要采用的开发环境和语言具体如下:

系统开发操作系统环境:windows系列的操作系统

所需的高级语言:JAVA Release 2;ASP.NET;C#

体系结构:J2EE

设计模式:MVC (model 2)

设计中所遵循的规范:J2EE1.2、EJB2.0、JSP1.2、Servlet2.3

数据库:SQL SERVER 2005

开发工具:SuperMap objects 5.0;SuperMap Deskpro 5.0等。

硬件环境:CPU为INTEL P4 3.0GHZ;内存DDR3 4G;显卡为ATI RADEON 4350;硬盘为320G

SQL作为一个关系数据库管理系统,是一项全面完整的数据库与分析产品,它提供了扩展数据库编程功能,可容易地插入、更新和删除数据。无论以应用程序开发速度还是以事务处理运行速度来衡量,SQL都堪称最为快捷的数据库系统。

3.2 系统总体框架

地址匹配原型系统由三部分组成,包括核心匹配算法模块、服务器端模块以及客户端模块。其中核心匹配算法模块主要包含有标准地址数据库、地名字典、地址解析算法、地址匹配算法等;服务器端则是地址匹配系统的运行服务器,包含有WEB地址监听服务、地址匹配配置库等功能;客户端模块则包含客户查询工具、客户配置信息等。

3.3 系统主要功能

鉴于本系统的直接目的是进行地址匹配算法和性能的验证,所以系统的设计模式相对简单,除了相应的客户端界面输入之外,重点对地址的精确匹配进行了设计,而有关模糊方式的匹配则在精确匹配基础上能够比较容易的实现。此外,本系统作为一个地址匹配的小型工具,地址数据库来源于苏州市的PGIS系统,大部分数据集中在苏州市区。本系统具有的主要功能如下:

一是客户端输入功能,本系统实现使用者通过客户端进行地址字串的输入,并能够在地址匹配前实现地址公式的选择。

二是地址解析功能。在接收到使用者从客户端输入的地址描述字串之后,系统将首先实现对地址字串的解析功能,只有在进行完全解析的基础上,才能进行后续的匹配。

4 总结

本课题的研究,对于规范警用信息系统的标准地址数据库,并解决警用信息系统中的地址匹配问题具有重要的意义。但限于本人时间与水平有限,在课题的一些方面研究的还不很深入,研究过程也难免存在疏漏之处,这都需要在下一步的研究中进行解决,主要工作如下:

一是对地名解析中的一些模糊描述还没有完成解析,如在自然语言描述中的一些定位词:附近、旁边、前面、后面等,这种模糊描述的类型更多需要使用到人工智能的方式,并需要结合基于频度的解析算法来完成。

二是基于标准地址模型的标准地址数据库还没有建立完善,目前只是针对苏州市的标准地址数据库,还需要进一步向全国范围内扩展;此外,一些地名在数据库中并不存在,但在自然语言描述时却可能存在,这也需要时间来进行完善。

参考文献:

[1]马林兵.Web GIS原理与方法教程[M].科学出版社,2006:11

-37.

[2]兰小机等.赣州市地理编码系统及其关键技术[J].测绘科学,2009(2):14-15.

[3]彭子凤,任福.基于数字深圳空间基础信息平台构筑电子地图服务体系[J].地理信息世界,2007(3):21-23.

[4]宋启凡.国外地址数据标准分析及启示[J].地理信息世界,2009(1):19-20.

作者简介:

黄华国(1965-),男,福建莆田人,副教授职称,硕士学位,信息工程系主任,主要研究方向:计算机地理信息系统。

猜你喜欢

编码定位数据库
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《导航定位与授时》征稿简则
《全元诗》未编码疑难字考辨十五则
Smartrail4.0定位和控制
子带编码在图像压缩编码中的应用
Genome and healthcare
找准定位 砥砺前行
青年择业要有准确定位