APP下载

基于天地图的省市级节点地名/地址数据库构建研究

2021-09-27陈伊玲

经纬天地 2021年4期
关键词:门牌检索编码

陈伊玲

(重庆市勘测院,重庆 401121)

0.引言

中国信息化产业的高速发展,使得地理信息系统在各个领域应用的频率逐渐增多,人们对信息化服务的需求也在逐渐提升,全球信息化发展也为世界带来了一次变革。“数字城市”是现今国家信息化发展的关键特征之一,也是城市基础建设中必不可缺的主要内容之一。依据中国发布的城市总体规划战略来看,我国“数字城市”建设依旧处于初级阶段,主要目的是提升公共服务效果,加强城市管理效率,以此来满足城市的信息化需求。

省市级节点地名/地址数据库构建是“数字城市”建设的基础,也是地理空间建设的前提。省市级节点地名/地址编码指的是依据一定的编码规则与地名/地址模型将自然语言描述的地址位置信息进行转换,并将其与空间坐标关联,使其能够在地图上显示出来。在实际生活过程中,省市级节点地名/地址编码数据至关重要。相关专家指出,在政府职能部门中,蕴含着海量的业务信息量,例如,单位地址、小区地址等,但上述信息点无法使用文字形式准确查找到确定的位置,为城市管理带来极大的不利影响。故提出基于天地图的省市级节点地名/地址数据库构建研究。将空间信息与非空间信息进行有效地结合与关联,生成一个综合性、全面性的省市级节点地名/地址数据库,为城市规划、管理等相关部门提供完整的、清晰的数据支撑,同时也为社会经济、资源的可持续化发展打下坚实的基础,为政府、企业以及全社会提供更加优质的服务。

1.省市级节点地名/ 地址数据库构建研究

1.1 省市级节点地名/地址数据库构建框架搭建

以数据建设为核心、以服务应用为宗旨、以创新模式为主线、以协同工作与统筹规划为原则,搭建省市级节点地名/地址数据库构建框架,具体(如图1所示):

图1 省市级节点地名/地址数据库构建框架图

此研究主要以天地图地理数据为基础,通过提取与整合处理获取省市级节点地名/地址数据,依照一定的编码模型/标准对其进行编码、匹配,并设置检索与服务功能,从而实现数据库的构建。

1.2 天地图地理数据的解析与处理

以上述搭建的省市级节点地名/地址数据库构建框架(如图1所示)为基础,对天地图地理数据进行解析与处理,获取省市级节点地名/地址地理数据,具体过程如下:

常规情况下,天地图地理数据中包含政府公共地理数据与社会公共地理数据,对其进行解析与处理也划分为两个部分进行,避免地名/地址地理数据出现混淆事件的发生。

其中,政府公共地理数据解析与处理主要是对POI数据进行分类处理。依照现有的标准与要求,将POI数据划分为10个大类别、14个中类别、590分小类别。必须对POI数据进行逐一分类,保障每个省市级节点地名/地址均有所属的类别。

POI数据结构(如表1所示):

表1 POI数据结构表

社会公共地理数据解析与处理主要是对房产数据属性信息获取。采用RESTful接口,通过正则表达式等技术手段在天地图中获取房产数据。另外,需要注意的是,在房产数据解析过程中会涉及JSON解析,房产数据具备特殊的JSON数据结构,故需要使用XMLSpy对JSON数据进行转换,使房产数据结构与其他数据结构保持一致。

通过上述过程完成了天地图地理数据的解析与处理,获得了省市级节点地名/地址地理数据,为后续编码提供地理数据依据。

1.3 省市级节点地名/地址编码

以上述获取的省市级节点地名/地址地理数据为基础,分析地名/地址要素,构建标准地名/地址模型,确定地名/地址编码标准,从而完成了省市级节点地名/地址的编码。

依据国家要求以及天地图地理数据的实际情况,认定省市级节点地名/地址要素共为5类,具体如下:

(1)行政区划。行政区划主要功能为标注地名/地址的行政级别,包含国家层、省级层与市级层,此部分在编码中不得为空。另外,其还能反映地名/地址数据的粗粒度信息与所属行政范围;

(2)地址部分。地址部分是地名/地址数据的关键部分,承担着地名/地址的主要内容,此部分不得为空。地址部分主要为道路、门牌号等,反映地名/地址数据的中粒度信息;

(3)子地址部分。子地址部分是地名/地址数据的剩余部分,是地名/地址的补充信息,包含社区、楼牌号等,反映地名/地址数据的细粒度信息;

(4)别名部分。别名指的是城市或者道路或者社区的曾用名;

(5)补充部分。补充信息能够防止地名/地址重名带来的模糊性,结合补充信息进行交叉查询,能够有效提升数据库的检索效率。

标准地名/地址模型是由多个地名/地址要素形成的集合,并且地名/地址要素之间存在着较为复杂的层次关系。目前使用的标准地名/地址模型分为三个部分,具体如下:

(1)<标准地名/地址>:<行政区划><区域限定物><局部点位置描述>,其中,<行政区划>指的是政区类地名;

(2)<区域限定物>指的是低于政区类地名,包含基本地址元素的地名,例如,社区、道路、广场、公园等;

(3)<局部点位置描述>是地名/地址的最后元素,指的是点状地址元素类型,例如,楼号、建筑物、经济地名等。

通过上述描述可知标准地名/地址模型为层次结构,具体内容(如表2所示):

表2 标准地名/地址模型层次结构表

地名/地址编码是数据库构建的基础与关键,故必须保障地名/地址编码的正确性与精确性。在地名/地址编码过程中,必须遵循下述原则:

(1)科学性原则。能够在地名/地址编码中识别出地理实体的从属关系;

(2)唯一性原则。每一个地理实体在构建数据库中只能被唯一识别;

(3)标准性原则。地名/地址编码必须符合国家标准,方便地名/地址编码数据的共享;

(4)层次性原则。地名/地址编码必须能够体现包含要素之间的层次关系;

(5)可扩展性原则。以此来保障地名/地址编码能够适应对象的发展与变化[10]。

则地名/地址编码结构(如图2所示):

图2 地名/地址编码结构图

1.4 地名/地址编码匹配

以上述省市级节点地名/地址编码结果为基础,采用等分计算方法匹配地名/地址编码,提升构建数据库的精准度,方便数据库的应用。

一般情况下,若是数据库完备,标准地名/地址编码能够成功匹配,并获得精确的空间坐标信息。但若是数据库不够完备,则需要通过计算空间坐标值,对其进行交互式手动匹配定位。

省市级节点地名/地址路段与街道门牌存在两种方式:一种是两边均存在门牌号,采用奇偶数递增编排;另一种是一边存在门牌号,依据门牌号递增顺序编排。故在数据库不够完备前提下,必须先对地名/地址编码进行判断,这样才能保障匹配后的数据最接近信息点。但上述过程较为麻烦,故此研究利用等分计算方法匹配地名/地址编码。该方法将街道看作为一条直线,将建筑物看作为质点。设定地名/地址编码待匹配门牌为n0(x0,y0),其前一门牌坐标信息与后一门牌坐标信息分别记为n1(x1,y1)与n2(x2,y2),则待匹配门牌表达式,如式(1)所示:

假设前一门牌与后一门牌之间的距离长度为L,该街道与天地图纵轴之间的夹角为α,则待匹配门牌坐标的最大近似误差计算公式,如式(2)所示:

为了能够清晰地观察到地名/地址编码待匹配门牌坐标的最大近似误差,采用图形描述对其进行展示,(如图3所示):

图3 等分计算的误差示意图

当公式(2)结果最大近似误差无限趋近于零时,则完成了地名/地址编码门牌号的匹配。

1.5 地名/地址检索服务

地名/地址检索服务也是数据库的主要功能之一,以此来提升数据库的服务品质。构建数据库地名/地址检索服务主要通过capabilities、geocode与reverse接口来实现。其中,capabilities接口承担着检索操作结果反馈与处理的任务,其参数与注释(如表3所示):

表3 capabilities接口参数表

geocode接口承担着设计地名/地址检索过程参数的任务。geocode接口参数(如表4所示):

表4 geocode接口参数表

reverse接口接收检索者输入的信息,与capabilities接口参数相差一个point参数,其作用为依据地名/地址坐标信息,反算地名/地址的编码。

另外,地名/地址检索服务还需要满足前缀后缀规则、差值规则与跳跃表规则,以此来保障检索的正确性。

通过上述过程实现了省市级节点地名/地址数据库的构建,为省市级城市规划、政府相关管理部门提供数字化信息支撑。

2.实验与结果分析

为了验证构建数据库与现有数据库之间的应用性能差异,采用MATLAB软件设计实验。

2.1 实验对象选取

此实验以某省市级区域天地图为对象,其主要包含DLG数据与航片数据,具体情况(如表5所示):

表5 实验对象数据情况表

2.2 性能指标确定

为客观显示数据库应用性能,选取地名/地址匹配时间与地名/地址检索准确性作为数据库应用性能指标。其中,地名/地址匹配时间采用计时器即可获得。而地名/地址检索准确性数据需要对用户检索信息进行整理才能获得。则用户检索信息整理程序(如图4所示):

图4 用户检索信息整理程序图

2.3 实验结果分析

依据上述选取的实验对象,确定的性能指标进行数据库应用实验,通过地名/地址匹配时间与地名/地址检索准确性来反映数据库的应用性能,具体实验结果分析过程如下:

通过实验获得数据库应用性能数据(如表6所示):

(1)地名/地址匹配时间数据

(2)地名/地址检索数据准确性

如表6(1)数据显示:构建数据库地名/地址匹配时间范围为86.13s-117.23s,现有数据库地名/地址匹配时间范围为120.25s-165.45s。如表6(2)数据显示:构建数据库地名/地址检索准确性范围为81.45%-89.45%,现有数据库地名/地址检索准确性范围为59.40%-75.33%。

表6 数据库应用性能数据表

通过上述实验数据对比可知:相较于现有数据库来看,构建数据库地名/地址匹配时间更短,地名/地址检索准确性更高,充分证实了构建数据库应用性能更好。

3.结束语

此研究以天地图地理数据为基础,构建了一个新的省市级节点地名/地址数据库,极大地缩短了地名/地址匹配时间,提升了地名/地址检索准确性,为数据库应用与发展提供帮助,也为数据库构建研究提供一定的参考。

猜你喜欢

门牌检索编码
如何一秒改变一间房的气质
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
Genome and healthcare
一起做个青蛙门牌
专利检索中“语义”的表现
嘘,别出声
特殊门牌
国际标准检索