河南省地名数据库的构建方法研究
2012-08-24刘彬刘建忠刘宏建
刘彬,刘建忠,刘宏建
(信息工程大学测绘学院,郑州450052)
1 研究背景
地名即地理实体名称,它包含有丰富的社会、经济、历史、地理等诸多方面的属性,如行政隶属、地理位置、人口、高程等。它在政治、军事、外交、国民经济建设中有着特定位置,因而被各行各业的人员所关注。在地图上,地名指示具有一定范围、属于一定类型的地图要素,并与其所指示的地形地物构成一种特殊的映射关系,即随着地图比例尺变化,它会随地形地物的取舍而取舍,但不随之概括而被概括。因此,对地名与其所指示的地形地物分别建立数据库,在减少地名数据冗余采集、提高地名数据管理效率以及灵活地查询应用地名信息等方面都显示出极大的优越性[1]。
根据国家民政部《关于实施地名公共服务工程的通知》、《关于加快实施地名公共服务工程有关问题的通知》的要求,按照国家“十一五”规划,我国需要建成国家、省、地市、县四级国家地名数据库,形成及时、有效的数据更新机制[2]。国家民政部办公厅在民办函[2003]53号《关于建立国家地名数据库有关问题的通知》中明确指出:各地要抓紧建立省(自治区、直辖市)、市(州、地)、县(市)三级地名数据库,在此基础上建立全国地名数据库[3]。2006年,国家地名公共服务工程领导小组牵头联合开发了国家地名数据库,并于当年配发至国家、省、地市、县民政部门使用,该数据库初步包含3 000多万条专题地名信息和2万多幅图的空间信息,其中包括地名信息、区划信息、边界信息,涵盖了地名管理所有的地名类型。该数据库对地名数据类型进行了规范和扩展,并以全国1∶600万、1∶50万、1∶5万,城市1∶1万以上空间数据库为依托,是国家四级地名、区划、边界管理和公共服务应用中的核心数据库[4]。
因此,为了能够实现省内地名数据与国家地名数据库管理系统的交换、上报和汇总,河南省地名数据库的建设采用了省、市、县三级,为开展以互联网为平台的多种形式的地名信息化服务,建立完善的地名信息化公共服务体系,实现地名数据的动态更新与管理提供了良好的数据基础与支撑。
2 河南省地名数据的组织
地名作为公众最常使用的空间地理信息,应包含标准名称、坐标位置、隶属关系及自然、经济、历史、文化、民俗等相关信息。因此地名数据库具有信息量大、类型结构复杂、空间性强等特点[5]。河南省地名数据库在全省基础地理信息(1∶800 000、1∶50 000、1∶10 000等比例尺电子地图)的基础上将国家民政部规定的72类地名信息有层次、有选择、有重点的组织起来,建立省、市、县三级数据库,管理全省地名信息,为地名信息化建设提供数据支撑。
2.1 地名数据分类
河南省地名数据的组织是根据国家颁布的GB/T18521-2001《地名分类与类别代码编制规则》[6]以及国家民政部有关“建立地名数据库属性数据入库”的要求,结合河南省的实际情况,将地名数据划分为居民地、交通运输、建筑、水系、境界与政区、非行政区、单位、地名标牌、地名注记共9大类,56小类。其详细分类见表1。
2.2 地名数据的组织管理方式
在河南省地名数据库系统中,数据以“终端节点”为一个逻辑单位,内容包括“地名业务数据”、“规则数据”和用于地名系统应用支持管理的数据,包括“系统管理数据”和“数据管理数据”。其中核心数据就是“地名业务数据”和关于业务数据描述的“元数据”的集合。
河南省地名数据的组织和权限管理是以地市为单位的。一个市级地名管理节点包含的资源有:市及市辖县(区)的地名数据、门牌数据、1∶1万基础地形数据、地名业务管理数据,人员权限管理数据等。省级地名数据库需要管理自己的独立性数据(地区无此部分内容),如1∶5万基础地形图、省级地名信息等,还要管理各省辖市、县区上报的地名数据、省级地名业务管理数据,人员权限管理数据等。其具体的数据见图1。
表1 地名数据分类表Tab.1 The classification of toponym
图1 数据结构图Fig.1 Data construction picture
3 河南省地名数据的组织
3.1 地名数据库逻辑构成
根据数据的结构,省级地名数据库的构建在逻辑上可分为三大数据库:地名管理业务数据库、系统管理数据库、元数据数据库(包括规则数据和元数据),具体构成见图2。
图2 数据库结构图Fig.2 Database logical construction picture
3.1.1 业务数据库。业务数据库是指系统涉及到的河南省地名公共服务工程所有的业务数据。主要包括:基础地形图、区划专题数据、地名分布数据、门牌分布数据、统计分析专题图,还有业务管理、审批、更新操作等信息。业务数据是系统的核心数据部分。
3.1.2 系统管理数据库。系统管理数据库是实现对系统应用功能、系统业务数据的安全控制,主要包括用户、角色和相关权限的数据。系统管理数据库不参与系统数据的交换。系统管理除用户定义、权限管理外,还涉及业务规则,由信息中心统一管理和维护的数据库,用来描述系统业务的规则。系统管理数据库是系统数据动态管理的数据库,主要包括元数据及数据同步交换需要的相关数据。
3.1.3 元数据数据库。系统元数据是系统数据访问的接口支持者,也就是访问系统数据必须经过元数据进行。“元数据”与“业务数据”组成了“业务数据集合”,是系统数据交换的逻辑单位,也是分布式布置的基本逻辑单元。系统元数据的地名数据规则设置必须按照民政部国家地名数据库管理系统和基础地名数据库数据分类和数据项设置的地名专题数据标准作为行业标准进行。基础地形系统空间数据分层和编码标准将采用《国家标准1∶5 000、1∶10 000地形图图式》[7]第一部分数据分层、第二部分数据结构、第三部分要素分类编码。将地名管理专题空间数据与多比例尺度的基础地理地形图进行集成。
3.2 地名数据库物理构成
河南省地名数据库的物理构成主要包括以下3个部分。
3.2.1 基础地形图数据库。用于保存所有地形图数据。河南省各个区域的地图数据均放在该数据库中,包括全省1∶5万的基础地形图与18个省辖市城区1∶1万的电子地图。数据图层采用规则命名的方式来区分地图分类,采用统一的坐标系统,数据图层命名规则统一制定。基础地理信息数据库的设计遵循市区图与政区图技术规范,坐标系统为WGS84椭球下的地理经纬度,其在数据库中的具体分层设计见表2。
表2 地理要素分层Tab.2 The hierarchy of geographical elements
3.2.2 行政区划图数据库。用于保存河南省全省行政区划的现状和历史分布数据。数据库由元数据表和图片库组成。为提高数据管理的直观性,图片库采用文件管理模式,将每个变更任务所产生的系列图片存至系统认定的目录下,其结构见图3。
图3 行政规划数据库Fig.3 Civil layout database
3.2.3 基础地名数据库设计。根据国家民政部地名数据库建设要求,遵循地名信息数据规范,设计、建立地名信息数据库结构。河南省地名数据信息库包括9大类,56小类,各类别的属性要符合国家民政部地名属性信息规范,表3为以单位类信息为例的地名属性信息数据。
表3 单位类地名属性信息数据Tab.3 The attributes of toponym of units list
4 数据库构建关键技术
4.1 基于元数据的数据库系统
根据数据的结构,省级地名数据库的构建在逻辑上可分为三大数据库:地名管理业务数据库、系统管理数据库、元数据数据库(包括规则数据和元数据),具体构成见图2。
4.1.1 元数据的目的。元数据的根本目的是促进数据的高效利用,另一个目的是为计算机辅助软件工程(CASE)服务。
4.1.2 元数据的内容。元数据的内容包括:①数据的描述;②对数据集中的各数据项、数据来源、数据所有者及数据序代(数据生产历史)等的说明;③对数据质量的描述,如数据精度、数据的逻辑一致性、数据完整性、分辨率、源数据的比例尺等;④对数据处理信息的说明;⑤对数据转换方法的描述;⑥对数据库的更新、集成方法等的说明。
4.1.3 元数据的性质。元数据是数据的描述性数据信息,它主要用于反映数据集自身的特征规律,以便用户能够对数据进行准确、高效与充分地开发与利用。对于不同领域的数据库,其元数据的内容也有很大差异。
4.1.4 元数据的作用。通过元数据可以检索、访问数据库,可以有效利用计算机的系统资源,可以对数据进行加工处理和二次开发。
4.1.5 元数据的分类。根据作用的不同,可以将元数据分为“说明元数据”和“控制元数据”。“说明元数据”是为用户使用数据而服务的数据,它一般是描述性信息,侧重于数据库的说明;“控制元数据”是用于对计算机操作流程进行控制的数据,其内容包括数据的存储、检索及数据模型等。
4.2 基于SuperMap的空间数据库技术
随着GIS技术不断普及,地名数据从纯属性数据向空间和属性数据并存发展已经成为必然要求[5]。当前GIS技术发展的趋势是采用关系数据库或者对象关系数据库来管理空间数据。河南省地名数据库采用了Super-Map的SDX数据引擎来存储、访问空间数据,这样可以充分利用其RDBMS数据管理的功能,利用SQL语言对空间及非空间数据进行各项数据库操作,同时可以利用关系数据库的海量数据管理、事务处理(transaction)、记录锁定、并发控制与数据仓库等功能,使空间数据与非空间数据一体化集成,实现真正的C/S和B/S结构。采用关系数据库管理空间数据和属性数据,以此来确保空间和非空间数据的一体化集成。SDX技术是对各种不同来源、不同格式的空间数据,空间数据库引擎进行一致存取的统一接口方法,该技术可以在不改变原始数据格式和存储方式的情况下实现数据的动态访问。SDX的系统结构非常清晰,SDX本身采用两层结构,通过SuperMap IS可以扩展到三层和多层结构,能够容易地扩展到分布式管理的大型多台服务器群,维护、管理、操作方便,符合技术发展的潮流方向。SDX是基于先进的主流技术OLE-DB技术进行开发的,对客户端开发提供非常优秀的支持。在服务器方面,采用由DBMS开发商所提供的标准技术进行扩充,而不是采用外挂应用服务或对数据库底层进行替换或修改来实现;在SuperMap中,通过高效的索引机制扩展,让空间数据访问达到理想的效果(SuperMap SDX独有的线性可排序四叉树空间索引机制,极大地提高了空间数据库的访问速度),因而不仅能够提供高效的C/S结构的空间数据访问能力,并且还能够对其他的外挂式服务提供一致的存取方法。因此,通过SuperMap建立的空间数据库是真正的关系数据库,可以采用DBMS的常规方式进行管理和使用。SDX的这种体系结构非常适合以关系数据库作为服务器技术的应用系统的开发。
5 结论
河南省地名数据库的建设按照民政部国家地名数据库管理系统和基础地名数据库数据分类和数据项设置的地名专题数据标准,对矢量数据图层要素进行规划,对矢量数据图层要素字段进行规划,规范地名分类编码;基础地形系统空间数据分层和编码标准采用《国家标准1∶5 000、1∶10 000地形图式》第一部分数据分层、第二部分数据结构、第三部分要素分类编码。将地名管理专题空间数据与多比例尺度的基础地理地形图进行集成,建设信息完备的地名空间数据库。省级地名管理系统采用1∶5万电子地图,按国家标准在全要素的基础上,除国家保密数据以外的所有要素数据,以国家民政部规定的72类地名信息管理为主。省辖市地名信息管理系统以1∶1万电子地名图为基础,电子地图要求能满足导航查询功能,数据内容与分层按招标文件约定,在56类地名数据基础上,充分考虑了城市地名服务特点及要求,并进行合理的地图分层设计。
在具体的使用中,通过河南省地名数据库系统,可以更加直观系统的获取地名信息,为地名管理和领导决策提供支持;采用基于GIS的地名信息管理系统,图属一体化的数据管理与更新机制,全面掌握地名信息现状,实现地名信息的可视化管理,促进地名数据的高效管理和广泛、深层次的应用,为地名的调整和规范化管理打下基础;共享实时、准确地名空间信息,为专业应用系统服务,如财税、工商、邮政、城管、公安等单位提供了良好的数据服务保障;通过地名公共服务网站平台、触摸屏、电子光盘、问路系统等多种地名信息服务,为社会公众的衣食住行、旅游、物流、招商引资等提供了更加便捷、及时、现势、准确的地名信息服务。
[1]郜卫红.建立地名数据库的有关技术问题[J].测绘科技,1994(1):21-28.
[2]刘海珍,姬炜,李志刚,等.国家地名数据库管理系统的设计与实现[J].中国地名,2010(9):58-59.
[3]赫建忠,张保钢,张海燕.北京市数字地名的发展现状[J].测绘通报,2007(9):20-22.
[4]姬炜,胡小勇,刘海珍,等.基于国家地名数据库的空间分析[J].中国地名,2011(6):39-42.
[5]林少蓉.基于GIS的地名数据库建设探讨[J].浙江测绘,2007(4):14-16.
[6]中华人民共和国国家质量监督检验检疫总局.GB/T18521-2001地名分类与类别代码编制规则[S].北京:中国标准出版社,2001
[7]中华人民共和国国家质量监督检验检疫总局.GB/5791-861∶5000、1∶10000地形图图式[S].北京:中国标准出版社,1986