APP下载

城市规划和国土资源管理专业档案数据库整合研究

2024-10-22何孝莹

北京档案 2024年9期

摘要:在对北京市城市规划和国土资源管理专业档案管理现状和数据库管理系统进行详细分析的基础上,论文选择Elasticsearch搜索引擎技术建立检索平台来实现这两种专业档案异构数据库的整合,使专业档案数据能够被统一检索和集中展现,从而为用户提供一站式集成的档案信息服务。

关键词:专业档案 异构数据库 检索

城市规划和国土资源管理专业档案是城市规划部门、国土资源管理部门在各项业务活动中形成的,作为历史记录保存起来以备查考的资料。近年来,该类档案的管理随着档案标准建设、档案信息化建设的发展取得了一定的成就,但也存在一些问题。例如,在很长一段时间内,国内大部分地区城市规划和国土资源管理专业档案的管理隶属不同的机构,制度建设和信息化建设缺乏统一规划,专业档案信息资源共享利用困难。新一轮机构改革后,城市规划和国土资源管理机构进行合并,并将相关的业务和资源进行整合,而现有的专业档案管理方式显然不能满足城市规划和国土资源管理工作对专业档案数据利用的更高要求。为了使专业档案数据信息资源增值并提高服务效率,对已有的城市规划和国土资源管理专业档案数据进行整合是十分必要的。

下面将以机构改革后的北京市规划和自然资源委员会城市规划和国土资源管理专业档案数据库整合为例,探索专业档案数据资源整合的方法和技术,以期为新形势下城市规划和国土资源管理专业档案管理提供借鉴。

一、北京市城市规划和国土资源管理专业档案数据管理现状

北京市规划和自然资源委员会机构整合后,原城市规划和国土资源管理专业档案的管理职责统一由北京市城市建设档案馆(以下简称“北京市城建档案馆”)承担。目前,北京市规划和自然资源委员会主要业务档案体系中并行存在着两个专业档案体系,即原北京市规划委员会所属的城市规划管理专业档案体系和原北京市国土局所属的国土资源管理专业档案体系。在本文中,城市规划管理专业档案主要包括建设用地规划许可、建设工程规划许可、规划审批过程材料、建设工程规划核验意见和资质审批、招投标审批管理等类别的档案;国土资源管理专业档案主要包括土地利用规划、建设用地、土地市场、土地监察、矿业权、耕地保护、资源调查等类别的档案。

对于城市规划管理专业档案,目前采用市区两级管理方式,即北京市城建档案馆接收、管理委机关和部分委属单位产生的档案,各区分局城建档案机构接收、管理各区分局产生的档案,且北京市城建档案馆和各区分局城建档案机构负责对各自接收的专业档案进行整理编目和数字化加工处理等工作。城市规划管理专业档案数据资源通过北京市城建档案管理信息系统进行管理。该系统分为市馆版和区级版,两版采用的数据标准和系统架构完全一致,分别被部署在北京市城建档案馆和各区分局档案机构的内部局域网机房,同互联网物理隔离。国土资源管理专业档案市区两级的管理方式同前所述。国土数字档案馆系统对所有相关数据资源进行统一管理,包括数字化加工、存储及网络化利用。该系统于2014年建成,被部署在北京市政务外网上。北京市城建档案管理信息系统使用的操作系统为Win? dows Server 2012 Standard,数据库管理软件为SQL Server 2012;国土数字档案馆系统使用的操作系统为Windows Server 2008/2012 Standard,数据库管理软件为SQL Server 2008。

综上,北京市城市规划和国土资源管理专业档案分别采用不同的数据库系统和应用平台进行管理。其中,两个应用平台由不同的软件开发商开发,采用不同的专业档案数据标准规范和技术管理体系。用户利用这两类专业档案时需登录各自所属的系统,因此查询同一事项关联的城市规划和国土资源管理专业档案时,相关结果不能集中展现,利用专业档案费时费力。此外,因管理城市规划专业档案数据的市区两级北京市城建档案管理信息系统都被部署在各自的局域网环境中,与政务外网上的业务系统物理隔离,所以各系统之间的数据共享存在障碍,数据交互只能通过线下人工方式进行;管理国土资源管理专业档案数据的国土数字档案馆系统则因建设时间较早,系统兼容性差,专业档案数据查询利用量大时存在使用瓶颈,影响用户体验。

二、北京市城市规划和国土资源管理专业档案数据库整合研究

“数字档案资源整合是对现有档案数字资源进行重组,依据一定的需要,对各个相对独立的信息系统中的档案数字资源、功能结构及其互动关系进行融合、类聚和重组,重新结合为一个新的有机整体,形成一个效能更好、效率更高的新的资源系统”。[1]档案数据库整合强调在充分利用现有资源配置的条件下,对分散的、不统一的档案数字资源库基于一定的机制进行优化和多资源的无缝链接,最终实现档案数字资源的合理管理、高效服务及档案本身价值的增值。[2]

基于此,如何实现前面提到的两个异构专业档案数据库的整合,从而为用户提供一步到位的城市规划和国土资源管理专业档案信息服务是本文需要研究的关键。

通过研究发现,对不同数据库进行检索并提供统一的操作界面是异构数据库整合研究的一个重要方向。检索包括两个核心过程,首先按检索关键词查找并生成结果集,其次对查找结果进行进一步选择处理,生成检索结果。

元搜索引擎技术是一项高效的检索技术,具有全局控制机制的特点。被应用于数据库整合时,它并不对数据库中的信息进行搜索,而是对控制范围内的搜索引擎进行集成,是在子搜索引擎基础上发展起来的、为用户提供统一检索入口的异构数据库整合方式。相对于传统的档案搜索引擎,元搜索引擎能够提供跨库检索功能,进而实现对各种档案异构数据库资源的互操作,用户无须逐个登录档案数据库检索界面进行访问。[3]

对不同数据库进行检索还有一个关键,即要保证档案数据资源和数据库功能在不受破坏的基础上实现数据的集成管理。网格技术具有此功能,可以将地理位置上分散的、异构的信息资源集成在一起,是一种集计算、存储和服务为一体的异构数据库整合技术,能实现对异构数据库信息资源的透明访问。网格将散落在各地的档案异构数据库信息资源整合进数据库网格,然后将数据库网格中存放的档案数据库检索界面进行整合,将各个档案异构数据库中的档案管理业务流程进行集成,并使其在不同的应用网格上运行,从而为用户提供一体化的档案信息服务平台。[4]

Elasticsearch搜索引擎技术集成了元搜索引擎技术、网格技术等异构档案数据库整合技术的优点,[5]能够达到稳定、可靠、快速的实时搜索和呈现。首先,Elasticsearch搜索引擎技术支持分布式存储,其搜索功能建立在海量数据之上,本身可以作为海量数据的存储工具。在本研究中,可将城市规划和国土资源管理专业档案等异构数据同步到Elasticsearch里存储。其次,使用该技术搜索时采取倒排方式,异构数据库中的每个字段都可以被用于搜索,然后根据字段出现的频次信息对档案信息进行排序,使相关性越高的搜索结果排序越靠前。另外,该技术还提供了包括模糊查询、前缀查询、通配符查询等在内的多种查询手段,帮助用户快速高效地进行检索。与此同时,该技术还提供大数据量分析能力,支持在海量数据的基础上进行数据的分析和处理,为用户提供最相关、最可靠的检索结果。

三、基于Elasticsearch搜索引擎技术的专业档案数据库整合实现

通过对北京市城市规划和国土资源管理专业档案数据管理现状与专业档案数据库整合方法进行分析,本文提出了以下整合方案,并采用Elasticsearch搜索引擎技术建立统一的检索平台,以实现城市规划和国土资源管理专业档案数据库的整合。

(一)城市规划和国土资源管理专业档案数据库整合方案

根据前期调研的北京市规划和自然资源委员会业务整合现状、城市规划和国土资源管理专业档案市区两级管理现状,为最大限度地利用已有的专业档案数据资源和软硬件设备,并提供最便捷的专业档案信息服务,本文确定了物理整合和逻辑整合相结合的专业档案数据库整合方案。

1.将市区两级城市规划和国土资源管理专业档案资源进行集成管理和分布式存储。首先使用统一的数据标准建库和补全专业档案数据。对于城市规划专业档案,由北京市城建档案馆建立委机关专业档案数据库,各区分局建立自己的专业档案数据库;对于国土资源管理专业档案,则按照传统采用统一的数据库进行管理。建立专业档案数据库并补全专业档案数据后,所有的专业档案数据库被移植到政务外网。

2.建立专业档案统一检索平台,提供唯一的信息检索页面,完成城市规划和国土资源管理专业档案数据库的最终整合。在检索平台上,通过Elastic? search搜索引擎技术,使城市规划和国土资源管理异构专业档案数据库的海量信息能够快速被统一检索和集中呈现,为专业档案用户提供一站式集成的档案信息服务。

(二)基于Elasticsearch搜索引擎技术的专业档案统一检索的实现

用Elasticsearch搜索引擎技术实现统一检索的关键包括数据层的管理、定时任务数据同步的调度和搜索引擎的设置。

1.使用Elasticsearch搜索引擎技术进行检索时,数据层使用双数据源模式(即以SQL Server作为数据库管理系统和Elasticsearch作为搜索引擎兼数据容器),将城市规划和国土资源管理专业档案数据存放在Elasticsearch中,以便其底层的搜索引擎采用倒排索引技术进行搜索。

2.通过配置定时任务的方式实现数据同步。对于定时任务数据同步采用Quartz调度,使搜索数据资源时专业档案数据能被同步至Elasticsearch,并对有问题的数据进行标记。

3.搜索引擎使用倒排方式,使城市规划和国土资源管理异构专业档案数据库中的每个字段都可以被用于搜索,最终将城市规划和国土资源管理专业档案中具有相关性的数据全部检索出来。

在专业档案统一检索实现的基础上搭建城市规划和国土资源管理专业档案统一检索平台后,市区两级专业档案用户可以登录平台的统一检索界面,检索城市规划和国土资源管理专业档案的所有数据资源。平台能同时调阅多个分布式存储的专业档案数据库,根据统一权限控制用户访问不同的专业档案数据库和数据资源,并提供多种专业档案信息的浏览、下载、打印等功能。

四、结语

城市规划和国土资源管理专业档案在城市规划建设管理中具有重要的地位,是现在和未来城市规划建设管理的参考依据。本文通过专业档案数据库的整合实现了大体量、多类别的城市规划和国土资源管理档案数据“云服务”利用,更好地发挥了此类档案在北京市城市规划建设管理工作中的辅助决策作用。如何进一步将云计算、大数据等技术运用于专业档案数据整合工作中,通过海量信息提取与分析,实现档案结构化与非结构化数据编研分析及产品定制,为城市规划建设管理用户提供更精准的、更高质量的专业档案信息服务是下一步研究的方向。

*本文系北京市档案局科研项目“北京市规划和自然资源系统专业档案数据库整合研究”(项目编号:2020-13)的研究成果之一。

注释及参考文献:

[1]安小米,宋懿,张斌.国家数字档案资源整合与服务:概念、路径和机制[J].档案学研究,2018(3):81-88.

[2]张占武.高校档案信息资源整合探究[J].北京档案,2021(6):25-26.

[3]王海鸥.档案信息资源整合与利用探讨[J].兰台内外,2020(7):42-43.

[4]王雪萍.浅谈档案异构数据库整合与服务集成的技术实现[C]//中国档案学会.档案与文化建设:2012年全国档案工作者年会论文集(上),2012:421-429.

[5]裘紫阳.面向Elasticsearch的监控管理平台的设计与实现[D].武汉:华中科技大学,2019.

作者单位:北京市城市建设档案馆