城市数字化标识在跨领域政务数据整合中的应用
2023-12-01陈宋彬汪军勇成雨阳
陈宋彬,胡 聪,汪军勇,成雨阳
(1.深圳市光明区政务服务数据管理局,广东 深圳 518000;2.吉奥时空信息技术股份有限公司,湖北 武汉 430223)
0 引言
近年来,随着信息技术的飞速发展和数字化转型的不断推进,政务数据资源整合共享成为现代政府治理的重要议题,也成为数字政府建设的核心之一。通过有效整合与深入开发利用,发挥现有政务数据的真正价值,有助于推进政府治理流程优化、模式创新与履职能力提升,构建数字化、智能化的政府运行新形态,服务社会经济发展,助力国家治理体系与治理能力现代化水平提升。
当前,全国31 个省(自治区、直辖市)均已结合政务数据管理和发展要求明确政务数据主管部门,初步形成覆盖国家、省、市、县等层级的政务数据目录体系,人口、法人、自然资源、经济等基础库初步建成,汇聚编制政务数据目录超过300 万条,信息项超过2 000 万个,在调节经济运行、改进政务服务、优化营商环境等方面发挥了重要作用[1]。然而,政务数据资源整合共享仍存在政务数据资源共享目录内容不全面[2]、数出多源[3]、协同联动乏力[4]、数据质量校正无法完整闭环[5]、数据整合形式单一[6]等问题。在需求时效、数据质量、工作制度、开展流程、组织协同等多个方面不确定的情况下,跨领域的数据互认度与整合度往往偏低,相关成果亦难以有效应对未来的数据规划。因此,实现跨领域的政务数据整合,通过数据治理驱动流程改造,通过流程重组实现源头治理是当今数据管理领域的热点和难点之一。为此,本文提出一种基于城市数字化标识的一数一源、源头治理、数据整合驱动业务的全新模式[7],从数据应用规划入手盘点现状、规划未来,对人、房、企、时间、空间等关键要素进行治理与整合,实现跨领域数据整合能力的提升。
1 相关研究
数字政府建设是在政务数据资源综合开发利用的基础上形成的一种新型政府管理和治理形态。要落实好数字政府建设就必须充分利用政务数据资源,首要工作就是对现有政务数据资源进行治理,消除当前政府部门之间的“数据孤岛”和“数据鸿沟”,突破业务壁垒,重塑业务流程,促进业务协同,形成政府多部门间的业务联动,使广大群众切身感受到信息技术带来的利好。在不同数据治理目标、组织协同、系统联通、数据应用的现状下,马广惠等[8]深入研究分析统筹规划与实践应用构成的两类政府大数据共享交换情境下的大数据治理路径,并将其分为重数据架构和重数据应用两种数据治理模式。
1.1 重数据架构的治理模式
重数据架构的治理模式是一种自下而上的模式,旨在通过建立通用、全面的数据层及工具层,层层向上治理数据,直至数据应用层。该模式从底层数据切入,全面盘点现有数据基础,建立类似数据仓库的数据架构,在数据规划、建设、治理、应用全流程的各个环节建立相关组件及标准,例如,邹倩瑜等[9]提出基于中台架构的“1+2+3+N”科技政务数据治理模式,从数据编目、数据汇聚、数据管理、数据共享与开放、数据应用等方面明确基于中台架构的科技政务数据治理实施路径。
重数据架构模式以现有数据为核心,试图在数据层面做好组织与规划,在一致的数据架构下逐层往上推进平台、应用的建设,在实施过程中对数据治理的整体思维、水平要求较高,通常适用于数据量重、业务应用轻的大型技术部门。
1.2 重数据应用的治理模式
重数据应用的治理模式是一种自上而下的模式,通常以现有应用需求为核心开展数据治理,聚焦各个业务领域的数据应用、数据治理需求,在有需求、有资源、有驱动力的前提下按需组织推进数据治理工作。例如,宁家骏[10]提出应以需求导向突破大数据应用关键技术,将大数据应用总体设计、关键技术研发、业务数据模型等作为推进大数据发展的首要任务,构建大数据应用服务平台。其认为只有业务部门的深入参与才能做好数据治理,只有针对业务自身需求进行的治理才能得到业务部门的认可与支持。
重数据应用的模式以满足业务需求为导向进行数据治理,通常适用于数据应用较强、业务部门较为强势但整体数据认知较弱的部门。该模式的数据治理切入相对较为简单,大部分组织数字化转型初期会使用这种模式,慢慢探索组织的数据治理道路。该模式有助于拉齐数据部门、业务部门的认知,提升整体数据认知,为未来数据治理的开展奠定基石。
1.3 分析与比较
重数据架构模式是基于底层数据进行治理的,对数据治理水平要求较高。数据治理水平包括数据基础(数据量、数据质量等)以及数据治理能力,其中数据治理能力主要体现在数据治理团队专业度以及数据治理体系(组织、制度及流程)完善度方面。这种模式对政府部门协同度要求相对较低,主要靠数据治理团队推动进行。整体而言,重数据架构模式能良好地汇聚、治理数据,但脱离应用,对执行团队架构能力要求较高,成效慢。
重数据应用模式是基于明确的数据应用需求进行治理的,对政府部门的协同性要求更高,需要业务部门与数据部门配合实现。整体而言,重数据应用模式能比较方便地切入,数据价值更容易体现,但整体以需求为主,重应用、轻治理,容易出现重复治理的风险,对数据治理水平要求一般。
两种模式主要着眼于历史与现状需求,难以有效应对跨领域的数据协同与治理,亦无法满足未来规划提出的新需求。当围绕常规需求集中治理了某一类型数据,而业务需求范围有了新的扩展,需要整合新的数据字段时,则需面向数据来源部门重新进行需求对接,原始数据也需要全面进行更新与对账。此外,在治理过程中,部分数据安全性要求较高,无法进行统一归集。由于无法提供良好的机制对数据进行分级共享,这一部分数据将无法有效利用。
国际社会围绕科学数据开放共享体量、质量、权属、风险采取了一系列治理对策。随着科学数据开放共享程度逐渐加深,科学数据治理内容体系也随之拓展,数据出版成为数据共享的重要途径,可信任数据成为质量治理的关键准则,数据信托成为权利治理新方案,全球化、技术化治理成为国际趋势[11]。本文提出的基于城市数字化标识的政务数据整合模式即为以上思路的一种具体实现路径。基于城市数字化标识的政务数据整合模式立足全面的业务痛点盘点与未来规划,以长远的眼光覆盖业务、数据双层面以降低重建风险,通过聚焦业务充分挖掘数据价值,同时不断完善数据管理制度以推进政府部门协同性的流程改造,将政府部门数据治理水平推向了一个新水平。
2 基于城市数字化标识的政务数据整合
城市数字化标识是为城市每一个数据资源赋予的符合规则的“身份编码”,即将数据作为城市管理对象。本文以城市数字化标识为基础,通过“三步法”实现跨领域的政务数据整合:第一步将空间位置计算与文本语义计算相结合[12],建立位置表达的多模态;第二步通过城市数字化标识驱动数据治理流程改造,并通过流程重组实现源头治理,进而重构治理体系;第三步与块数据[13]相结合开展政务数据之间的整合,实现跨领域之间的数据整合共享,促进建立健全规范有序的数据共享体系,为推进国家治理体系和治理能力现代化提供有力支撑。城市数字化标识系统架构如图1所示。
Fig.1 City digital identity system architecture图1 城市数字化标识系统架构
2.1 空间位置计算与文本语义计算相结合
空间位置是地球空间信息的一部分,统一地址需要自然语言处理,利用多模态数据融合的方法将空间位置计算与文本语义计算相结合,构筑出社会治理的第三大参照物体系,为每一个建筑物和房屋赋予唯一地址编码,建立形成统一地址[14]。在政务数据整合过程中,以统一地址作为抓手,关联各委办局数据,一方面实现数据空间底数一致,即不同委办局可在同一个空间底板上叠加业务数据,实现数据共建;另一方面利用空间位置的相对固定性实现政务数据空间可数、精准下沉。
统一地址文本数据预处理是指根据文本对所有地址进行分节解析,对来自规自、公安、民政等多个不同来源的数据进行地址匹配,对于地址描述不完整的数据进行标准化数据处理。空间位置计算与文本相匹配是指对带有空间位置坐标信息的数据进行投影转换工作后,通过空间位置坐标直接匹配集成;对部分自身没有空间坐标信息,但在属性项中蕴含了地名地址或只是蕴含了一些地名基因的数据,结合汉语分词与数据比对技术,根据识别提取出的地名地址信息建立含有地名标识的切分序列与逻辑组合关系,开展基于分词、本体和词语相似性的多种匹配,采用局部模糊匹配后的歧义消除方法,通过基于语义和地理本体的统一认识提取地名谱特征,实现高效、进准、实用的地名地址匹配。依托空间基准,采用地名地址匹配方法,对用于城市数字化标识的信息内容进行时空定位寻址。
2.2 城市数字化标识重构治理体系
城市数字化标识通过盘点资产、制定规范、搭建平台、建立机制等实现城市管理对象之间的万物互联、数据融合,并在此过程中对治理体系进行重构。
2.2.1 盘点政府部门城市管理对象及建立分类体系
在政府部门已开放的“三清单”的基础上增加按管理对象梳理部门的数据清单,即在管理事项的基础上进一步梳理政府部门的管理对象,以人、地、事、物、组织为参照,细化每一项包含的类别、属性(含基本属性、业务属性等)以及责任部门[15]。城市数字标识与其他实体之间的逻辑关系如图2所示。
Fig.2 Logical relationship between city digital identity and other entities图2 城市数字标识与其他实体之间的逻辑关系
基于合并同类项的原则,按照管理对象的全生命周期信息(基本属性信息、业务属性信息、业务过程信息、责任主体信息等)对分散在不同部门的数据进行归并,找到共同所附属的管理对象,对列出的城市管理对象进行分级分类,按照不同需求进行共享。
2.2.2 构建统一数字化标识的编码标准,建立“一码关联”的基础
对需要进行数据管理的对象进行分类与身份数字化。参考地理实体编码、城市部件编码等国家、行业规范,根据大数据发展、共享、利用的趋势制定一套统一的编码体系,为每个城市管理对象赋予唯一标识码,通过建立城市管理对象统一的分类与编码规范,形成统一共享、唯一识别的编码标准,各单位可使用唯一数字标识快速获取跨层级、跨地域、跨系统、跨部门、跨业务的数据关联信息[16]。
参考现有国家、地方、行业相关分类规范,重点考虑易读性、简洁性,采用“行政区划码+对象分类码+顺序码”三部分组成的编码方式,共23位。具体如表1所示。
Table 1 City digital identity coding standards表1 城市数字化标识编码标准
第一段由12 位数字组成,表示基础网格及以上的政区管理单元代码,其中第1-6 位为县级以上行政区划代码,执行GB/T2260 中华人民共和国行政区划代码标准;第7-9 位表示县级以下行政区域,执行GB/T10114 县级以下行政区划代码编制规则;第10-12 位表示社区代码,执行SZDB/Z3 社区服务与综合管理信息化技术规范。跨政区管理单元的地理实体采用其上级政区管理单元代码,其余位置置0 表示。第二段由5 位数字组成,表示分类代码。第三段由6 位数字组成,表示顺序码,具体代码段为000001-999999。
2.2.3 建立规则一致的统一赋码平台,确保数字化标识建档标准化
平台提供自定义编码规则的能力,并按照编码体系标准定义出符合要求的编码规则,提供自动化编码服务,通过上报数据的种类及数量查看编码过程进度以及完成结果提示,通过统一的赋码平台确保数字化标识建档涉及的数据信息标准化。统一赋码平台支持存量数据处理、增量服务调用两种模式,对于存量数据平台采用批量对接方式统一赋码,对于增量数据平台采用接口服务方式提供赋码。
2.2.4 建立数据协同平台,驱动部门流程改造
以数字化标识的城市管理对象为纽带,以政府部门管理对象的数据清单为基础,通过建立数据协同平台实现同一政务数据不同业务属性之间的相互调用,使不同信息内容进行分级共享[17]。
数据协同平台主要以接口的方式通过城市管理对象的统一编码作为主体参数实现城市管理对象涉密属性数据的获取,接口支持数据落地托管与数据不落地托管两种方式。其中数据落地托管是相关数据统一交换到政务数据主管部门,由政务数据管理部门统一提供接口;数据不落地托管则是由源头部门根据数据协同平台的技术标准开发定制规范接口,并挂接到数据协同平台,由数据协同平台统一进行质检、管理、监控与授权。以人口信息为例,人口的统一编码、证件类型、证件号、姓名、民族、性别、籍贯、户籍地址作为基本信息统一交换到数据共享平台后对外进行共享,人口的社保信息、住房信息、居民失信信息等则可以由各单位充分保留数据资产的权利不通过交换向数据共享平台进行归集,而是通过提供符合数据协同平台标准的接口进行数据共享。在人口信息的场景中,分别由人力资源社会保障部门提供人口社保信息、房管部门提供人口住房信息、征信部门提供居民失信信息,服务数据可通过人口的统一编码进行关联与融合。
2.2.5 建立数据反馈机制,加快数据从使用到反馈的完整闭环
对城市管理对象进行全面梳理,建立业务属性来源的责权部门清单。当使用部门对数据有异议时,可通过数据反馈机制对数据来源单位提供的法源现值、使用部门提供的参考值进行上报,数据来源部门对反馈问题进行核实,核实完成后对问题予以通过或拒绝并提供理由,确保了数据在使用过程中不断完善。如此以来,数据的更新工作由被动推送到主动确认,较好地实现了数据更新的闭环。
2.2.6 建立城市管理对象责任主体档案,定期更新考核
按照各单位梳理城市管理对象全生命周期的更新部门、更新时间、检查机制,为每一个数字化标识码明确来源,形成管理共识,促进业务协同[18]。
2.3 与块数据相结合开展政务数据整合
以多模态数据为基础,城市数字化标识为核心,建立人口、房屋、法人、事件、城中村、小区、工地、物联设备、视频监控等数据的关联,将各个行业条线上的条数据打造为具备各类关联关系的块数据[19]。
数据关联入块的流程为:首先在统一地址库建设完成后进行基础数据资源—地址库的建设,实现基础数据与统一地址数据的关联。然后基于地址数据进行与地址有关的人、法人企业等相关基础数据的建设,设置与地址关联的人口、法人、企业等基础信息的关联关系,形成数据模型。块数据基础建模包图如图3 所示。最后基于要素的空间范围构建要素实体之间的关联关系。空间关系可以是由空间实体的几何特性(包括空间物体的地理位置与形状)引起的空间关系,如距离、方位、连通性、相似性等;也可以是由空间实体的几何特性和非几何特性(包括高程值、坡度值、气温值等度量属性,地名、物体名称等名称属性)共同引起的空间关系,如空间分布现象的统计相关、空间自相关、空间相互作用、空间依赖等。关联关系建设完成后可直接用于计算。以数字孪生的建设为例,在模拟城市运行的过程中需要知道城市对象的关系,通过城市数字化标识则可以获取城市一个个数字化的对象,通过与块数据结合则可以获取对象关联的全量信息。
Fig.3 Block data fundamentals modeling package diagram图3 块数据基础建模包图
3 应用案例
某沿海地区的政务数据主管部门落地实践城市数字化标识开展数政务数据的整合,通过制定标识编码规范、建设数字化标识对象全周期管理平台、全面推广使用服务使政务数据资源的管理对象新增了50 多类,数据量新增了20 多万条。同时通过内外部系统的推广使用打造了多个特色应用,有效提升了部门之间的协同效率、事件处置效率,例如“大围合小分格”利用唯一数字化标识进行数据关联的快速定位;基层治理综合网格以块数据的逻辑进行数据关联,实现了“底数清、情况明”;使用标识工具构建视频的可视区域,实现了关联对象所在位置的视频排查。具体介绍如下:
3.1 大围合小分格
在数据赋能基层治理的应用场景中,针对大城市的城中村、小区具有人口密度大、聚集度高、流动性强、卫生条件差、“三小场所”多、管理难度大等特点,利用数字化标识对象采集工具与管理平台将城中村、小区划分为一个个小的空间分格,并通过唯一数字标识快速构建与实有人口、暂离人口、楼栋、房屋、法人、视频等的数据关联关系,具体如图4 所示。数字化标识与块数据的结合可实现数据秒查、任务秒派,减少了70%的数据治理工作量,助力指挥分拨提速50%以上。
Fig.4 Large enclosure and small division图4 大围合小分格
3.2 基层治理综合网格
对公共基础对象进行统一数字化标识与关联,赋能城市精细化治理。以流动人口管理为例,对数据资源进行标识化重构治理,基于统一地址建立与街道、社区、片区网格、基础网格等的关联关系,以块数据的逻辑实现对数据资源的分类(类型)、分级(级别)、分块(责任),精准下沉至基层,使相关责任人第一时间掌握到自己的管理底数,即“底数清”;明晰事情的来龙去脉,掌握到人、地、事、物、组织的相互关系,即“情况明”。截至目前,该地区已提供33个数字化标识的API服务支撑基层治理综合网格应用。
3.3 构建视频可视区域
如图5 所示,利用统一标识工具构建视频可视区域关联块,即建立每一个公共安全视频可以覆盖的区域内统一地址、楼栋、房屋、城中村、小区、在建工地、物联感知设备等的关系图谱,建立各个要素之间的相互关系。当某地发生事件需要寻找附近的摄像头协助案件办理时,可通过发生地的地址、门楼牌、树木编码、灯杆编码、交通设备编码等任一信息秒知周边有多少个摄像头在可视范围之内,避免由人工搜寻、排查摄像头。如表2 所示,该操作能助力视频排查效率显著提升。此外,其还支持对重点区域与周边视频的可视区域叠加分析,可对重点区域的视频覆盖情况形成分析报告。
Table 2 Comparison of video efficiency related to urban management elements表2 城市管理要素关联视频效率比较
Fig.5 Video visual area association block图5 视频可视区域关联块
4 结语
本文提出一种基于城市数字化标识的政务数据整合模式,通过空间位置多模态化、城市管理对象标识化、数据关系块数据化建立了数据关联的机制与方法。在工程中的实际应用表明,该模式有效打通了政务数据之间跨层级、跨地域、跨系统、跨部门、跨业务的关联与整合,促进了数据要素的充分流通。然而,该模式的落地需要有具有远见卓识且意志坚定的领导者牵头,以及经验丰富的人才推进。未来将进一步推进该模式在CIM(City Information Modeling)平台、一网共享、一网统管等数字政府领域的应用。