APP下载

基于数智链技术的政务数据共享利用探索实践

2023-10-25唐心佩

无线互联科技 2023年16期
关键词:政务政府

唐心佩,瞿 萌

(中国联合网络通信有限公司河南省分公司,河南 郑州 450000)

0 引言

随着数字经济的蓬勃发展,数据已经成为重要生产要素,并成为国家基础性战略资源。数字政府建设是当前推动政府治理体系和治理能力现代化的重要方向和突破口,在这一进程中,促进数据要素的安全有序流动已经成为当前面临的热点问题。近年来,政府虽已建成政务数据共享交换体系,但系统间仍存在数据共享不畅、数据质量不高、数据应用不强等痛点,“信息孤岛”“数字鸿沟”的局面依旧存在[1]。为了推动政务共享数据的高效运用,实现数据驱动的业务数据化、数据价值化和创新生态化,政府部门需要重视探索政务数据共享利用的工作,以提高数据的使用准确性和数据价值。

1 当前面临的挑战

政府部门应积极探索政务数据资源共享利用,深化基础数据库和专题应用库数据服务价值,全方位推进政务数据价值释放。然而,政府部门在面对当前的实际情况时,仍然面临着诸多挑战[2-3]。

1.1 顶层设计和制度创新不足

为了全面推动政府数据共享开放,需要进一步完善顶层设计和制度创新,为大数据发展提供强有力的支持,并促进数据共享的顺畅进行。目前政府数据普遍存在开放程度不高、数据权利保护不全面、大数据产业有序化不够、部门协调不畅等问题[4]。在大数据管理制度创新和大数据立法方面还需进一步探索和实践:一是省级政府数据开放管理机构的缺位势必造成各省级部门和各地(市)级政府数据开放责任分工不明确、任务落实不到位、统一协调性不够高等问题;二是缺乏明确的大数据地方法规和政府部门数据共享开放的要求,以及数据开放和开发利用方面涉及各方权利和义务的问题。

1.2 政府数据开放平台搭建尚不完善

国务院印发的《促进大数据发展行动纲要》明确要求2018年底前建成国家政府数据统一开放平台,而大数据领域已经形成共识:政府数据是我国所有数据中质量最高的一部分,这些数据只有与应用结合才能产生价值[5]。但平台普遍都存在一些问题:一是数据集数量较少;二是数据涉及领域不均衡,优势产业相关领域的政府数据呈现不充分;三是可视化的检索结果呈现、数据分析与统计功能还有待加强;四是平台的互操作性弱,需拓宽API主题领域并开发App应用程序。

1.3 政府大数据与实体经济融合度还不够

数字经济在国民经济生产总值中的地位进一步提升,正在迈向体系重构的新阶段,主要表现在数字经济和实体经济的融合。目前政府利用大数据促进实体经济转型的应用主要集中在制造业上,应用范围还比较局限,而大部分省级平台目前暂处于探索阶段。政府部门需要借鉴先进省份先试先行的先进经验,借助大数据领域创新平台的产学研成果,不断扩大政府数据应用市场规模,跨界融合助推实体经济转型升级[6]。政府部门应充分发挥大数据、人工智能、区块链等技术优势,积极推动在金融、医疗、教育等领域数据资源共享利用探索,将政务数据融入各行业具体应用场景,深挖政务数据应用价值,推动政务数据增值。

2 推进政务数据共享利用的总体思路及建议

2.1 总体思路

政府部门可以建立以“政府主导、多参与主体协同”的数据共享协调机制,围绕政务数据的“聚、存、通、管、用”,打造数据产品“生产基座”和“数据工场”,探索数据“授权运营”,并针对重大领域、重点区域或特定场景建设专题数据区域,实现对数据价值的充分挖掘、按需释放、高效利用。为了推动数据要素的流通和合作,重塑政府和社会的数据流通融合体系,政府需要构建全流程保障规则,以充分释放数据要素的价值红利。政府部门可以统筹规划基础数据建设,提升政务数据治理质量,大力推动数据共享,建立数据流通生态。为了进一步激活政务数据要素的价值,可以从以下几个方面入手。

2.1.1 完善数据开放共享机制

政府部门应建立健全高效的数据共享协调机制,打造数据基础支撑平台,推进数据归集整合、有序流通和共享,打破数据壁垒,把散落、孤立、割裂的政企数据打通,将数据之“沙”融汇成“塔”,帮助政府和市场主体将海量数据盘活,打通数据要素市场各产业链环节,保障数据要素生产、分配、流通、消费、跨境等各细分领域循环畅通。

2.1.2 建立健全数据流通交易规则

在符合国家法律法规要求下,政府部门可以探索“原始数据不出域、数据可用不可见”的交易范式,在保护个人隐私和确保数据安全的前提下,分级、分类、分步有序推动部分领域数据流通应用。

通过制定基于数据资源开发的数据产品交易制度,政府明确交易业务流程及交易机制,包括但不限于交易方准入制度、交易商适当性制度、交易商信息披露制度、交易商信息保密制度、数据交易规则、公平交易制度、业务操作流程、会员管理制度、数据商品准入制度、交易方式及安全管理、交易数据确权、交易定价核价制度。

2.1.3 拓展规范化数据开发利用场景

为了推动政府数据的安全开放,政府部门可以通过政务数据和社会数据的融合,鼓励基于特定场景数据创新应用的研发检测和成果转化,释放数据的经济价值和社会效应。以运营促开放,以业务为导向,政府可以整合专业资源,创建数据市场化建设运营团队,梳理重点政务服务业务流程与场景,建立评价指标体系,制定相应的制度规范,开展数据的常态化运营。通过定期开展服务后评估、提出优化改进建议,政府部门可以持续释放数据资源的价值红利,推动数字经济的发展深化。

2.1.4 构建数据安全管控体系

在加快大数据立法方面,政府部门应坚持安全与发展并重的原则,促进安全与规范并举的发展。在管理方面,数据共享平台应严格遵守国家数据安全法、个人信息保护法等法律法规的要求,加强监管措施,确保数据的安全和隐私保护。在技术方面,数据共享平台可以采用安全多方计算、同态加密、数据脱敏等策略和手段,以确保数据在安全可控的前提下得到有效的处理和应用。通过这些措施,可以稳步推进各场景应用,促进大数据的安全发展和合规使用。

为了推动数据的安全开放,数据共享平台可以引入业内先进的多租户、任务隔离、资源共享、支持多框架等技术模式,结合区块链技术,构建新一代数据开放体系。在此基础上,结合联邦学习、安全态势感知等新兴技术,建立多层次、纵深化的数据安全管控模式。在数据市场化建设运营中,数据平台建立安全测评、风险评估、安全审计、保密审查、日常监测和应急处置制度。

2.2 推进建议

在积极探索政务数据共享利用的过程中,以下几点建议可供参考。

2.2.1 编制管理办法和标准规范

编制数据管理办法及配套标准规范,明确数据范畴、明晰数据各方权责,规范数据处理活动,促进数据依法有序安全流动。

2.2.2 整合数据资源

数据资源梳理:梳理并建立全省统一的数据管理体系,各级责任部门按照数据与业务对应的原则,编制本系统、行业公共数据目录,明确数据的来源、更新频率、安全等级、共享开放属性等要素。

数据资源编目:建设全省公共数据资源目录系统,实行统一管理和维护,明确数据开放清单,并与现有政务数据资源目录系统级联对接,实现全省公共数据资源目录全面纳管。

数据采集汇聚:通过数据调研、规划设计、采集汇聚3个阶段,明确数据使用范围和要求,根据应用场景和数据时效性要求,合理设计数据结构模型、数据约束、数据处理及更新流程。通过录入、迁移、同步、扫描、爬取等方式获取所需数据。

数据长效治理:通过建立数据清洗规则、数据质量评估标准、数据问题反馈机制、数据使用标准,形成数据治理闭环,提升数据质量。

2.2.3 建设数据开放平台

建设数据资源开发利用平台,提供数据开发利用数字化支撑、运营与监管服务。通过整合数据中台、政务中台、可信交换平台的资源及组件,构建可信数据融合共建专区。

共享训练开发范式:多方数据在脱敏或样本数据形态下,在空间内进行汇聚集中后,再进行相应的开发利用。数据治理与开发工具系统提供数据开发方在空间内自主开展数据碰撞、分析、建模等开发工作,可视化AI建模训练工具提供数据开发方自主开展机器学习、深度学习、神经网络等深度智能化数据开发利用和建模训练。

隐私计算开发范式:构建基于隐私计算技术的“可信数据流通平台”,实现“原始数据不出库,数据可用不可见”。

2.2.4 加强数据安全保障

为保障数据安全,通过制定数据分类分级规则和标准,在数据全生命周期过程中采取差异化管理措施。运用区块链技术,实现数据目录、开发行为、数据服务、产品凭证等数据上链、链上留痕,最终实现所有关键环节可管、可控、可溯源。数据生命周期安全架构如图1所示。

图1 数据生命周期安全架构

3 在项目中的实践及应用

本项目聚焦“普惠金融”,搭建了全国首个省级基于政务数据共享利用的金融服务共享平台。平台以解决中小微企业“融资难、融资贵、融资繁”为目标,以共享服务大数据平台为支撑,面向政府、金融机构、企业3个核心应用主体,充分整合政府组织内部数据,通过建立多个数据领域的综合企业信用分析模型、信贷风险管理模型、资源配置模型等金融模型体系,为轻资产中小微企业增信,为银行等金融机构择优放贷提供依据,充分释放政府组织内部数据价值,解决了企业“融资难、融资贵”,银行“不敢贷、不愿贷”的问题。

卡夫卡让笔下的K们与“中心”对抗,K们也具有鹰四般叛逆的勇气,他们都对“中心”释放着自己最叛逆的行径。鹰四开枪自杀获得了自我认同,但鹰四从不祈求以死获取宽恕,因为宽恕对鹰四来说更是一种残忍,他想通过惩罚将自我彻底毁灭。K们的“挑衅”也绝不希望得到宽恕,宽恕对他们意味着脱离了“权威政治”,他们的行动是在证明自己“有罪”,来取得“中心”的关注。

3.1 项目建设的主要内容

金融服务共享平台整体架构如图2所示。平台包含基础资源层、数据层、支撑层、服务层、应用层、表示层、运维管理体系、标准规范体系和信息安全体系9个部分,平台功能包括有汇聚存储、数据治理、模型分析、业务处理、能力开放系统、区块链、安全管控和手机客户端及门户等。

图2 金融服务共享平台总体架构

3.1.1 建设标准规范

项目建设初始先行制定标准规范,包括《采集汇聚标准》《数据安全标准》《数据管理标准》《运维管理标准》等。

3.1.2 采集汇聚数据

平台通过与河南省政务信息共享交换平台对接,实现了各厅局委数据共享。通过分析金融机构的产品准入条件及授信模型,明确数据需求。基于Hadoop的ODS(贴源层)、DWD(数据明细层)、DWS(主题宽表)各数据层建设标准,平台将数据按照一定周期(实时、T+1等)汇聚到ODS层。其中,库表类通过汇聚系统的定时任务自动更新,接口类数据采用定制开发,文件类采用FTP获取入库。数据汇聚系统部分库表如表1所示。

表1 数据汇聚系统部分库

3.1.3 加强数据治理

根据数据质量稽核规则,平台对数据进行清洗、转换、加工,形成法人、信用等主题库。为确保数据质量和持续改进,建立长效数据治理机制,根据平台数据质量报告所反馈的问题,与数据源部门共同开展数据质量整改工作。

3.1.4 编制数据目录

依托河南省政务共享交换平台,梳理可用的数据资源,编制数据资源目录,包括所属单位、元数据描述、共享级别、共享方式、共享频次等。

3.1.5 挖掘数据价值

结合决策树、随机森林、评分卡等机器学习算法和金融产品特性,对企业数据进行挖掘分析,建立了企业信用报告、企业画像、智能推荐等模型。

金融机构基于平台的联邦学习建模训练系统,实现在原始数据不出库的前提下完成数据融合建模。比如:上海浦发银行通过联邦学习系统,基于平台数据和自有数据开发了“浦慧税贷”产品,实现“企业1 min申请,3 min获取授信结果”的效果。

平台利用区块链技术将中小企业经营、财务、交易、债权债务等信用相关信息上链存证,通过授权管理进行数据访问控制和隐私保护,建立可信企业画像,赋能银行风控管理。

3.1.6 强化数据安全

平台通过数据分类分级、数据安全监测与审计系统、数据资产地图、数据脱敏系统和数据出口审计系统等产品,加强数据安全防护。

3.2 项目技术亮点及创新

(1)平台采用分布式大数据架构,通过HDFS、MapReduce、HBase构建数据的存储、计算、查询框架。

(2)平台基于Dubbo微服务架构提供了灵活开发配置环境。

(3)平台采用流批一体处理技术,在离线批处理层面,运用HDFS+MapReduce+Hive处理整合政务数据,在流处理部分运用Kafka+Flink实现实时数据计算。

(4)平台采用区块链和AI技术,提供数智链融合中台服务,支持多源数据可信共享、智能推荐、人脸识别等场景。

(5)平台采用联通自研ANOV可视化能力,打造3 D效果交互式实时数据可视化大屏,释放大数据价值最后1 km。

4 结语

政务数据的共享利用不仅可以提升政府数据的价值和利用效率,同时还能够降低政府内部的冗余建设,并推动数字政府的建设和数字经济的发展。通过数据共享利用探索与实践,在构建多源汇聚、关联融合、高效共享和有序开发利用的数据资源体系领域积累了宝贵经验。数智链融合创新技术的成功应用,在当前卡位和布局数字政府建设的关键时点,对推动数字经济的战略落地,加速实施数字中国建设具有深远意义。

猜你喜欢

政务政府
知法犯法的政府副秘书长
政务云上看政情
清末督办政务处与各方关系述论
政务
政务
政务
政务
依靠政府,我们才能有所作为
用“打包法”衡量政府投入不科学
政府手里有三种工具