数据质量管理体系构建现状分析
2023-12-29王晨诚朱建平
王晨诚 高 翔 朱建平 应 钧 戴 昇
一、研究背景
2020年5月,数据作为新型生产要素,被正式写入《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》。在这一时代背景下,数据已和其他生产要素一起,成为数字经济时代的基础性资源、战略性资源和重要生产力。党中央和国务院陆续制定并出台数据管理相关要求,明确提升数据管理水平和数据质量、加强数据治理和全生命周期质量管理等要求。数据质量管理是数据治理框架中的重要部分[1-5]。2021年9月,习总书记在中国质量(杭州)大会贺信中强调质量变革创新,加强全面质量管理,推动高质量发展。在现今数字经济与实体经济深度融合的新趋势下,各行业面临的挑战不仅是健全产品的质量管理体系,更是建立对数据的质量管理体系。《上海市全面推进城市数字化转型“十四五”规划》《上海市质量提升三年行动计划(2021-2023年)》等提出建设国际数字之都的总体目标,以及加快推进传统制造业数字化转型、加速企业质量管理转型升级等要求。
综上,以数据为驱动推动数字化赋能实体经济[6],构建数据质量管理体系是基础。本研究立足上海市,结合先进制造业、服务业等企业的典型经验做法,以质量管理视角,结合典型质量管理理论与数据治理理论审视分析当前数据质量管理体系的构建要素及面临的挑战,为后续开创性地探索构建一套基础型数据质量管理体系框架及基本实施路径打下基础,同时为未来在企业的试点应用提供一套理论方法,旨在为实体经济与数字经济更好融合、更快适应数字化转型,跨前一步进行理论探索。
二、当前数据质量管理体系构建研究现状
当前,国内外普遍重视对数据的质量管理。结合不同领域的特点,出现了众多不同角度或范畴的研究探索与实践应用(表1)。
一是重视数据质量管理的顶层设计与总体要求1《国家健康医疗大数据标准、安全和服务管理办法》《市场主体登记数据质量建设实施方案》《中国科学院科学数据管理与开放共享办法》《国家统计质量保证框架》(2021版)。。在健康医疗、市场监管、科学领域、统计领域等制定并出台了数据相关管理办法或总体要求,聚焦于大数据采集程序、技术标准、评价标准、质量监测、纠错机制、全生命周期安全管理等方面,提出不同角度的原则与要求。
二是不同领域的数据质量评价维度既有共性亦有特性。在GB/T 36344-2018《信息技术 数据质量评价指标》与GB/T 36073-2018《数据管理能力成熟度评估模型》等国家推荐标准的数据质量“六个性”评价维度基础上,不少学者结合领域需求和特点,对数据质量评价体系的构建进行了理论层面的研究探讨[1,7-8],拓展并丰富了六个性的内涵[4,9-11]。
三是数据的质量管理环节与数据全生命周期密切相关。在数据生命周期被概括为九个环节的基础上2数据从设计、开发、创建、迁移、应用、存档、回收的周期、再次激活以及退出的整个过程。,根据不同数据类型结合相应的业务需求,对数据全生命周期管理重新划分,除数据本身全生命周期以外,还应关注环境因素、制度因素、业务需求等。
四是数据质量管理路径注重全面性、多角度[4,8-12],包括组织机构、制度体系、资源支持、管理工具、评估分析与改进、产品交易[13]等方面,同时亦有采取全生命周期[14]、PDCA[15-16]等方法或工具来构建的数据质量管控模式。
五是国外组织或机构重视并制定了翔实、通用的数据质量评估框架,包括国际货币基金组织(IMF)、联合国统计委员会(UNSC)3《联合国官方统计国家质量保证框架手册》于2017年修订形成共提出五项核心建议和九项补充建议。、经济合作与发展组织(OECD)4《统计活动质量框架和导则》于2003年发布关于统计领域的质量框架及基本原则。等。其中,IMF于2003年修订的《数据质量评估框架》强调了质量评估维度(包括准确性、及时性、相关性等),并认为管理环节应结合业务流程综合考虑,把环境/制度因素排在首位,然后是过程质量管控、结果评价标准等。此外,欧盟统计局5《欧洲统计系统质量手册和元数据报告(2021年度)》。、加拿大统计局也同样制定了数据质量保障框架6国家统计局解读《国家统计质量保证框架(2021)》。http://www.gov.cn/zhengce/2021-06/18/content_5618987.htm。访问日期:2022年6月23日;发布日期:2021年6月18日。。
总体来看,国内外都已意识到数据质量管理的重要性,但除了国外相关组织制定了通用型管理体系之外,国内研究大多聚焦于特定领域或业务特点开展的数据质量管理模式,更偏向于对数据标准规范、评价分析及质量监测方面的管控要求和规范流程。从领导层面或组织架构等管理层面的研究和实证分析及应用,仍显单薄。
三、构建数据质量管理体系的关键要素分析及面临的挑战
基于GB/T 36073-2018《数据管理能力成熟度评估模型》的八个重要方面和GB/T 19580-2012《卓越绩效评价准则》的七大评价要求(见图1),结合上海市典型企业的经验做法及难点,归纳总结并分析当前数据质量管理体系构建的6大关键要素及面临的挑战。
(一)领导核心与组织架构
一是具备基本的数据质量管理组织架构。企业基本能够充分发挥领导核心作用,尤其大型企业成立有数字化转型领导小组,数据相关的具体工作则主要由科技与信息管理相关部门负责。二是设置有数据质量管理职能。大部分企业由信息化条线承担数据管理职能,数据质量的管理和推进工作则由信息化条线和业务部门共同开展。部分企业已成立首席数据官,专职负责推进数据管理工作。
(二)战略规划与顶层设计
一是从总体上看,企业的数据意识尚欠缺,以业务驱动为主。大部分企业在数字化转型过程中,数字化思维尚未完全形成,仍然以完成业务工作为目标,而非以数据为主要驱动力,业务和数据“两张皮”的现象仍较普遍,导致数据处理工作在业务流程中属于附加工作,地位不高,因而出现质量问题的情况较多。二是具备企业整体的战略规划,但缺少针对数据质量管理的顶层设计。多数企业依托国家或地方层面的宏观规划要求开展数据质量管理工作,尚未制定符合行业或企业业务特点和需求的数据质量管理要求和体系框架,国家层面也缺乏相应的标准规范予以指导,从而在当前企业数字化转型过程中对数据这一新型生产要素的规范化生产应用产生不利影响。
(三)数据生命周期管理与安全
一是企业基本能够结合自身产品或服务特点,在数据生命周期环节基础上拓展外延,形成符合自身需求的数据生存周期管理。比如某科技型企业,在数据治理过程中基于数据全生命周期,构建“入”“存”“用”“出”四个管理环节。其中,“入”是指做好数据规划和计划,包括数据的需求、产生、资产管理、标准等;“存”是指面对不同数据结构和形式在考虑成本因素基础上选取合适的存储形式和计算引擎,对数据进行备份管理;“用”是指对数据进行资产性的加工使用,包括协同共享、价值核算、收益分析等;“出”是指将进入最后生命周期的数据保存到低性能的存储介质或归档销毁。又如,某服务型企业基于数据全生命周期,围绕生活垃圾转运处置业务,将数据处理流程划分为采集与清洗、存储、整合、呈现与使用、分析与应用、归档等多个环节。其中,采集阶段主要通过AI技术识别运输垃圾集装箱箱号、对接各类设备工控设备数据,实现生活垃圾量、迹、质的数据采集,做到生活垃圾“快递式”精准管理。另外,已有少部分企业根据自身情况,结合全面质量管理、卓越绩效管理方法,构建数据方面的卓越绩效评价指标。二是数据安全成为贯穿数据全生命周期管理的关键基础。企业普遍关注且重视数据安全管理,尤其国家战略性产业如航天航空等。比如在智能网联汽车领域,国家及个人数据的安全问题是企业运营的关键核心问题,但个别企业仅制定了解决方案,数据安全管理机制尚未成体系。
(四)质量检查与数据标准
一是企业普遍重视对事前、事中、事后数据质量检查和管理。比如,某科技型企业将数据质量管理过程分为三个阶段:第一阶段是事前预防,主要关注实施前的策划,包括架构设计、业务蓝图的制定等,以及在信息化建设前期明确并统一数据标准的定义和使用规则等;第二阶段是事中监测,采用评估手段每半年开展一次数据抽检,主要检查数据是否按照业务流程等要求进行记录和管理;第三阶段是事后改进,通过定期盘查发现数据质量问题,提出整改要求,并在各系统中进行调整。又如,某服务型企业将数据质量管理流程分为三个阶段:第一阶段开展事前错误补偿纠偏,针对集装箱箱号识别错误问题,利用多点识别开展前后补偿;第二阶段开展事中重点问题的攻关改进;第三阶段开展事后的更正调整。二是企业迫切需要制定数据标准。部分传统企业内部的纵向系统已经建好,但在当前的数字化转型过程中各系统之间却难以连接,且在集成整合中存在数据难以使用、滞后、不准确等情况,在数据的产生、运用、对接等方面没有完整的定义和规范,导致数据难以反映真实业务、数据链无法横向打通、数据无法发挥赋能作用。
(五)数据应用与持续改进
在业务驱动下,跨部门的数据流动服务于不同业务活动,而对外形成的数据服务、数据交易产品较少。不少企业的数据应用更多是在企业内部,如财务管理、人员管理等。不少企业表示,数据质量是关键问题,因此在数据质量管理中通常会设置反馈机制,目的是为了及时对发现的数据质量问题进行改进。
(六)资源协同与制度保障
一是不少企业已经重视数据质量管理,但是普遍存在业务与数据之间的“隔阂”。缺乏业务与数据复合型人才,是影响企业数字化转型的重要因素之一。但是目前企业对数据质量管理人员的培训尚处于起步阶段,资源支持尚未充足。二是普遍缺乏可落地的管理制度保障。不少文献指出,数据质量问题不仅仅是数据本身技术标准等缺失所导致,而更多源于缺乏对数据的管理,缺少相关的管理制度来保障,比如部门协调运作机制、统一的业务流程制度和规范、人员专业培训机制等[4,17]。
四、对构建数据质量管理体系的建议
(一)明确数据作为生产要素的特点
数据是流动和变化的;数据作为一种具有独特属性的资产,相比其他实物资产和金融,不会被消耗,而是不断地产生并扩增;应用数据所需要的专业技能和知识要求更高。基于上述认识,数据质量管理应本着动态发展观点,从组织管理的全方位视角出发,通过跨职能部门和人员协作等原则进行。
(二)明确数据质量管理体系构建的总体原则
一是强调数据质量管理的领导力,以及整体的数据协同架构。突显组织架构中数据的前瞻性战略规划和主要负责部门,以及跨部门数据管理的职责分工和合作。二是强调构建数据质量系统性管理体系。运用系统思维,从广义上考虑影响数据质量的多方面因素,注重事前策划、事中检查和事后改进,全方位、多角度完善数据质量管理体系。三是采用组织动态发展评价等级。不以数据质量评价维度的“六个性”为标准,而是涵盖数据服务在不同领域的特性,突显通用领域的数据从产生到消亡整个生命周期所应达到的质量要求。借鉴GB/T 36073-2018《数据管理能力成熟度评估模型》(以下简称DCMM)的初始级、受管理级、稳健级、量化管理级和优化级等五个发展等级,重点聚焦数据质量管理构建总体评价标准。四是注重培养数据思维。倡导企业全员参与,开展数据思维能力培训,鼓励引入专业数字化转型服务,重点形成数据思维和数字化管理体系。
(三)建立数据质量管理体系框架的架构思路
结合GB/T 19580-2012《卓越绩效评价准则》的七个评价方面和DCMM的八个重要方面,基于在领导核心与组织架构等6大关键要素分析,提出整体框架的三个层面:第一个层面是领导作用,包含领导核心、组织架构与战略规划,呈稳固的三角结构,具有驱动性;第二个层面是“4+1”管理体系,包含数据生命周期管理、质量检查与改进、数据标准、数据应用以及持续改进,具有从动性,是体系的实际实施主体部分;第三个层面是资源保障和数据安全,具有推动性,作为基础保障推动战略规划的有效落地。
五、结论
本研究结合国内外不同领域数据质量管理体系的理论和实践探索,在对上海市先进制造业和服务业典型经验做法和普遍难点进行分析的基础上,从领导作用、数据全生命周期管理、数据标准和质量检查、数据应用、持续改进等方面进行思考,构建数据质量管理体系的总体原则和架构思路。本研究的调研对象集中在制造业、服务业和科研单位,虽具有一定代表性但仍有其局限性,后续将进一步拓展丰富框架内容,并与实际情况相衔接,在试点应用中着力构建能用于企业评价的、更为科学客观的数据质量管理体系成熟度评价指标体系。