核电站全生命周期数据管理框架体系构建与发展建议
2022-04-30任景莉杨盼
任景莉,杨盼
(郑州大学河南省大数据研究院,郑州 450052)
一、前言
核电作为构建现代清洁低碳、安全高效的能源体系中的重要一环,实现数字化、智能化是确保核工业高质量发展的必要手段,也是打造核工业强国不可或缺的重要组成部分。对于核电企业来说,积极推进核电数字化是降本提效、 形成行业竞争优势的优选路径。
数字化实体产业是发展数字经济的关键内容,目前实体产业发达的国家均在积极布局数字化工业战略 [1]。核电站的生命周期通常跨越数十年并产生海量数据, 因复杂繁多的数据难以进行统一的规划管理而导致数据利用率偏低、数据价值难以充分发挥 [2]。因此,建立数据管理体系是核电站数字化转型的重中之重。核电大数据作为核电站的重要资产,亟需构建核电站全生命周期数据管理体系,建立覆盖核电站全生命周期的数据采集、处理、传输、应用体系;加强数据流通,创新数据管理与共享机制,发挥数据要素的核心价值。
二、核电站全生命周期数据管理的发展现状
核电站全生命周期数据管理(NPPLDM)指在大型核电站全生命周期内的主要阶段,对各类数据进行定义、收集、评估、共享、协同应用、维护、归档、销毁等处理,并对数据资源的全生命周期进行科学、全面管理。核电站的数据支撑着核电数字孪生和数字化移交的发展。随着核电数字化发展,各种核电数据呈指数型增长,以存储管理为核心的数据管理已不能满足相关业务更为深化的数据分析和共享需求。新时期的NPPLDM应以数据存储整合、共享应用、安全可靠为基础,深入研究核电站全生命周期节点、业务流、信息流、数据流,开展涵盖核电规划设计、采购施工、调试移交、运维退役全过程的精益化数据管理;充分实现核电大数据价值,消除“数据孤岛”,促进业务协同,提升核电站的安全性、可靠性和经济性。
目前,NPPLDM体系研究按照对象不同分为两大类:以核电站某生命节点为对象的数据管理研究,以核电站主数据为对象的数据管理研究。以核电站某生命节点为对象的数据管理研究主要围绕核电站规划设计、工程建设(设备采购和土建安装)、运维管理3个阶段展开。核电站的大部分数据产生于规划设计阶段,因而核电设计的数字化不仅可以简化上、下游数据传递,还可助力实现核电“数字化移交” [3]。在工程建设阶段,加强和规范设备采购数据管理 [4]、项目管理 [5]、文档管理 [6],有助于缩短工期和降本提效。核电运维管理过程的核心是反应堆监管,因而运维数据管理对核电站的安全高效生产至关重要 [7]。
核电站主数据是核电站研发设计、建安调试、运维生产等过程中产生的核心数据,在收集、共享和运用后可满足跨部门业务协同需要。不同于分阶段数据管理,主数据管理应确保主数据在核电站全生命周期内的一致性、完整性、共享性和可靠性。主数据在核电信息化建设和以信息化手段实现的业务活动中具有重要作用,国内核电企业都在积极开展主数据管理实践,如江苏核电有限公司的江苏核电主数据全生命周期概念模型,大亚湾核电运营管理有限责任公司的主数据分类管理 [8]和核电站全生命周期知识管理框架 [9]。也要注意到,上述研究虽然给出了核电数字化转型过程中的设计数据管理、采购数据管理、工程数据管理等思路,但仍缺乏针对NPPLDM体系开展的整体规划与统筹管控。
核电是一项复杂的系统工程,从规划设计、采购、施工建造、调试移交到运行维护、退役,通常经历50~70年的生命周期;核电站全生命周期中产生的各种数据是确保电站正常运行和核安全的重要凭证,具有重要的查考价值。在核电数字化、智能化发展背景下,统筹管理复杂的核电工程、运维信息至关重要。本文作为聚焦NPPLDM开展的整体性、框架性研究,从核电站数据管理的需求和难点出发,以数据管理与核电业务协同的融合应用为切入点,探讨NPPLDM框架体系并提出行业性发展建议。
三、核电站全生命周期数据管理的需求分析及面临挑战
(一)核电站全生命周期数据管理需求分析
1. 核电站业务协同的需要
核电站是多方参与,涉及多专业、多设备的长期工程,业务协同至关重要。核电站数据按照业务流程分为工程数据、运维数据:前者包括规划文件、设计文件、采购数据、施工数据、安装调试数据等;后者包括核电生产运营过程中产生的各种数据,如维修、延寿、退役数据等。这些海量数据通常存储于不同的系统,存在数据标准不统一、数据类型复杂多样、运行系统相对独立等问题,致使业务数据重复、割裂,共享和应用难度较大,影响了核电业务的协同效率。因此,开放共享的NPPLDM体系是提高核电业务效率、实现核电数据治理能力现代化的创新举措。
2. 核电站数字化移交的需要
核电站数字化移交是核电行业深入实现“两化融合”的重要体现。我国的核电站工程建设以工程总承包(EPC)模式为主 [10],传统的核电站移交是以纸质和电子化文件形式,将相关数据交付给业主方。新兴的核电数字化移交则以结构化数据和智能模型/图纸的形式,将工程阶段的相关信息以数字化、智能化的形式交付给业主方,同时交付一座“数字核电站”来支持后续的智慧运营。贯穿核电站全生命周期的数据管理,可以通过规范数据标准、关联数据属性、提升数据质量等行为,支撑数据在业务系统之间的互联互通和高效分析。显然,智能模型和智能图纸具有良好的实用性,对实体电站的运营指导也更为可靠。
3. 提升核电安全保障的需要
核电安全问题长期以来备受关注。核电站规划设计通常采用“纵深防御”思想,运用技术手段来降低核电事故的危害;核电站后期的运维管理主要通过监控反应堆运行状态、设备属性状态、核辐射剂量等数据,对故障进行预警和量化 [11]。传统的核安全数据处理分析较多依赖于人的经验,而核电数字化、智能化转型则弱化人的作用,转而采用数据和算法来实现智能预警。目前,核电行业尚未形成标准化且全面的数据管理,存在数据之间关联程度不高、数据多源异构等问题,制约了核电站运营管理的数字化、智能化进程。
(二)核电站全生命周期数据管理面临的挑战
1. 核电工程业务复杂,“数据孤岛”现象严重
核电工程业务复杂,核电企业之间,产业链上、下游参与方众多,数据相对封闭;核电站全生命周期跨度长,数据利用存在信息不对称、不及时的情况。核电业务系统大多自成体系、相互独立,尽管纵向业务实现了全面覆盖,但横向业务优化不足。因数据标准不统一导致的核电业务“数据孤岛”现象严重,使得跨业务领域/板块的数据集成与协同较为困难。
2. 数据类型复杂繁多,可用性不足
多源的核电数据带来了数据的多样性 [12],但多样化的数据载体和格式种类也造成数据类型的复杂化问题。鉴于数据及数据结构在业务中的不同作用,加之核电的数据类型又具有明显差异,核心数据分类管理不当将会降低数据可用性。以核电设计阶段为例,大部分关键数据以文档形式进行信息保存和交换,存在传递效率低下、共享难度大、版本多、检索难等问题。此外,随着数据收集方式多元化,非结构化的数据在数据总量中占比加大(呈指数型增长),致使数据存储成本、应用分析难度均有增加,信息整合和连接的复杂性凸显,信息的实时统一、虚实集成等问题逐渐暴露。
3. 缺乏有效的数据质量管理制度及机制
数据质量提升是NPPLDM的目标之一。在核电站工程建设和生产运维过程中,数据录入不规范、不准确,数据缺失或异常都会影响数据质量。大量异常数据向自动运行的核电设备提供无效输入值,可能影响反应堆正常运转甚至威胁核电站安全。当前,核电企业尚未形成严格规范的核电站全生命周期数据质量管理体系且监督机制不完善,导致核电数据质量参差不齐,制约着数据分析、集成、预测的效果,不利于核电的全面数字化进程。
4. 面临更多数据安全和隐私保护问题
核电站数据作为企业的核心资产、国家的重要数据,在实现全面数字化之后仍将面临诸多安全问题。当前,企业对核电站数据安全管理的重视程度不够,覆盖核电站全生命周期的数据安全管理机制尚未成型;对于核电数据上云后的数据安全问题缺乏长远布局,如海量数据的长期远程存储安全,更严格的身份认证及细粒度访问控制,对敏感数据的分析、共享、协同应用,防范外网攻击并确保数据传输安全等。
四、核电站全生命周期数据管理与协同应用框架体系
NPPLDM本质上是在深入研究核电站全生命周期节点、业务流、信息流、数据流的基础上,建立核电规划设计、采购施工、调试移交、运维退役全过程的精益化数据管理, 由此形成核电数据开放共享、协同应用的能力。NPPLDM与协同应用的框架体系如图1所示。整体框架以实体电站为对象,以电站全生命周期中产生的海量数据为核心,以企业数据管理政策指导及组织管理为辅助监督,从企业制度规范、组织管理、面向业务协同的数据管理3个维度,立体展示了核电数据管理的重要内涵;着力于解决“数据孤岛”、数据可用性差、数据质量参差不齐、数据安全问题,推动核电站数据管理的优质高效运行。
图1 NPPLDM与协同应用的框架体系
(一)企业制度规范
数据管理制度是管理核电站全生命周期数据资产的基石。企业的核电数据管理制度是基于核电站全生命周期的业务需求和智慧核电发展要求,规范数据标准要素和数据质量评估要素,明确数据安全要求,指导核电数据精细化管理的指南和标准。这项工作的关键在于,明确数据管理工作的重要性,促进核电站全生命周期中的相关单位、部门达成共识;制定数据安全规范,切实保障核电站全生命周期数据的机密性、可用性、完整性;明确数据产生、应用、管理的原则,确保数据在安全的前提下实现业务层面的横向和纵向共享;制定问责与奖惩规则,充分调动参与数据管理人员的积极性;制定数据质量管理标准,提升数据质量以完善可用性。
(二)组织管理
组织管理为NPPLDM提供组织结构和人员保障。核电站全生命周期中的数据庞大复杂,需要高效系统的管理以及组织成员之间的协作配合。组织管理要素包括:根据核电站的特点来设计组织机构,明确各自职责;建立数据管理委员会、数据质量管理委员会、数据安全管理委员会,分别负责数据管控优化、数据质量管理、数据安全管理,使得数据管理工作妥善开展。
(三)面向业务协同的核电站全生命周期数据管理
NPPLDM是基于核电发展需求而产生的,面向业务协同的NPPLDM通过统一数据标准、差异化数据分类管理、合理构建数据模型,打破业务数据壁垒,实现核电站全生命周期数据的开放共享和查询,提高核业务流程效率;提升核电数据质量,确保满足业务要求,实现数据驱动业务;完善数据安全保护机制和网络安全保护机制,保障数据安全。
1. 统一数据标准
统一数据标准指为保障数据内外部使用与交换的一致性和准确性而制定的规范性约束。核电项目建设过程涉及若干相互独立的系统,因职能和标准不同而使得相同数据在不同系统中具有差异化的表达形式,阻碍了数据在跨系统层面的共享和使用。核电数据管理服务于核电站全生命周期业务流,数据标准的制定和管理应以业务为基础,以规范业务对象在各信息系统中的统一定义和应用来实现核电站全生命周期业务协同、数据共享开放、数据灵活使用、数据分析应用,最终表现为数据驱动业务。核电数据标准体系也应明确数据元的属性及属性描述,如属性包括而不限于中文名称、英文名称、标识符、说明、数据类型、取值、与其他属性的关联关系,属性描述涵盖属性注释和相关标准规则。对于不符合标准体系的数据元,通过数据映射来予以规范。
2. 差异化的数据分类管理
NPPLDM可根据数据特性及治理方法,从多个角度对数据进行分类。不同数据分类会产生不同的管理方法,根据数据结构规范可分为结构化数据管理、非结构化数据管理,根据数据描述类型不同可分为元数据管理、主数据管理、参考数据管理,根据核电业务流程可分为工程数据管理、运维数据管理。
一是结构化数据管理与非结构化数据管理。结构化数据是格式规范、用二维表记录的数据,相关管理技术已相当成熟,如关系型数据管理系统(MySQL)。非结构化数据是格式相对不固定、很难用数据库二维逻辑表来表示的数据,具有形式多样、数据量大等特点,如电子邮件、文档、图片、视频以及从物联网设备生成的数据集。非结构化数据在核电数据总量中占比较高,可为核电设备运行和延寿退役提供直接参考,但管理难度较大。对于核电非结构化数据管理,可以建立非结构化数据管理平台,革新底层数据结构汇集、管理对象数据、元数据、索引数据,并与人工智能技术相融合,提供新的数据架构底座,利用数据湖等架构实现数据智能搜索、内容自动化等。
二是元数据管理、主数据管理和参考数据管理。① 元数据管理。在核电数字化过程中,元数据作用于整个价值流,支持数据服务的统一管理运营,支撑业务管理规则的有效实施。当前,核电设计文件和过程文档正经历文档化向电子化的转型 [13]。核电站元数据管理应重点关注:制定元数据标准、规范、平台与管理机制,建立核电站全生命周期元数据管理体系;根据核电业务需求,制定元数据注册方法,完成底座元数据注册工作;建立元数据中心,确保元数据全生命周期管理,对不同类型的元数据进行连接以开展元数据关联查询、检索、血缘分析 [14]。② 主数据管理。主数据是核电站全生命周期业务活动的核心要素数据,在业务系统之间可共享使用。应建立核电主数据管理体系,围绕核电站全生命周期业务需求和数据从生成到销毁的全生命链,分析、识别、筛选主数据,按照统一标准采集数据,提升主数据质量,优化主数据运营管理。③ 参考数据管理。参考数据通常是预定义的静态数据,在流程自动化、提升分析质量和改善外部协同方面起着关键作用。核电站参考数据管理要明确各方的管理责任、制定相关流程和规范以及建立参考数据管理平台。参考数据管理主要包括:构建完善的信息架构建设以识别参考数据并对其进行管理;管理参考数据的关联及映射关系;统一参考数据标准,对核电站全生命周期节点的参考数据进行整合和管理。
三是工程数据管理与运维数据管理, 前者包括核电站规划设计、采购建造、安装调试过程的业务数据,后者包括核电站运行维护、延寿退役过程产生的数据。① 工程数据管理。对于核电站实体对象,按照工艺系统分解结果,根据一定的业务规则、分类原则和编码体系,组织形成反映整个电站物理要素的层次结构,建立以电站分解结构为组织层次的数据管理模型。对于核电业务,按照业务工作对象进行分解,以可交付成果为导向,根据工作分解结构对核电工程项目要素进行分组和细化。对于工程成本费用,按照成本分解结构对核电工程建设阶段各个节点的成本进行高效管理。② 运维数据管理。核电运维业务活动围绕生产计划、运行监控、日常巡检、大修换料、备件管理、化学分析、辐射防护等方向展开。核电站数字孪生技术的发展使传统的运维管理不再完全适用,因而运维数据管理应处理好运维数据对主数据和参考数据的调用以及运维数据之间的关联关系,确保上、下游信息的顺畅传递。
3. 数据模型管理
数据模型的设计与管理对提高数据处理效率、提升数据价值具有重要价值。数据模型构建宜对应不同的数据分类,描述数据之间的联系以及相应数据结构层面的操作手段。以元数据为例,相应的数据模型可为数据管理提供标准并作为质量评分的指标参考;规范数据结构,减少数据存储及操作异常情况的出现,形成业务到数据仓库的映射,为数据科学与人工算法分析提供更准确的数据。此外,选择核电站数据模型需要多方评估并谨慎实施。
4. 数据质量管理
数据质量管理是提升数据价值的必要手段。核电站数据质量问题主要来自技术方面,如数据源可能存在的数据质量问题,数据清洗规则、数据转换规则配置不当引起的质量问题,数据丢失、重复记录导致的质量问题,相互独立的业务系统导致的数据不一致情况;业务需求变更对数据采集、传输、存储等环节影响较大,极易产生数据质量问题;缺乏数据规划和有效的数据质量管控机制,不同的业务部门、生命节点因数据输入不规范导致的数据冲突等问题。为此,数据质量管理应在核电站全生命周期各节点、业务流实现数据质量管理闭环,构建核电站全生命周期数据质量管理体系 [15];及时对存在质量问题的数据进行分析、评估和识别,清洗、处理相应数据并对数据质量管理流程进行优化;完善相关规则,实时监控关键数据,预警数据质量问题。
5. 数据安全管理
发展核电是建立清洁、低碳、高效、安全能源体系的需求 [16],核电站的数据安全问题至关重要。针对常规应用场景的数据安全保障体系不适用于复杂的核电站大数据应用场景。核电站数据安全主要分为数据安全、网络安全。① 对于数据安全监管,基于核电数字资产和核电数字化的发展背景,围绕核电站全生命周期各节点的业务需求,重新评估重要数据的机密度、重要度,建立分层、分级的数据保密机制,严格管理机密数据的访问控制和身份认证;在核电大数据的开发挖掘方面,严格制定数据脱敏标准和技术规范,可引入同态加密技术开展机密数据的分析、挖掘等 [17]。② 对于网络安全管理,核电站中几乎所有的系统和设备都依赖网络传输信息以保持正常运行和风险预测能力,应根据《核动力网络安全技术政策》要求,在国家加强核电站网络安全监管力度的基础上,明确网络攻击发生后的应急规范,规划网络安全策略,完善网络安全防范制度,评估网络安全人员素质;在物理层面,通过防火墙与加密技术的综合运用,全面提升数据传输的安全防护能力;对于核电业务的众多系统,确保信息系统安全运行并定期评估系统安全态势。整体来看,核电站的数据安全管理应与网络安全相结合,制定分层保护策略,完善安全保障体系 [18]。
五、核电站全生命周期数据管理的发展建议
(一)建设核电数据一体化平台
我国已跻身核电大国行列,核电站的全面数字化和智能化是实现从核电大国向核电强国发展的重要策略。核电数据一体化平台是实现核电数据驱动各板块业务信息化和智能化的客观要求,也是对核电站全生命周期数据进行集中管理、高效共享、深度挖掘、智慧运营的有力支撑;作为集数据管理平台、数据可视化平台、数据代码托管平台、智能分析决策平台于一体的综合性平台,在具体建设时应以核电站全生命周期各业务系统和整个流程为数据来源,梳理相关单位和部门的信息资源目录(如物项、仿真数据等),采集核电设计采购、建造、安装移交、运维退役各节点数据和核电产生数据;实现跨单位和部门的信息交换共享,促进各系统之间资源的共享开放与业务协同创新;通过人工智能等新兴技术开发个性化推荐和智能化服务,支持多维度的智能化监测和数据分析预警。
(二)推动区块链技术与核电站全生命周期数据管理的深度融合
加快区块链技术与核电站全生命周期数据管理的融合应用,是解决核电站在数字化建设中面临数据融通、跨部门业务协同、信息资源开放共享、网络安全等瓶颈问题的重要手段。对于核电站工程建设中各参与方的职责权限、设计图纸、设计变更、设备物料等数据,可采用基于共识网络的智能合约进行记录上链,依托区块链和智能合约的不可篡改性、可追溯性,保障链上数据的真实、可靠、完整;通过设定区块的计算复杂度,保障数据在上链过程中的短时滞、高安全性,提高上、下游文件传递的效率。此外,设备采购数据上链不仅提高施工阶段物料设备的利用率,还将减少后期运维阶段的采购信息回溯工作量,可从根源上解决因核电站时间跨度久远带来的早期文件检索困难问题;核电业主通过区块链上的数据可实时监控物料采购情况和施工进展,对存疑数据展开回溯和勘察。
(三)加快数字孪生技术在核电站大数据上的应用
核电站除了依靠技术进步规避风险外,还应充分利用核电站运行生产过程中的监控运维数据,预见风险事件并采取化解风险措施。数字孪生技术率先在航空、航天装备仿真分析方面获得应用 [19],近年来国际核电装备企业开始布局核电站的数字孪生技术,利用大数据分析技术和数字化模型将实体核电站数字化并将之映射为虚拟空间中的“数字孪生体”[20],支持核电站的数字化移交,突破传统移交过程中的孤立、分散等结构性困难,提高数据复用性和使用效率。机器学习驱动的预测性维护也可有效降低新建核电站的试错成本,精准预测运维过程中的故障事件。建议我国核电行业加快应用数字孪生技术,实现对核电站全生命周期所积累的庞杂数据进行深度挖掘和灵活应用,最大限度发挥数据价值,在新的维度上保障核电站安全生产运行。
(四)加强基于模型的系统工程(MBSE)与核电工程设计的融合应用
在核电工程设计中,应用MBSE方法实现核电工程从以文档为中心向以模型为中心转型,助力提升核电站全生命周期数据管理能力 [21]。MBSE采用标准、规范的数字化建模取代文档记录,数据文件结构化程度更高,可减少非结构化数据管理需求,进而提高数据的共享和分析效率;统一建模语言,消除系统模型因学科差异导致的“模型孤岛”;贯穿全生命周期的系统建模,支持实现多领域模型全生命周期内的可追溯、可验证、动态关联,提高设计分析效率并增强数据信息的可复用性。
(五)建立健全核电站数据绿色管理政策体系
建议健全核电站数据绿色管理政策体系,实现绿色高效的NPPLDM。核电站数字化发展依托于数据中心的强大能力与可靠运转,而海量数据的存储与维护会消耗大量能源。在碳达峰、碳中和背景下,建设绿色数据中心是核电站减少能源损耗并降本提效的自然选择,而核电站数据绿色管理是实现绿色数据中心的关键构成。建立和健全覆盖核电站全生命周期数据绿色管理标准体系,对实现核电站数据绿色管理的企业合理给予优惠补贴和政策支持;加强政策引导和试点示范,探索形成核电站数据绿色管理实践模式。