关于电子元器件质量数据资源建设思路的探讨
2020-02-10王浩黄志华聂国健郑丽香杨云于迪李欣荣
王浩 黄志华 聂国健 郑丽香 杨云 于迪 李欣荣
[摘 要] 针对当前国内电子元器件质量数据资源建设中存在的数据分散、数据应用欠缺等问题,以电子元器件“研、用、管”各方的实际需求为基础,从数据资源体系构建、数据采集与规范化、数据管理与应用三方面入手,对电子元器件全寿命周期质量数据资源的建设思路进行了探讨,为行业质量监管与提升、数据共享与交流、数据应用与服务的实现提供了理论支撑。
[关键词] 电子元器件;数据资源建设;质量数据管理
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 01. 078
[中图分类号] TP274 [文献标识码] A [文章编号] 1673 - 0194(2020)01- 0196- 04
0 引 言
电子元器件质量数据是装备研制前期指导器件选型的关键输入,是装备研制过程中设计改进的依据,是支撑行业主管部门顶层行业把控的根本源头。电子元器件质量数据资源的建设,充分利用质量数据,是保障装备质量最佳途径之一。然而,当前国内电子元器件质量数据分散、孤岛现象严重,数据分析研究与应用不足,导致装备在实际使用过程中故障频发、装备的质量提升受限,为此,通过电子元器件全寿命质量数据的分析与应用研究的实施,可保障装备任务成功性、维护国家安全。
国外在电子元器件质量数据资源建设方面已经积累了丰富的理论成果与实践经验。美国可靠性信息分析中心(RIAC,Reliability Information Analysis Center)通过收集、分析并加工部件和系统的通用质量特性资料,为美国国防部和工业界系统研发制造与监管提供支撑;美国航空工业协会(AIAA,American Institute of Aeronautics and Astronautics)通过信息交流平台的建立,收集并发布了航天航空领域政策建议、标准等相关行业信息;美国政府与工业界数据交换网(GIDEP,Government/Industry Data Exchange Program)由政府与工业界联合建立,通过共享产品全寿命周期内研究、开发、生产等阶段的技术信息,支撑装备研制单位加强系统和器件的质量可靠性,有效降低了资源和时间成本。
随着装备建设对电子元器件质量数据的需求,国内相关单位相继建立了电子元器件数据资源平台,代表性的诸如“电子元器件基础数据平台”“电子元器件综合优选及数据共享平台”和“赛宝电子元器件数据平台”,各平台提供的质量数据大多是产品基本数据,很少有诸如故障数据、失效数据和认证数据等质量数据,所建平台的数据范围小、类型单一,数据量也不足以支撑电子元器件全寿命周期设计工作,且各平台相互独立未进行有效串联,数据资源分散、共享和应用缺乏的问题仍未得到有效解决。基于此,本文提出电子元器件全寿命周期质量数据资源建设思路,给出质量数据资源建设的整体工作框架及落实方案建议,以数据的集中收集、统一管理和应用为目的,弥补国内行业数据整合、管理与应用的空白。
1 总体思路框架
电子元器件质量数据资源建设可从数据资源体系建设、数据采集与规范化、数据管理与应用三个方面迭代开展,如图1所示。数据资源体系建设是数据资源建设的基石,在开展此项工作时应梳理电子元器件在全寿命周期内研制、管理与使用方的数据现状及需求,明确质量数据类型及来源,以解决要收集哪些数据,数据从何处收集的问题;数据采集与规范化应建立数据采集机制,保证数据的交互,此外还需规范数据的属性定义、格式等采集要求;数据管理与应用要依据各方的数据需求,利用数据处理与分析方法,建立合适的应用模式,形成质量数据产品。
2 数据资源体系建设
数据资源体系建设是电子元器件质量数据资源建设的基础,是保障质量数据规范整合、共享交互、有效应用与服务的前提,具体可从两方面开展:电子元器件质量数据现状与需求分析和全寿命周期质量数据梳理。
2.1 电子元器件质量数据现状与需求分析
电子元器件质量数据资源建设的最终目的是利用建立的质量数据,协助电子元器件全寿命周期内各方业务工作质量提升、保障装备的质量可靠性。应以此为出发点,开展电子元器件全寿命周期内各方的业务需求及应用场景分析。
电子元器件质量数据现状与需求分析是建立数据资源体系的核心工作内容,是保证所建质量数据资源精准满足研制、使用与管理各方需求的最有效的手段,能解决需要哪些数据的问题。以电子元器件研制单位为例,各研制单位要降低研制成本、提高元器件上机使用效果,需明确使用单位的选型需求,提前规划研制计划,要提升所研器件质量,需对已交付器件的现场使用和失效信息进行分析,指导新研电子元器件质量提升。表1总结了电子元器件全寿命周期中研制单位、鉴定检验机构、使用和行业主管部门的质量数据应用场景和数据需求。
2.2 全寿命周期质量数据梳理
在明确各方的应用模式与业务需求后,应着手开展全寿命周期质量数据梳理,解决支撑各方业务需求的数据“从哪儿来”的问题。基于各方质量数据现状,全寿命周期质量数据主要来源于电子元器件研制生产单位、认证检验检测机构、使用单位等,此外部分行业管理部门也会有少量的质量数据储备。例如电子元器件研制生产单位可能提供生产单位信息、电子元器件基础信息、生产线信息、供货/采购信息等;认证检验检测机构具有各種认证信息、鉴定和试验信息、失效信息等;装备承制单位具有入所检验信息、二筛信息、失效信息等。如图2所示。
3 质量数据的采集与规范化
数据不规范、标准不统一是当前制约电子元器件质量数据资源统一管理的重要因素。由于当前行业质量数据孤立、分散,各方依据各自经验制定了不同的企标院标,导致同一数据可能具有多种不同的描述,不利于数据的流通与管理;而建立合理的采集交互工作机制,是保证数据长期共享交互的基础。基于此,应从质量数据规范制定、建立合理的采集交互体制机制、开发数据采集工具三方面保障电子元器件行业质量数据资源后续的高效流通与交互。
3.1 质量数据的规范化
质量数据的规范化是保障数据采集交互、数据应用分析的前提,数据规范化是制约国内电子元器件质量提升的主要限制之一。如图3所示,应通过对相关技术规范、产品手册等技术文档的调研分析,结合行业普遍认可的定义和描述,基于全局性、唯一性与合理性等原则,对数据的描述给出原则性要求,制定每条数据项的元数据标准[1],包括编码、名称、类型、隶属范围和约束条件等属性信息,规范采集、管理与应用过程中的数据,以此保障数据的唯一性与流通性。
3.2 数据采集
3.2.1 采集交互体制机制建设
建立合理的采集交互体制机制是保障数据长期稳定交互的重要手段。由于电子元器件质量数据主要来源于电子元器件研制生产单位、认证检验检测机构、装备承制单位、使用单位等,涉及面较广,因此首先需制定质量数据采集填报要求,明确各方信息填报范围与要求;其次应建立由电子元器件研制单位、认证检验检测机构、装备承制单位、使用单位及相关管理单位和行业主管机关组成的采集工作体系,所建工作体系中各方应按表2所示职责开展工作。
3.2.2 采集工具开发
采集工具的开发是提高质量数据采集效率的重要手段。开发采集工具要考虑工作体系各方当前的信息化程度,针对性设计采集工具,以满足不同信息化程度的数据采集。
在结构化数据采集方面,针对信息化建设较完善的单位,可设计与该单位信息管理系统兼容的接口,实现数据的自动流转;针对信息化建设一般的单位,可开发批量导入/出模块,实现对Excel、Access、SQL等信息的批量导入导出;针对信息化建设较落后的单位,可制作统一的规范化电子填报表,实现数据的手动输入。
随着数据的爆炸式增长,数据的类型也在逐渐地转变,半结构或非结构化数据也在逐渐增长。对于此类数据,采用传统采集工具通常会发生采集效率低、数据易丢失的问题,为避免此类事情的发生,可利用新技术(如爬虫技术等),开发新型采集工具,提高数据采集效率。
4 质量数据的管理与应用
鉴于全寿命周期质量数据类型多、数量巨大、用户需求不同的现状,为实现质量数据有效准确地提供服务,可通过相关数据管理平台的开发对规范收集的质量数据进行统一的存储、管理与应用。平台开发可从平台数据库设计与平台功能模块设计两个方面落实。
4.1 数据库设计
设计合理的数据库结构可实现各种数据的高效存储,保障数据的持续更新完善和数据资源的升级与维护[2],以便数据的应用、共享、查询和追溯。在开展数据库的结构设计时应全面分析支撑数据字库的关联性,充分考虑质量数据的共享,发挥质量数据的集约优势。全寿命周期质量数据库可依据器件寿命阶段分为研制生产子库、检验检测子库和使用子库,并采用“主表—子表”的数据库结构模式,以保证各数据库的统一管理和无缝连接,如图4所示。
其中,“主表”为器件型号规格、生产单位等基本信息,“子表”为三类子库中的质量数据,主表与子表由元器件ID、表名、主键、列名和各种编码串联,以此可确保信息的唯一性。
4.2 平台功能模块设计
建议通过数据管理与数据服务两个模块的设计,保障用户的应用需求。
(1)数据管理模块
为实现电子元器件全寿命周期质量数据的统一管理,数据管理模块可设置数据处理子模块和数据管控子模块。由于电子元器件全寿命周期质量数据类型涉及表格、文档、图像等多种形式,常规数据管理方法已不足以处理数据存储与处理过程中发生的缺失、异常等问题,因此,在数据处理子模块中融合ETL工具,可实现不同类型数据的快速融合,减少处理过程中的人力物力资源;数据管控子模块主要实现数据维护、保密及用户管理等常规功能。
(2)数据服务模块
数据服务模块应能对数据库中的数据进行抽取调用,融合诸如数据推送、基于知识图谱等先进的技术处理方法或工具后,为各方用户提供满足其需求的数据产品。数据服务模块至少应能实现数据的检索与查询、数据的统计分析等基本功能。
4.3 質量数据应用
数据应用是数据资源建设的最终目标[3]。当前电子元器件质量数据资源除管理不足、共享不到位之外,还存在数据挖掘不深入、应用不充分等问题。因此,探索满足各方需求的应用模式,为各方提供有用有效的数据产品,辅助各方选择更优的决策,促进电子元器件行业质量提升,是开展质量数据资源建设的意义。
数据产品从某种意义上来讲是一种搜索引擎、一种个性化推荐引擎,是把数据、数据分析模型和分析决策逻辑嵌套在同一软件系统中,以自动、准确、智能的方式发挥数据价值的工具。数据产品类型多样,如报表型、多维分析型(OLAP等)、定制服务型和使能型产品等,随着用户需求的变化,单纯的报表型数据产品显得过于苍白,可视化能力较差,定制服务型数据产品因其可视化良好、针对性强在市场中的优势越来越大。下面以使用单位和行业主管部门为例,依据其业务需求,粗略提出质量数据产品的思路。
(1)使用单位
通过搭建质量数据平台或系统,开发融合知识图谱、机器学习等算法模型的功能服务模块,为使用单位提供电子元器件选型服务是一种较先进的策略。输入产品的功能性能指标要求,通过模型推算关联可推送相似要求产品的电子元器件选用情况、电子元器件研制单位选用情况、各电子元器件现场使用过程中失效情况等质量信息,支撑使用单位在最优的研制单位中选择质量较高的电子元器件,从而可从根本上提升了产品的质量。
(2)行业主管部门
基于行业主管部门对电子元器件宏观质量水平的把控需求,通过多维统计分析模型,将研制生产、鉴定检验及使用过程中产生的鉴定、二筛、DPA合格率及失效模式、失效原因、生产线审查不符合项、管理体系认证审查不符合项等质量状态信息的统计分析,可为行业主管部门宏观质量形势分析工作提供数据支撑。
5 结 论
本文针对电子元器件质量数据资源建设的思路开展了探讨,提出了数据资源体系建设、数据规范与采集、数据管理与应用三条主线思路,并依次剖析了在质量数据资源建设过程中各部分应开展的关键步骤,可对实际的工程应用提供参考。大量有效的数据是数据分析与应用的原材料,因此要保障电子元器件质量数据资源建设能够落地使用、提升装备质量,需要靠全寿命周期内各方的参与,以保障数据量足够支撑能形成准确的数据产品。此外,为满足工程实际需求,新方法、新技术也可用于数据资源建设中,如大数据处理与分析、数据挖掘等,对于增强数据服务能力具有促进作用。
主要参考文献
[1]齐剑锋,李三群,杨素敏.装备数据工程导论[M].北京:电子工业出版社,2016.
[2]孙少斌,韩志军,董博.装甲兵作战试验数据工程体系框架设计[J].指挥与控制学报,2016,2(1):60-64.
[3]李晓卫,王晓亮.基于大数据的舰船装备资源建设及数据分析利用[J].质量与可靠性,2018(2):40-44.