基于系统工程的双五归零方法在信息系统质量问题中的应用
2020-03-23□余军
□ 余 军
上海航空工业(集团)有限公司 上海 201210
1 研究背景
国家标准GB/T 19000—2016《质量管理体系 基础和术语》中给出质量的定义为一组固有特性满足要求的程度。质量不限定于产品或者服务,而是泛指一切可以单独描述的事物,可以是活动或过程,可以是产品,也可以是组织、体系或人,以及上述各项的任意组合。一个国家的产品质量、服务质量是国民素质的反映,关系到国民经济全局的发展及该国在全球经济中的地位。一个企业的产品质量、服务质量则关系到企业在市场经济中的地位,甚至关系到企业的兴衰。因此,不断改进产品质量、工作质量、服务质量,是一件关系到企业兴衰且具有重大意义的工作[1]。
在互联网时代,信息系统已经成为支撑企业核心业务的基础设备,如何快速分析判断信息系统发生质量问题的原因与机理,并从根本上解决问题,对于提高质量和工作效率,支持核心业务高效运作而言尤为重要。常见的质量问题解决方法有很多,包括拉条挂账方法[2]、质量控制[3]、 失效模式与影响分析[4]、面向领域的软件故障分析方法[5]、模块分析方法[6]、根本原因分析方法[7]等,笔者通过引入系统工程中的双五归零方法,指导解决航空领域信息系统质量问题,是一种新的尝试与应用。
2 双五归零方法概述
基于系统工程的双五归零方法,是在航空领域双五归零方法的基础上,根据飞机研制过程中各类问题的长期积累与提炼总结,按照基于系统工程的理念,形成的一套独有的双五归零方法。基于系统工程的双五归零方法是质量问题管理和改进的指导思想,是计划、实施、检查处理步骤的循环,从技术归零、管理归零两个层面规定了产品质量问题闭环管理步骤和要求,使质量问题管理过程做到纠正措施原因分析逻辑化、措施决策科学化、体系改进系统化、改进成果知识化。[8]
航空领域内的质量问题指在民用飞机产品研制、试验、试飞、客户服务和运营过程中出现的不符合国家法律法规、质量标准、技术文件与图样要求的产品特征,一般包括故障、事故、缺陷、不合格等[9]。笔者通过基于系统工程的双五归零方法,分别从航空领域技术归零、管理归零条线,提出七个方面、八项要求,用于解决质量问题。
2.1 技术归零
针对发生的质量问题,从技术上按照及时处置、风险控制、定位准确、机理清楚、问题复现、措施有效、举一反三共七个方面逐项进行落实,并形成技术归零报告或技术文件。
(1) 及时处置。质量问题发生后,任何现场目击者或客户信息接收者,都有责任发起质量问题报送,应立即报送本部门本团队负责人和现场质量人员。质量管理部门应立即组织对发生的质量问题进行影响后果分析。
(2) 风险控制。应充分评估已发生的质量问题对后续产品活动产生的风险,在风险可控的情况下,方可决定是否继续进行生产、试验、试飞等任务。针对发现的质量问题,采取有效围堵措施,以隔离问题。同时成立技术归零团队,采用系统工程分析和项目管理方法解决质量问题。
(3) 定位准确。技术归零团队应组织开展问题调查和分析活动,确定质量问题发生的现象和准确部位,必要时请具备法定资质的鉴定机构提供鉴定结果,分析、判断问题发生的直接原因和根本原因。
(4) 机理清楚。通过理论分析或试验等方法,确定质量问题发生的根本原因。对于重大质量问题,定位和机理分析可同步进行,拟定解决方案,并确定后续工作计划。为确保质量问题归零的有效性,在完成质量问题定位和机理分析后,质量管理部门应组织对问题定位和解决方案进行评审。
(5) 故障复现。当定位评审结论有对质量问题进行复现的明确要求时,技术归零团队应通过试验、仿真等方法复现各故障模式,或通过原理性分析复现无法通过试验复现的问题,确认质量问题发生的现象,验证定位的准确性和机理分析的正确性。
(6) 措施有效。针对发生的质量问题,采取纠正措施,并经过验证,确保质量问题得到解决。
(7) 举一反三。质量管理部门负责在质量问题定位后,及时将归零信息反馈给本项目、本单位和其它项目、其它单位,由相关项目团队或单位组织在本项目各架次,以及可能发生类似问题的单位部门范围内开展举一反三工作,依据检查结果采取预防措施,并将举一反三结果纳入归零报告中。
2.2 管理归零
针对发生的质量问题,从管理上按照过程清楚、责任明确、措施落实、严肃处理、完善规章、修订标准、系统改进、知识共享共八项要求进行分析和改进,并形成管理归零报告。
(1) 过程清楚。清楚发生问题的时间、地点、工作环境、运行程序、现象和结果,清楚管理环节、岗位和管理方式方法,清楚管理工作程序或制度中的漏洞、薄弱环节。
(2) 责任明确。依据问题发生的过程,明确涉及的相关责任中心、相关人员,明确直接责任、间接责任、主要责任和次要责任,明确领导责任和执行责任。
(3) 措施落实。针对管理中的薄弱环节或漏洞,制订并落实有效的纠正措施与预防措施,措施应具体、可操作、可检查,措施落实明确计划和责任人,并具备保障条件。对措施落实的客观证实材料和监督检查进行记录。
(4) 严肃处理。按照质量奖惩规定,根据责任、损失、问题的严重程度,对发生质量问题的责任单位和责任人实施处罚。管理归零工作中的严肃处理,主要是吸取教训,加强思想教育和制度的宣教贯彻与培训,这一点应放在处理工作的首位。对于确需处罚的责任单位和责任人,也应以批评教育、吸取教训为主。
(5) 完善规章。识别出现有规章制度中不完善的地方,将归零工作的措施固化到相关的规章制度、作业指导文件、标准、规范中。
(6) 修订标准。及时发现公司内部标准、国内外行业标准、相近行业标准中存在的不完善处,参与推动国内外行业标准的修订。
(7) 系统改进。将归零的成果应用到在研、在制和已交付产品中时,针对生命周期的不同阶段,综合考虑时间、成本和安全等要素,对客户的安全、快捷、增值等需求做到确认和验证。
(8) 知识共享。质量部门应将管理归零报告纳入案例库,将相关经验教训跨项目、跨部门、跨中心共享,归零过程接受专家指导和监督。
3 应用实例
某次民用飞机项目开展质量审核,发现如下问题:有部分架次装配大纲中配送物料详情清单存在无法获取所需零件系列号信息的情况,有关部门基于双五归零方法开展了工作。
(1) 及时处置。信息化部门接收到故障问题后,立即组织系统负责人与业务方组建临时团队,明确具体故障现象,成立应急方案解决小组,紧急对相关问题进行确认与检查,并与现场业务用户沟通,修复相关数据显示。
(2) 风险可控。在及时处置初步排查时发现,零件系列号在企业资源计划系统中的原始信息是完整记录的,在车间配送时,发料单系列号信息也是完整的。现有系统存储的每本装配大纲实际使用的物料清单,包括数量、系列号、批次号等信息,信息均完整,可以提供实物构型所需要的数据。该架次装配大纲的页面显示功能仅供用户查询,不影响对实物构型数据的获取。
(3) 问题定位。先进行业务场景分析。生产现场发料均在企业资源计划系统中操作,物料所包含的信息,包括数量、系列号、批次号等,均存储在企业资源计划系统中。在发料成功后,发料数据通过接口传输至制造执行系统物料模块,同时在系统内进行保存。制造执行系统装配大纲显示的物料配送详情清单会实时读取并展示企业资源计划系统已经发料的信息,以供用户查看。
再进行故障树分析[10]。根据业务场景分析,针对零件系列号不显示问题,可按照故障树分析法对问题原因进行逐步分析。通过故障分析下行法关联数据解析、数据存储、数据传输等逐步分割问题单元,形成可能产生问题的故障树,如图1所示。
▲图1 故障树分析
分析得到问题的最小故障单元集,包括页面解析数据故障、物流系统存储数据故障、企业资源计划系统数据传输接口故障、物流系统数据接收接口故障。
检查所有发料详情数据中企业资源计划系统批次号不为空,以及供应商批次号和零件系列号为空的数据。以企业资源计划系统物料号、工厂、批次号作为对象,在企业资源计划系统中查询所有内部对象号。以内部对象号作为查询条件,在企业资源计划系统中查询是否存在供应商批次号与零件系列号不为空,且特征值为0。确认不存在后,证明所有企业资源计划系统中供应商批次号或零件系列号不为空的物料发料记录均有值,确认数据存储正常。
检查企业资源计划系统发料数据同步接口,确认所有企业资源计划系统发料信息数据均成功同步,供应商批次号与零件系列号数据均传输正常。
物流系统对接收的数据进行解析后,存储于物流系统数据库,传输和接收的数据一致。
通过对页面数据进行分析,发现同一本装配大纲下的自制件同类零件数据,有的显示正常,有的显示不正常,确认数据解析接口异常。
最后定位结果。根据故障树进行排查,发现系列号不显示的原因是装配大纲页面解析数据故障,属于软件开发缺陷。
(4) 机理分析。归零小组召集相关业务系统运行维护工程师,召开内部专家技术讨论会,针对定位问题装配大纲页面解析数据故障,在测试环境中进行验证。数据使用场景有三方面:① 装配大纲和制造大纲发料详情数据,数据来源于物流系统装配大纲和制造大纲发料详情,实时抓取数据;② 物流系统装配大纲和制造大纲发料详情,数据来源于企业资源计划系统发料详情,物流人员在企业资源计划系统进行发料时,实时同步企业资源计划系统发料数据至物流系统;③ 数据通过网络服务器接口方式进行同步,企业资源计划系统发料信息同步至物流系统,装配大纲发料详情实时抓取物流系统数据,数据来源于企业资源计划系统,且数据都保存在后台数据库中。
通过分析,未显示数据字段为装配大纲零件系列号,后台数据库对应字段为A。企业资源计划系统中包括供应商批次号、零件系列号等数据,通过规则组合后同步至A。由于企业资源计划系统功能优化,增加了零件代码等信息,一并组合同步至A。优化后,提取零件系列号的解析数组位置发生变更,新产生的零件系列号增加了零件代码,因此取位地址需新增判断逻辑。由于该判断逻辑未及时进行更新,因此对新产生的零件系列号获取信息失败,导致展示出现问题。
分析结论为装配大纲页面解析数据代码有缺陷。根本原因如下:① 软件开发代码逻辑存在缺陷,在新增字段属性业务场景下,未增加新的解析逻辑;② 代码质量审查流程中,未发现故障的业务场景代码,审查覆盖面不全;③ 在系统测试过程中,因制度中缺少用户测试参与的规定,未发现测试点展示的异常问题;④ 缺少用户举手机制。
(5) 问题复现。信息系统工程师通过对接口解析修正,并恢复原状,在测试环境中成功复现系列号不显示问题,验证了问题分析的定位准确与机理正确。
(6) 采取的措施及验证。对物料详情信息进行全面梳理,对涉及物料属性解析的功能点进行检查,确保各个集成功能点数据显示正常。
针对本次问题,采取以下措施:① 对装配大纲页面解析数据代码缺陷完成修复;② 对解析数据代码缺陷修复前的所有发料数据进行逐条排查,确认企业资源计划系统发料所有数据均同步至物流系统;③ 对解析数据代码缺陷修复后产生的新数据进行查询验证,确保新功能满足数据传输和接收的完整性要求。
为防止再次发生类似质量问题,采取如下措施:① 将解析数据代码缺陷纳入案例库,召开内部质量案例分享会;
② 针对序列号和批次号的填写逻辑,增加系统空值提醒校验功能;③ 更新代码规范检查库,通过总工程师系统进行评审;④ 增加用户对测试场景的确认流程;⑤ 执行的生产程序中增加用户举手机制。
(7) 举一反三。对物流系统自制件的发料清单数据进行抽检,确认数据均已正常。对物流系统发料详情中其它物料字段进行抽检,确认数据均已显示正常。
4 结束语
在处理和解决质量问题时,选取合适的归零方法,能够有效解决质量问题。对于民用飞机研制中的质量问题,应用基于系统工程的双五归零方法,是一种非常有效的归零手段,其归零过程严谨,逻辑清楚,要求严格,能够杜绝质量问题敷衍归零。
通过对发生的质量问题进行归零实践,将基于系统工程的双五归零方法应用于航空领域信息系统质量问题,可以使信息系统的质量问题得到更为有效的解决,效果良好。