面向场景化的知识管理与服务模式研究
2023-08-29才华许源董晓军刘祎然北京航天长征科技信息研究所
才华、许源、董晓军、刘祎然 /北京航天长征科技信息研究所
随着世界范围内工业产业升级,我国航天相关技术产业也随之不断发展、转型,诸如工业4.0、智能制造、大数据、云计算、量子通信等技术受到愈加广泛的应用。作为典型的知识密集型科研机构,中国航天企业在几十年的科研生产中积累了大量的历史知识数据,呈现出数据量大(Volume)、数据种类多样(Variety)、数据增长速度快(Velocity)、数据蕴藏价值高(Value)的“4V”特性,如果不辅以采集、挖掘和分析等知识应用技术,其效用难以发挥。
纵观数据文化已根深蒂固的美国,大数据的应用已渗透到社会各行各业,尤其是牵引美国高新技术发展的航空航天领域。美国国家航空航天局(NASA)通过构建地球科学数据和信息系统项目,实现了对地球卫星数据的实时处理、存档和发布,确保科学家和公众可以实时地访问从地球到太空的数据,提升应对气候和环境变化的能力;美国国防部高级研究计划局(DARPA)启动其大机理项目,旨在通过分析复杂的经济、社会、大气和生物数据之间的深度关联关系,为医学、环境等各领域提供决策支持;洛克希德·马丁公司也开始启动大数据研究工作,通过在全球范围内不断收购大数据信息技术企业,探索大数据技术在国防信息系统建设方面的应用。
一、大数据知识应用需求分析
目前,众多企业机构面向航天大数据的体系建设开展了大量的研究与实践,然而覆盖型号全寿命周期的航天大数据管理与控制仍有待深入。一方面,大量数据主要依靠各组织单位归档,相关制度标准不健全、数据资源分散独立、深度挖掘程度低、数据共享使用困难以及综合运用水平偏低等矛盾依然突出,成为研制周期优化上的短线和瓶颈。另一方面,一线员工面对各种异构繁杂的知识数据,普遍希望将工作中的知识资源通过某种方式进行转化,最终整合并统一推送,从而提升工作效率。
从表1 可看出,决策领导层关注如何让多年积累的工作留痕,避免“人去楼空”的现象,并在留痕的基础上对知识资源有序的掌控、流转;型号总师更关心知识如何在型号队伍内有效流转,并将已完成的型号知识资产进行有效萃取,无缝对接到后续型号;专业部门的管理者关注如何让自己的团队能够通过知识应用,有序地发展并加速人才培养,规划清晰的技术发展路线;技术人员则关注如何让自己参与的项目开展更为顺利,将工作中的知识资源、软件工具、模板进行有效串联并伴随着工作进行推送,提高工作效率。
表1 各角色人员对大数据知识应用的典型需求
二、基于场景化的新知识管理
知识管理不仅可以使知识场景化,而且能够渗透到智能感知以及人工智能领域。1977 年,第五届国际人工智能大会上,斯坦福大学教授爱德华·费根鲍姆提出知识管理的概念。国内外知识工程的发展大致经历了4 个阶段(见图1):第一阶段以知识本身为核心,关注信息检索、知识库建设以及知识加工技术;第二阶段以集成为核心,关注智能检索、异构信息集成以及关联分析技术;第三阶段以应用为核心,关注知识推送、知识嵌入和行为驱动技术;第四阶段进入了新知识工程,强调以人为核心,关注基于用户模型的推送,人和知识、流程的融合以及大数据、云计算和物联网等新技术在知识工程中的应用。
图1 知识管理发展阶段
新知识管理的理念由原来的人、流程、技术围绕知识转变为知识流程、技术围绕人,不仅仅是专家,还包括人的智慧。在人工智能大数据时代,所有人的智慧都可以被计算,由此产生了群体智慧。
新知识管理实践更为关注面向诸如业务流程、软件工具协同、专业岗位、用户模型等不同场景形成快速应用的机制,使其更具智能化;伴随化是在整个流程里营造一个分享的环境,当感知到各个岗位需要的知识时便进行精准推送;内部化是把外部的先进技术引进来,时刻站在巨人的肩膀上保障技术研发的前沿化,是打通外部知识和内部知识的途径;资产化是建立高关联性单元知识库,先进行知识挖掘,再开展大数据收集,最终形成资产。新知识管理如果能够加以良好实践,便可解决各个角色在大数据需求中的各个业务痛点。
三、场景化知识应用实践
场景化的知识应用需要将有限的资源构建形成无限的组织知识库,在面对不同用户时,根据其需求提供最合理的服务。整个流程可以从终端反馈给知识资源贡献者,进而使知识工程平台得到不断优化,这一过程可采用霍尔三维结构的思路进行构建(见图2)。其中时间维代表产品型号预研—设计—生产的过程,也是业务流程;逻辑维表示梳理工作过程中遇到的每个问题,并对问题进行有效识别,确定问题的目标,进行外在条件和内在因素的综合分析,从而达到决策的思维顺序;知识维表示随产品周期和逻辑对问题进行解决的过程,运用专业知识和技能,配合时间维、逻辑维对知识进行有效支撑。
图2 基于霍尔三维结构的知识应用模型
1.总体思路
图3 展示了基于场景化的知识应用建设总体思路。首先从知识的采集和存储开始,针对内外部的异构资源,采取手动或自动的采集存储方式;其次进行知识加工,从人工加工处理数据开始,对知识进行分类,建立词典和基于本体的语义网,通过机器学习技术实现自动的知识分类;最后基于上述基础,开展面向专业、流程、型号、知识萃取、组织、岗位、协同工具以及用户模型个性化等场景化知识挖掘和知识推送。
图3 基于场景化的知识应用建设的总体思路
2.知识采存
知识采集的方式可分为人工导入、多源异构的自动采集、集成和智能挖掘等方式。采集中,从内容的角度划分出基础技术资源、工程资源和数据资源;从来源的角度,分为内部业务系统数据信息、外部采购数据信息和外部互联网信息;从采集方式的角度,分为文档资源、数据库资源和网页资源3类,具体设计内容如图4 所示。
图4 知识采集方式
面向大数据存储,考虑数据的安全、可靠、效率等关键指标,分析用户规模、服务范围、网络环境等方面的挑战,可依托云架构的网络化、分布式存储方案,开展数据谱系建设、数据状态管理、数据安全防护、数据交换、数据高效检索等数据管理技术研究,为海量航天数据的使用和维护提供支撑。
3.知识加工
知识加工伴随着结构化处理的难点,一方面是数据类型多样化、数据格式不统一,需要分析和研究数据结构的标准化方案或其他技术解决方案;另一方面是数据间的逻辑关系复杂、数据背后的流程差异大,需要研究和构建完善的数据关系模型。因此,采集后的资源需要进行数据化转换,即进行模板化处理。在进行元数据自动标引时,自动提取关键词摘要,构建基于本体的网络、语义关联,随即进行查重、敏感词过滤,完成后将资源作为后续知识挖掘或推送等应用。因此,这一处理过程是基于场景化知识应用落地的关键步骤(见图5)。
图5 知识加工技术及流程
4.知识挖掘
关联挖掘工作是航天大数据工程建设的核心内容之一,目的是将多源异构和低价值密度的数据转化为有分析决策价值的显性知识网络,最大化提高信息处理和分析效率,结合可视化方法展示挖掘分析结果,发挥航天大数据建设的整体效益,为型号全寿命周期研制提供决策参考。基于已形成的结构化航天数据库,开展面向专业、流程、型号、岗位等维度的场景化快速计算和关联挖掘研究。
(1)多维关联规则模型构建及其算法
针对航天数据的特点和处理需求,构建多维关联规则模型及其扩展形式,建立数据的属性抽取、知识发现,以及效能和适用性评估等模型,梳理从选型、建模到评估的流程及标准。可基于时序数据的参数相似性度量及参数因果关系辨识,确定适应航天数据特点的关联挖掘算法,提升关联挖掘的效能。
(2)多维数据关联知识图谱
针对测试参数、结构参数、目标参数等数据进行综合分析,对火箭、卫星等型号的工作状态、技术指标进行关联、聚类和分类等分析,建立关联知识图谱,从不同维度挖掘标准要求的设计值与实际试验值之间的差距和问题、各项指标参数变化与质量态势之间的潜在关联关系、产品寿命与性能退化之间的关联关系,实现整体型号产品效能影响指数预测、任务满足度预测、质量稳定性趋势预测等。
(3)基于大数据的故障模式识别研究
利用人工智能、大数据决策分析等先进技术,开展故障模式预示方法研究。基于历史数据开展数据建模工作,通过监督学习算法对已发生的故障进行训练,并开展故障模式识别,获取故障关联规则,降低故障识别过程中的误报率和漏报率,为任务方案、信息处理、指挥控制等方面的持续改进提供依据。
5.知识推送
数据经过挖掘分析后,可将挖掘结果在型号研制的各个阶段向决策领导、型号总师、专业部门管理者和技术人员进行知识推送。在不同阶段,基于不同工具、平台或模型进行场景化知识推送,例如在立项论证、可行性论证和总体方案制定阶段,基于Word 等协同编辑工具进行推送,在初步设计和详细设计阶段基于Catia、UG 等仿真工具进行推送,如图6 所示。
图6 场景化知识推送
以基于Word 进行知识推送为例(见图7)。在Word 中制作插件,在报告编写过程中,技术人员能够搜索到以往编写的相似报告或报告模板,可查看、复用报告中的内容,同时在章节段落的定位中遇到问题时可点击相关按钮进行知识“求助”。
图7 Word编辑环境知识推送流程
基于用户模型的知识进行推送(见图8),考虑到用户的基本信息(所在岗位、组织)、个人知识(所发表的知识、收藏习惯以及个人知识体系分类)、用户行为(订阅、推荐、历史搜索、浏览习惯和下载习惯)、学习应用(提问、参加培训、在线答题)以及工作事项(待办、申请和消息)等模型因素,系统根据其偏好和行为轨迹、关系网络构建个人的用户模型,基于上述行为特征向用户推送知识。
图8 用户模型特征
航天大数据建设是一项知识密集、技术复杂的系统工程,充分利用场景化知识应用方法对研制生产流程各环节的规范进行刚性约束,对仿真数据、可靠性数据等分析提供参考,避免出现“信息泛滥而知识匮乏”的局面,将为型号和主管部门的决策管理提供一定支撑。