语义视角下基于大数据分析的装备体系评估研究
2016-04-13李新明
李新明, 李 亢
(1. 装备学院 复杂电子系统仿真实验室, 北京 101416; 2. 63626部队)
语义视角下基于大数据分析的装备体系评估研究
李新明1,李亢2
(1. 装备学院 复杂电子系统仿真实验室, 北京 101416;2. 63626部队)
摘要针对传统装备体系评估方法在复杂体系结构建模、解析评估方法设计、大型模拟仿真计算等方面存在的问题,尝试将大数据分析应用到装备体系评估中。从语义角度研究了基于大数据分析的装备体系评估,在设计评估框架的基础上,分析装备体系评估中的语义问题,提炼其中的关键技术,分析各关键技术路线;通过数据挖掘和知识发现等相关技术分析海量多源异构的装备数据,得出装备体系能力及能力的度量,为实现基于大数据分析的装备体系评估提供理论基础和技术框架。
关键词装备体系评估;大数据分析;语义
System-of-systems Assessment of Equipment Based on Big Data Analysis in Semantic Perspective
LI Xinming1,LI Kang2
(1. Science and Technology on Complex Electronic System Simulation Laboratory, Equipment Academy, Beijing 101416, China;2. 63626 Troops, China)
AbstractTo tackle the issues existing in traditional equipment system evaluation method in the respects like complex system modeling, analytical evaluation methods design and large simulation computation, the paper tries to apply big data analysis to the assessment of equipment system. The paper makes the research on the equipment system evaluation based on big data analysis in semantic perspective and then analyzes the semantic problem in equipment system evaluation on the basis of evaluation framework design to extract key technologies and probe into key technology routes. By application of relevant techniques like data mining and knowledge discovery, the paper analyzes massive amounts of multi-source heterogeneous data and concludes the capability of equipment system and the measurement of the capability so as to provide a theoretic basis and a technical framework for equipment system evaluation based on big data analysis.
Keywordsequipment system-of-systems assessment; big data analysis; semantic
装备体系是指在一定的战略指导、作战指挥和保障条件下,为满足一定的战略需求或作战需要,由功能上互相联系、互相作用的各类武器系统组成的有机整体[1]。装备体系评估是对装备体系进行总体性评价,发现装备体系建设中的短板和不足,优化装备的配置和部署,最大化地发挥装备体系的整体性能,是装备体系建设的重要环节[2]。随着信息化战争模式的发展,基于能力的装备体系评估得到了越来越多专家学者的关注和研究。所谓“能力”,是在特定的标准和条件下,通过组织运用各单位的人员、装备、技术等武装力量遂行某种特定的任务、达到某种效果的本领[3]。本文探索将大数据分析应用到装备体系评估的研究中,从语义的角度设计评估框架,分析装备体系评估中的语义问题,提炼分析其中的关键技术与方法途径,为实现装备体系评估研究的创新发展提供新的思路。
1问题的提出
常见的装备体系评估方法主要有专家评估法、解析评估法、仿真评估法等[4]。专家评估法通过专家掌握的专业知识和经验对研究问题进行定性地评价,适用于缺少资料和数据的情况,但由于其判断的主观性较强,不能作为主要的评估方法。解析评估法通过建立评估指标与给定条件之间的函数关系计算体系效能,但其涉及的先验知识和权重设置受人为因素的影响,而且对于作战过程中对抗行为的考虑较少,难以满足装备体系评估的需求。仿真评估法通过将仿真数据输入到体系仿真模型中,分析仿真结果数据进行装备体系效能评估,其缺点是仿真模型的构建过程十分复杂,而且难以校验模型的优劣程度。随着装备体系的结构愈加复杂,传统的体系评估方法在复杂体系结构模型构建、解析评估方法设计、大型模拟仿真计算等问题上的瓶颈难以克服,越来越难以满足当前信息化战争条件下装备体系评估的需要。
近年来,大数据分析技术的兴起为众多行业领域的研究提供了新的解决方法和手段,它的创新应用极大地影响了人们生活的各个方面。大数据分析技术是科学研究在实验实证、理论分析、计算模拟3种研究模式基础上诞生的第四种研究模式——数据密集型(Data Intensive)研究模式,即不再从已知的规则中计算推理,而是从数据中寻找问题的答案,获得理论上的突破。谷歌公司的技术总监Peter Norvig曾在新信息技术峰会中提出了“All models are wrong, and increasingly you can succeed without them”的观点[5],指出区别于基于数学模型的传统研究方式,大数据分析不再关注于构建数据模型中的因果关系,而是通过大量分析数据之间的关联关系发现其中蕴含的新知识、新规律。
大数据分析的发展为装备体系评估提供了崭新的思路,通过对构成装备体系的装备进行大数据分析得出装备体系的能力水平,是一种开创性研究思路[6]。这种研究思路运用了信息技术的最新研究成果,通过采用人工智能方法深度分析海量的装备数据,客观地评价装备体系的能力水平,具有重要的理论意义和应用价值。
2基于大数据分析的装备体系评估框架研究
基于大数据分析的装备体系评估将弱化评估的过程,通过分析海量多源异构的装备数据集,得出装备体系的能力及能力的度量,然后通过分析不同装备体系的输入及其能力的评估结果,得出特定装备组合对于装备体系能力的影响,发现制约装备体系能力的制约性因素。大数据分析的实现过程通常包括数据获取、架构选择、数据装入、编码分析、知识发现等步骤[7-8],本文结合装备体系评估的应用实际,提出基于大数据分析的装备体系评估框架,主要包括以下5个部分。
2.1装备体系评估基础设施
基于大数据分析的装备体系评估处理的对象是海量多源异构装备数据集,因此需要构建相应的基础设施,具备多源异构装备数据处理需求的存储管理能力和分布式高性能计算能力。
装备数据的存储管理需要解决装备数据海量异构的问题,结构化数据存储在关系数据库服务器中,有利于实现高效地读取操作和处理分析。对于半结构化数据和非结构化数据,采用NoSQL数据库管理系统,以支持异构数据的存储与管理。装备数据的分布式高性能计算能力需要高性能计算服务器和Hadoop生态系统搭建的分布式计算集群,从而形成面向大数据的存储能力和计算能力。
2.2装备体系海量数据资源
装备体系海量数据资源包括了关系数据、文本数据、图像数据、视频数据、频谱数据等多种类型的数据。按照数据在体系评估中的作用可以将其划分为装备实体数据、体系基础数据和装备业务数据。
装备实体数据是评估系统的核心数据,广泛集成了可获取的装备数据库,数据来源主要有装备部门和相关业务单位管理的装备数据库等。装备业务数据是装备在运行过程中产生的数据,包括各类传感器装备获取的图像、视频数据、频谱数据等,从这些数据中可以分析得出装备作战过程中的运用表现,其数据处理结果是体系评估的重要参考依据。
2.3多源异构装备数据集成
多源异构装备数据集成是对装备体系海量数据资源的有机整合,涉及了数据集成管理、领域标准构建、概念映射、关系学习等多种数据处理技术和方法的运用。
数据集成能够将多源的装备数据复制或映射到中心数据管理系统中,对数据进行统一的存储和管理。集成过程是异构到同构的映射过程,使应用程序能够进行统一地分析与处理。装备数据中存在语义异构的问题,通过语义集成将装备数据的语义内涵统一到同一语义规范上,通过概念映射和关系学习的方法将异构装备数据映射相互关联的语义数据集,并采用统一的语言对数据进行规范化描述。
2.4装备体系评估模型构建
装备体系评估模型给出了作战想定、体系结构建模、体系视图产品的开发、体系能力生成规则等信息的描述。
作战想定数据描述作战的意图、兵力的配置、作战协同计划、作战原则与规律等信息,明确了体系评估的任务背景,是开展体系评估的纲领性说明。体系结构建模和体系视图产品开发是对装备体系进行刻画和描述的必要步骤,在装备体系结构元模型的基础上构建整个体系的多视图模型,能够确保装备体系结构建模的规范性。体系能力生成规则描述了装备体系规模结构、配比组合、规划部署等要素对体系能力的影响,是开展装备体系能力评估的规则标准。
2.5装备体系评估应用
装备体系评估应用是在上述工作基础上开展的应用性研究,包括基于能力的装备体系评估、装备体系的大数据分析、辅助决策支持等内容。
基于能力的装备体系评估是通过分析作战想定条件下的装备数据集,得出装备体系所蕴含的能力及能力的度量。装备体系的大数据分析是通过人工智能等技术方法对海量装备数据进行关联分析,发现影响装备体系能力的制约性因素。辅助决策支持是指采用可视化的方法将装备体系评估中的体系结构、装备性能、能力指标的关系用图形的方式展现出来,有助于发现其中内在的关联,为决策者提供辅助决策支持。
3基于大数据分析的装备体系评估语义分析
从以上论述中可以看出,装备数据贯穿了基于大数据分析的装备体系评估的整个过程,它不仅是评估的对象,还是装备体系结构的存在形式,同时也是能力评价结果的表现。然而,数据在进行存储、集成、处理、分析、评估的过程中,会根据不同的需要转换为不同的表现形式,而数据的内涵并没有因此改变,这个不因应用环境而发生改变的数据内涵,称之为语义(Semantic)。语义具有明显的领域性特征,如何将不同来源的数据在语义层面有机地关联起来,是研究语义的目标。下面结合本文的研究内容给出装备体系评估领域的语义分析及实例说明。
定义1装备的语义:装备根据其自身的性能特点在特定装备体系中所发挥的作用。
例1以REL-6B装备数据为例,从创建者A的角度描述装备功能为对空侦察,工作频段为L,最大探测距离为360 km,覆盖高度为18 km,仰角范围0~30°。从创建者B的角度描述装备特性为对空,雷达频段为L,作用距离为360 km,覆盖高度为18 km,俯仰角0~30°。虽然两者对该装备数据在字段设置、术语名称、计量单位方面的描述方式不同,但雷达根据其自身性能在特定装备体系中发挥的作用是不变的。这种不因数据的描述方式而改变的“意义”,即是装备的语义。
定义2装备体系的语义:装备体系在特定视角下所呈现出的特定视图。
例2由若干种装备组成的某装备体系ZZTX-1,从作战视图的角度,ZZTX-1代表了使命任务描述O1、作战过程O2、作战要素描述O3等作战信息;从系统视图的角度,ZZTX-1代表了装备Z1、Z2等,以及装备系统S1、S2等体系要素构成;从能力视图的角度,ZZTX-1代表了体系能力C1、C2、C3等装备体系能力。这种不因视角不同而改变的装备体系的“意义”,即为装备体系的“语义”。
定义3装备体系能力的语义: 装备体系在特定的背景条件下完成特定任务的本领。
例3由若干种装备组成的某装备体系ZZTX-2,在任务背景X1下,其表现出的能力为体系能力C1-β1、C2-β2、C3-β3;在任务背景X2下,其表现出的能力为体系能力C4-β4、C5-β5、C6-β6;在任务背景X3下,其表现出的能力为体系能力C7-β7、C8-β8、C9-β9,其中{βi|i=1,2,3,…,9}为相应能力的量度。这种不因任务背景不同而改变的装备体系能力的“意义”,即为装备体系能力的“语义”。综合以上分析可以发现,装备的语义、装备体系的语义或是装备体系能力的语义,在不同表现方式、不同的视角或是不同的任务背景中,会表现出不同的“样子”。然而,不管是装备、装备体系或是装备体系能力,它们本身都是一种静态的存在,其本质的“意义”并没有发生变化,这种“意义”就是我们所定义的“语义”。
数据是语义的载体,为了对数据中的语义进行提取和分析,需要建立在规范化的形式描述、统一的数据模型、明确的逻辑规则等基础之上。本体以其在概念模型、明确化、形式化、共享方面的特点,对于语义的描述有天生的优势[9],根据不同的应用层次,可以划分为领域级本体(Domain Ontology)、应用级本体(Application Ontology)、数据级本体(Data Ontology)。因此,采用本体作为语义的描述方式,用本体来描述评估对象、体系结构、规则模型和评估结果。
4关键技术分析与方法途径
图1 基于语义的各关键技术研究思路及技术路线
以基于大数据分析的装备体系评估框架为基础,提炼出装备体系结构语义模型构建、装备数据领域本体构建、多源异构装备数据本体学习、装备体系能力语义聚合共4个需要重点研究的内容,下面给出各关键技术的研究思路与方法途径,如图1所示。1) 基于语义元模型的装备体系结构建模方法研究。装备体系结构建模是开展体系评估的基础,需要将装备体系结构模型构建在共同语义的基础上,以满足语义集成的需求,因此开展基于语义元模型的装备体系结构建模方法的研究。该方法首先提出语义装备体系的概念,在语义元模型的基础上构建概念数据模型,定义装备实体、性能指标、作战活动、行动规则、装备系统、系统功能、能力元素和能力规划8个核心组成要素及要素之间的关系;其次构建逻辑数据模型,定义以类、关系、属性、实例四元组的本体描述框架,并给出本体描述。基于语义元模型构建作战视图本体模型、系统视图本体模型、能力视图本体模型,给出各要素属性、关系的类型及定义域和值域的形式化描述。
2) 基于概念格的装备领域本体构建方法研究。装备数据语义集成面临的首要挑战即是构建一个合理的全局视图,明确装备领域内的概念内涵及概念之间的关系。因此需要构建符合标准规范的装备领域本体构建方法的研究。针对装备领域的概念及关系描述不规范、难以实现知识共享和重用的问题,以军语、军事百科等标准规范为依据,提取装备领域中核心的概念和分类,并通过建立《装备属性主题词表》对装备属性的语义内涵给出清晰地描述,对装备领域中概念、属性及其之间的关系进行规范化的描述从而生成顶层领域本体,然后采用本体映射的方法完成全面、细粒度的装备领域本体的构建,为装备体系结构的概念数据模型的定义提供参考标准。
3) 多源异构装备数据本体学习方法研究。由于装备数据存在结构异构、语义异构等问题,无法进行统一的分析和处理,因此开展本体学习方法的研究,将多源异构装备数据以自动化的方式映射为语义数据。针对现有语义相似度计算方法适用性单一的问题,研究自适应领域的语义相似度计算公式ADSim,并基于ADSim计算公式提出概念映射算法,得出该背景条件下最优的阈值,建立符合条件的概念映射。研究的复杂语义关系学习算法,经过自底向上地不断更新能够覆盖原有的子句,实现数据之间关联关系的发现。通过本体学习将装备数据映射为装备本体,使之成为构成体系的基本单元,为下一步的体系评估提供数据支撑。
4) 面向体系评估的装备数据语义聚合方法研究。通过分析装备数据得出装备体系能力是基于大数据分析的装备体系评估的目标,针对现有研究中没有考虑数据对知识支持程度的不确定性的问题,开展基于证据推理的语义聚合方法研究。针对语义数据处理中存在的逻辑关系单一、知识规则简单的问题,研究基于证据推理的语义聚合方法,定义语义数据的属性对知识的聚合关系,阐明证据到知识的聚合关系、知识与知识之间的聚合关系;提出基于Tableau的语义聚合算法,用于判断知识成立的可满足性,从定性和定量的角度分析出语义数据中隐含的知识和知识的度量。研究基于SWRL构建装备体系能力语义聚合规则,实现基于语义聚合的装备体系能力评估。
5结 束 语
将大数据分析应用到装备体系评估是一种创新性研究思路,本文从语义视角对基于大数据分析的装备体系评估开展探索性研究。根据大数据分析的技术特点以及装备体系评估的一般流程,提出了基于大数据分析的装备体系评估框架,从语义的角度对装备体系评估进行分析,提出了4个核心关键技术与方法途径,为实现基于大数据分析的装备体系评估提供理论基础和技术框架,推动装备体系评估研究的创新发展。
参考文献(References)
[1]牛新光.武器装备建设的国防系统分析[M].北京:国防工业出版社,2007:21-23.
[2]李新明,杨凡德.电子信息装备体系概论[M].北京:国防工业出版社,2014:174-175.
[3]DoD Architecture Framework Working Group.DoD architecture frame work version 2.0[R].[S.l.]:U.S. Department of Defense,2009:82-88.
[4]赵青松, 杨克巍, 陈英武,等.体系工程与体系结构建模方法与技术[M].北京:国防工业出版社,2013:102-103.
[5]CHRIS A.The end of theory: the data deluge makes the scientific method obsolete[N].Wired,2008-06-23(7).
[6]李新明.装备体系评估中的大数据问题[J].装备学院学报,2014,25(5):6-10.
[7]FISHER D,DELINE R,CZERWINSKI M.Interactions with big data analytics[J].Interactions,2012,19(3):50-59.
[8]CHANDARANA P,VIJAYALAKSHMI M.Big data analytics frameworks[C]//Circuits,Systems,Communication and Information Technology Application(CSCITA),2014 International Conference on IEEE.Mumbai:IEEE,2014:430-434.
[9]BRAVO M,RODRíGUEZ J,REYES A.Enriching semantically web service descriptions[J].Lecture Notes in Computer Science,2014,8841(1):776-783.
(编辑:李江涛)
中图分类号TP182
文章编号2095-3828(2016)01-0001-05
文献标志码A DOI10.3783/j.issn.2095-3828.2016.01.001
作者简介李新明(1965-), 男, 研究员, 博士生导师,主要研究方向为装备体系、大数据。
基金项目国家自然科学基金资助项目(60904082)
收稿日期2015-05-08