舰艇通信训练数据支持系统设计∗
2016-12-20王睿,姜宁
王 睿,姜 宁
(海军大连舰艇学院,辽宁大连 116018)
舰艇通信训练数据支持系统设计∗
王 睿,姜 宁
(海军大连舰艇学院,辽宁大连 116018)
可靠的数据保障是舰艇通信训练效果评估工作开展的基础。针对舰艇通信训练数据记录存储不规范、处理技术运用不合理和可视化程度不高等问题,构建一种实用性较强的舰艇通信训练数据支持系统。该系统充分融入数据挖掘、数据仓库和数据可视化等技术的优点,可对训练数据进行充分的分析处理,能够直接服务于训练评估工作和构建存储数据库,具有一定的实际应用价值。
通信训练;数据存储;数据处理;系统结构
通信保障负责各类信息的汇集与分发,是舰艇部队基于指挥信息系统作战的重要环节。海军各级舰艇部队广泛开展形式多样、不同层次的实战化通信训练,旨在通过训练摸清战斗力底数,检验和验证装备能力,尽可能地提高舰艇部队通信保障水平。训练效果评估,作为组训工作重要环节,其成效直接关系到训练效益的发挥程度,评估结论将对各级决策产生重大影响。效果评估工作强烈依赖于获取数据的质量,舰艇通信训练数据主要依靠人工分析处理,严重制约着训练效果评估工作的高效开展。
目前,国内外许多专家学者已对数据检测、清洗、处理、评估技术进行了深入的研究,提出了较为完备的理论挖掘体系[1⁃5],此外,还在多个专业领域的数据自动化处理方面进行了工程实现,构建了特色鲜明的数据支撑系统[6⁃10]。鉴于舰艇通信训练具有较强的军事特色和一定的复杂性,该领域的数据挖掘工作相对滞后,并没有将现代化的民用技术融合其中,缺乏系统化的研究成果。因此,本文针对舰艇通信训练数据保障需求,充分运用已有成熟数据挖掘技术的优点,设计一套完整的数据支撑系统,旨在为舰艇通信训练效果评估工作提供可靠的数据保障。
1 系统基本功能
1.1 服务专项训练评估工作
1)规范训练数据采集与存储
对舰艇通信训练数据的采集与存储工作进行规范,可以克服由于不同组训单位采用不同数据采集方案而造成的采集数据与训练效果评估指标不匹配,或采集的数据远远大于评估需求数据等问题,为各级组训单位提供标准化程度高、可扩展性好的数据采集组织实施标准。
2)提高训练评估实施效率
对采集后的数据进行必要的技术处理,检测问题数据、剔除无用数据、挖掘缺失数据和纠正错误数据,可有效避免评估者浪费大量时间于人工筛选数据工作,增加可用数据量,提高评估工作实效,进而确保通信训练效果评估工作的顺利进行。
3)提供可视化数据服务系统
对处理完毕后的直观数据、方案数据、预案数据和自评总结数据进行可视化呈现,将不同的分布方式与表述形式有机结合,构建可视化程度较高的数据服务系统,实现数据处理与效果评估工作的无缝对接,可在最大程度上降低评估专家人工调阅和辨识数据,进而满足训练效果评估工作现实需求。
1.2 建立舰艇通信训练数据库
依据功能目标搭建的舰艇通信训练数据支持系统具有良好的通用性和延展性,其不仅能够为训练效果评估及重演提供可视化数据支持,还能通过长期积累存储大量高价值信息,形成功能强大的基础数据库,可供存在需求的各级机关、业务部门、技术厂家等单位查询使用,以便从中查找、发现和暴露舰艇通信装备状态、装备故障情况、装备维修情况等信息,进而对舰艇通信装备改进、研发工作提供支撑。此外,系统还能与其它数据库进行对接,扩展其功能,进而保障更多层面用户的需求。
2 舰艇通信训练数据支持系统关键技术
2.1 数据挖掘技术
数据挖掘是一种挖掘性质的数据分析技术,能够自动地发现事物间潜在的关系和特征模式,并利用这些特征模式进行有效的预测分析[6,11]。广义的数据挖掘不仅仅将其视为搜索、寻找的一个环节,而是将其判定为从大量数据中挖掘有趣模式和知识的完整过程,主要包括:1)数据检测:查找存在问题的数据;2)数据清理:消除噪声和删除不一致数据;3)数据集成:多种数据源可以组合在一起;4)数据选择:从数据库中提取与分析任务相关的数据;5)数据变换:通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式;6)数据挖掘:使用智能方法提取数据模式;7)模式评估:识别代表知识的真正意义的模式。
2.2 数据仓库技术
数据仓库是一种数据库,它与单位的操作型数据库分别维护。数据仓库系统允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对信息处理提供支持。它是数据分析和联机数据分析处理的重要平台,更是数据挖掘的有效平台。数据仓库提供联机分析处理工具,用于各种粒度的多维数据的交互分析,有利于有效的数据泛化和数据挖掘。数据挖掘中的关联、分类、预测和聚类等功能,都可以与数据仓库的联机分析处理进行集成,进而加强多个抽象层上的交互知识挖掘[12]。因此,充分利用数据仓库技术,实现数据挖掘处理与数据仓库技术的有效融合,能够最大程度地保障数据支持系统的构建。
2.3 数据可视化技术
数据可视化旨在通过图形实现清晰有效地表达数据。利用可视化技术的优点,可以发现原始数据中不易观察到的数据联系[13]。数据可视化技术主要包括图形可视化、层次可视化、基于像素的可视化、几何投影可视化和基于图符的可视化等,这些技术可充分满足用户对不同复杂程度的数据呈现需求。鉴于数据类型特点,本系统主要采用图形可视化和层次可视化技术。可视化技术可为探索数据提供有效的工具,有许多成熟的工具和方法直接使用,这为系统的实现提供了可靠保证。除了对数据可视化之外,可视化也可用于表现数据挖掘过程、从挖掘方法到模式,以及用户与数据交互等。
3 舰艇通信训练数据支持系统
舰艇通信训练数据支持系统通过进行原始数据记录、存储、分类、检测、处理、挖掘、可视化、输出等一系列工作,旨在为训练效果评估端口提供可靠的数据支撑。依据常态化的数据挖掘处理流程,系统主要划分为数据录入模块、数据分类模块、数据处理模块和数据对接模块4个部分构成,其基本构成框架如图1所示。
图1 系统基本框架
3.1 数据录入模块
舰艇通信训练数据记录手段包括人工记录、软件记录、录音记录和摄像记录四种,鉴于各作战平台通信保障能力特点差异,在选择数据记录方法手段时,可采用不同的组合具体组织实施。通过不同记录手段的组合配用,完成初始数据库的信息录入。数据人工记录是最广泛、最传统的数据录入方式,主要依据专业的数据采集人员进行纸制信息记录、电子化录入工作,它是其它几项记录手段的重要支撑方式。音频数据记录主要依托录音设备实现初始记录,而后需通过人工解读(理解通信质量、话音通信要素等)录入到电子数据库中。视频数据记录主要依托摄像器材实现航迹数据和通信指挥决策数据初始记录,然后必须经过评估专家组成员或具备相关知识的数据采集人员解读后录入到电子数据库中。
3.2 数据分类模块
由录入模块引来的数据混乱无章,迫切需要进行分类,以便于后续的数据处理、挖掘和交互使用,数据分类遵循原则如下:1)各类数据尽可能相互独立,对于不同评估范围引起的数据交叉可在数据对接模块中筛选;2)数据分类尽可能详尽,以此满足评估值计算的需求。
舰艇通信训练效果评估对象与训练任务强相关,可对基于体系对抗编组的多平台通信训练效果进行整体评估,也可对不同等级的单平台进行评估,这些被评对象基本单元都是“平台”级,每一个“平台”都有独立的通信保障系统。此外,每一个平台均具备完备的组织指挥、战术运用、装备保障等一系列通信评估要素。数据分类过程中,在充分考虑数据分类原则的基础上,应采取“节点支撑、上聚下展”的思路,即以独立的作战“平台”为支点,在平台内部对数据分类进行细化,平台外可根据评估任务需要灵活聚合,组织训练评估数据的分类。其分类结构模型如图2所示。
图2 数据分类结构模型示意图
根据舰艇通信训练特点,节点平台指具有独立作战及保障能力的作战单元,应包括各类各型舰艇,该类信息主要包括平台型号、编号、类别、所属单位性质等。固态数据是节点平台在执行训练任务过程中不随时间变化而改变的稳定数据,主要包括装备配置、方案预案、人员业务能力。动态数据是节点平台随任务、时序等要素变化而发生改变的相关数据,主要包括持续通信时间、报文发送量、报文接收量、抗干扰手段运用等,这些数据具有较强的可约束性,可按照使用的通信网络进行划分。
3.3 数据处理模块
数据处理模块对分类后的数据进行清洗、挖掘等一系列工作,其生成数据以满足评估任务需求度为衡量标准。数据处理主要包括以下2个方面:1)全域数据处理思路。所谓“全域数据”是指跨时段较长的训练数据,总量特别大,处理过程中宁缺勿滥,采用通用性强、操作方便的技术进行数据检测处理;为方便与用户对接,进行必要数据规约化处理。2)局域数据处理思路。“局域数据”是跨时段相对较短的训练数据(可能为某一作战阶段),其总量相对较小,数据重要性强,除确实判定为问题数据外其余均应保留备用。在实施过程中,一方面对局域离群数据进行检验与处理,另一方面对缺失数据进行必要的挖掘以增加评估结果的可靠性。
3.4 数据对接模块
该模块主要实现数据支持形式的具体呈现以及用户与系统对接功能。数据可视化是通过一系列可视化方法分析探索数据中蕴含的各种信息,进而给予用户最直接的数据呈现。舰艇通信训练数据分布方式是数据排列的方法,按照使用需求,可划分为按时序方式分布、按类别方式分布和按聚类方式分布三种。舰艇通信训练数据表述形式是对数据人机交互的直观表述,除了通用的文字规则形式表现外,还可以通过图形或其它形式呈现。
数据实际对接使用中,可以根据需要将不同分布方式与表述形式相结合,形成可直接调用度高的成品支持数据。主要包括:基于时序分布的文字表述、基于时序分布的图形表述、基于类别分布的文字表述、基于类别分布的图形表述、基于聚类分布的文字表述、基于聚类分布的视图表述等(如图3所示)。此外,还可对分布方式进行两种以上的叠加,如基于时序聚类的文字表述。由于显示方法的多样性,该模块可以用插件的形式整合到该平台上,便于可视化方法的扩展。
图3 数据可视化组合输出示图
4 系统实际应用示例
4.1 基本情况
本文以舰艇组成编队遂行防空任务中接收报文数量为例。编队由A、B、C、D四艘舰艇构成,其中A舰艇为编队指挥舰;整个防空作战任务时间为某日0900-1000,具体划分为0901-0910、0911-0920、0921-0930、0931-0940、0941-0950、0951-1000四个时段,通信网络为1#、2#短波通信网和1#、2#超短波网络,接收报文以语音和文电形式体现(单位为:字或码)。按照前文内容,初始录入数据如表1所示。
表1 舰艇编队固定时段接收报文统计列表
4.2 目标需求
根据训练效果评估需求,要对作战编组远程短波指挥网通信保障效果进行评判,报文收发成功率是一项重要衡量指标,因此需要对整个舰艇编队短波通信网络的报文抄收数量进行统计。另外,为了对报文抄收准确性进行检验,还要呈现出编队内部各平台接收报文数量的比对,因此还要求数据处理系统能够提供简便直观的可视化图形。
4.3 过程及结论
数据支持系统工作过程中,按照数据录入、数据分类、初始存储、需求引导、数据处理和可视化结果输出等阶段逐级完成任务。针对本例特点,为便于理解及对系统描述,现仅以部分功能作用流程为代表(选择典型时段、通信平台网络以及目标需求),将上述步骤进行优化如下:
Step1:数据分类存储
根据数据分类模块功能,将表1数据按照舰艇平台-动态数据-网络分类进行初始化存储。
Step2:输出需求反馈
将具体目标需求直接调入到数据处理模块,包括输出限制条件、目标类型、样式、类别等,本例中为任务时段、各舰短波通信网络报文抄收数量可视化图形、各舰短波通信网络报文抄收总量与时段分布可视化图形、各舰短波通信网络报文抄收总量的文字形式。
Step3:数据检测与处理
本例背景任务持续时间较短,数据存储量较小,符合基于多情景制约的离群数据检测与处理技术适用范畴,系统采用该技术对初始化存储的数据进行自动检测。局域数据检测与处理时,应以时间序列为基本情景,选用非参数离群点检测方法计算处理[11⁃12],在结论判定阶段融入附加影响情景对可疑数据进行判定。
舰艇通信训练数据处理任务中,宜引入“电磁环境”、“网络分配”和“任务进程”影响情景集对特殊数据进行终极验证。此外,运用中心趋势度量技术[13]对数据列表中短波网络出现的3处缺失数据进行预测,实现数据挖掘。
Step4:数据聚类归约
数据检测及问题数据处理完毕之后,系统按照任务目标将0900-1000时段的短波1#网络、短波2#网络数据进行合并,剖离超短波网络数据,形成舰艇平台-短波网络数据模块,而后将A、B、C、D四类平台数据进行合并,形成编队短波网络接收报文数据集(如表2)。
表2 舰艇平台-短波网络接收报文量
Step5:结果输出
系统生成结果包括两项:1)编队内部各舰艇接收短波报文数量以基于聚类分布的视图表述形式呈现,该结果用于数据可靠性二次验证和应急处置措施合理性的判定。2)编队短波网络接收文总量输出:报文总量=1870。
5 结束语
分析、发现和暴露部队训练中存在的问题需要进行客观严谨的评估,而评估工作的高效开展极大程度依赖于训练数据的可靠支撑。针对舰艇通信训练特点,本文构建了舰艇通信训练数据支持系统,充分融入了数据采集、录入、处理、可视化等一系列先进的挖掘技术,按照“优化设计、功能聚合”的原则,合理配置了系统的功能模块,并以典型任务背景下的数据为代表进行了功能演示,能够为用户提供具备良好实用性、针对性的数据保障功能。本文是以舰艇部队一般性通信训练效果评价指标为基础进行研究的,当存在强电磁干扰、多兵种合同训练等情况时,还需要将系统进行调整完善,以满足数据保障不断变化的现实需求。
参考文献:
[1] 葛建军,刁兴春,陈爽,等.数据清洗及其一般性系统框架[J].计算机科学,2012,39(11):207⁃210.
[2] 樊金辉,岳昆.基于D⁃S证据理论的不确定数据清洗[J].云南大学学报,2014,36(6):815⁃821.
[3] 陈玉明,吴克寿,李向军.一种基于信息熵的异常数据挖掘算法[J].控制与决策,2013,28(6):867⁃872.
[4] Hernandez M A,Stolfo S J.Real⁃world Data is Dirty:Data Cleaning and the Merge/Purge Problem[J].Data Ming and Knowledge Discover,1998,2(1):9⁃37
[5] 林印华,张春梅,刘洁.基于清洗规则和主数据的数据修复算法实现[J].计算机科学,2012,39(11):174⁃176.
[6] 钱贵鑫,由大德,李进军.舰炮作战训练数据录入与分析系统总体框架设计[J].兵工自动化,2014,33(12):32⁃34.
[7] 李永杰.舰艇装备维修信息数据仓库建立与数据挖掘[J].计算机与数字工程,2010,38(10):68⁃71.
[8] 王净.数据仓库在装备维修信息系统中的应用[J].舰船电子工程,2008,28(8):120⁃123.
[9] 武小平,左春.基于工作流程的数据清洗系统[J].计算机工程与设计,2008,29(8):1878⁃1880.
[10]陈晓峰,刘兴,等.基于数据挖掘的海战场态势可视化平台构建[J].火力与指挥控制,2015,40(4):144⁃147.
[11]唐懿芳,钟达夫,严小卫.基于聚类模式的数据清洗技术[J].计算机应用,2004,24(5):116⁃119.
[12]谢庆华,张宁蓉,等.聚类数据挖掘可视化模型方法与技术[J].解放军理工大学学报,2015,16(1):7⁃15.
[13]范明,孟小峰.数据挖掘概念与技术[M].北京:机械工业出版社,2008.
Design of Warship Communication Training Data Support System
WANG Rui,JIANG Ning
(Dalian Naval Academy,Dalian 116018,China)
Reliable data guarantee is the foundation of warship communication training evaluation.Aiming at the problems of data recording disorder,disposing unreasonable and low visualization degree,the paper constructed a kind of practical data support system.Using data mining,data storage and data visualization technique advantages,this system can analyze and dispose training data fully,serve training evaluation directly,and construct data bank.The study results possess certain prac⁃tical application value.
communication training;data storage;data processing;system structure
E925.6
A
10.3969/j.issn.1673⁃3819.2016.06.021
1673⁃3819(2016)06⁃0100⁃05
2016⁃06⁃11
2016⁃07⁃30
国家社会科学基金项目(15GJ003⁃208)
王 睿(1982⁃),男,黑龙江巴彦人,博士,讲师,研究方向为作战指挥和军事通信。
姜 宁(1963⁃),男,教授,博士生导师。