APP下载

试验装备保障大数据管理体系研究

2018-03-21

中华医学图书情报杂志 2018年4期
关键词:装备数据库试验

, ,

装备试验作为武器装备全寿命周期过程中的重要环节,是将“实用、管用、好用”的武器装备提供部队、全面提升我军打赢信息化战争能力的关键保证。试验装备是用于实施和保障装备科研试验任务的设备、设备系统及技术器材的总称[1],试验装备保障是装备试验任务得以顺利完成的基础性工作。

随着高新技术在试验装备建设领域的广泛应用,装备性能和复杂程度不断提高,其保障数据范围也在不断延伸和扩展。具体来讲,试验装备保障数据除了装备基础属性数据以外,还覆盖了装备调配、装备维修、装备日常管理、人员保障、试验任务保障等相关业务领域,不仅历史数据量巨大,而且实时采集及产生的数据信息正以指数级的速度增长,体量巨大,种类多样,已经明显具备“大数据”的特性。现行的装备保障业务系统主要采用静态的、专用式的信息管理模式,无法满足新形势下装备保障对全程信息共享、全域资源重组和柔性管理等方面的迫切需求[2]。

如何适应大规模、成体系的复杂试验任务环境,高效收集、分析和处理海量试验装备保障信息,有效实现试验装备保障信息的数据采集、数据共享及综合利用,保持和增强试验任务保障的可变性、灵活性和主动性,提高装备试验保障能力水平,是管理机关和各级试验机构亟待解决的重要问题。

当前,大数据时代的到来颠覆了工业界、学术界对传统数据的认知,同时也引起了数据获取、存储、分析、挖掘以及可视化等技术的变革[3]。大数据具有较强的决策能力和洞察能力,能够对巨大的数据进行处理。利用大数据技术研究和解决军事决策与装备管理等应用领域的实际问题,已成为军事领域的一个重要研究方向。

本文围绕试验装备保障数据特点和数据建设情况,提出试验装备保障大数据管理体系的研究思路,从统一数据标准、规范采集方式、数据分析展现、总体架构设计等方面展开研究和分析,为提高试验装备保障数据管理水平和增强试验决策能力提供有效的解决途径和技术支撑。

1 试验装备保障数据及其建设情况

1.1 试验装备保障数据概述

试验装备保障数据是指围绕试验装备全寿命过程的,涵盖装备管理、装备维修、装备试验任务保障、退役报废等业务范围内的一切数据信息,主要分为3类:一是装备保障对象和装备保障力量等基础数据信息[4],包括试验机构单位编码及基本信息、试验装备编码及性能指标信息、试验装备保障人员基本信息等;二是装备日常管理业务数据,指装备实力采集、装备调配、技术状态监控、动用使用、事故故障、检查考评、使用保养、维修保障、退役报废等业务数据;三是装备试验任务保障数据,指为圆满完成装备试验任务,围绕所需的试验装备在试验任务保障中的装备调配、筹措、维修、改造、状态跟踪与故障处理等各项保障活动相关的数据信息。

从数据本身来讲,由于试验装备种类繁多、非标特装比例大、技术含量高且数量多,如果按逐号方式管理,仅一个装备就包括装备编码、所属类别、名称、型号、战技性能、生产厂家、单价、生产年份和批次等若干属性信息,且装备数量相当可观;从数据增量上来讲,在装备日常调配、动用、维修、任务保障过程中又会产生大量阶段性保障数据,形成宝贵的信息资源知识库;从数据类型上来讲,不仅包含已入库的文本、报表类结构化数据,图像、图形和视频等非结构化数据,还有未入库的纸质、光盘介质数据,其数据价值高且类型多样。

1.2 数据建设情况

近年来,各级部门结合自身工作需要,大力推进试验装备保障业务信息化建设和数据工程建设,软件系统应用、基础数据建设和信息保障环境建设取得初步成效,试验装备保障数据得到一定程度的积累和完善。然而,随着各级部门对数据使用要求的不断提高,在试验装备保障数据建设中也逐渐暴露了以下问题。

一是数据共享利用率不高。具体表现在试验机构获取试验装备保障信息不及时、不全面,大量数据往往存在于各自部门业务系统中,系统间数据互连互通需通过建立统一的数据接口标准来实现。

二是装备末端信息采集手段还需加强。由于各单位对试验装备的统管程度不同,大部分是依靠业务软件进行人工采集和简单处理,离真正实现自动化且高效的末端数据采集目标还有一定差距。针对大量复杂的试验装备,需要建立高效、快捷的数据采集提取手段,从而获取更为精确、实时的装备保障数据。

三是数据深入挖掘能力有待提升。当前试验装备保障数据的管理和使用仅能满足各级部门完成常规的业务管理和日常工作需要,但在装备全寿命管理、装备故障预测、装备维修经验总结以及试验任务保障情况分析等跨系统、跨业务方面的深层次挖掘能力仍需进一步加强。

2 大数据技术概述

大数据是指海量、多样化的数据资源,既包括传统结构化业务数据,也包括文本、图像、视频和音频等非结构化数据,需要采用新的采集、存储和处理技术实现数据统一接入和快速处理,建立新的分析机制开展跨业务、多类型的数据关联分析[5]。

大数据技术主要包括数据采集、数据存储、数据分析和数据可视化4个核心部分。

数据采集主要解决数据的获取问题。其数据来源广泛(如互联网数据和传感器数据),并发数高,流式数据速度快,数据类型繁杂。

数据存储主要解决海量数据的抽取、集成、保存问题。大数据存储具有实时性或近实时性特点,当一定时间内数据大体量增长时,需要借助于大型分布式数据库或存储集群平台完成高性能、高吞吐率、大容量的存储需求。

数据分析主要解决数据的使用和利用问题。其分析技术有数据挖掘、机器学习、统计分析等。

数据可视化主要解决数据的呈现形式问题。通过交互式视觉表现的方式可帮助用户探索和理解复杂的数据,基于并行算法设计高效处理和分析特定数据集的特性,最终在显示终端以友好、形象、易于理解的形式呈现出专业分析结果,为用户提供决策信息支持。

3 试验装备保障大数据管理体系构建方法

新形势下,试验装备保障数据建设必须适应体系化建设需求,从全局角度出发,通过顶层设计和统一规划,针对试验装备保障大数据特点,充分利用大数据技术,构建试验装备保障大数据管理体系,有效提高数据利用和数据决策水平。

3.1 统一数据标准规范

数据标准是数据规范使用的保证,是数据共享和有效利用的基石[6]。

参照试验装备相关业务管理规定、装备保障数据相关标准及军用基础类数据标准,建立适用于各级试验机构、覆盖各类试验装备的全局数据标准(包括元数据标准、基础数据标准、数据采集标准、数据存储标准、数据处理标准、共享服务标准等),依据标准规范数据库建设和数据接口,确保数据的标准化和准确性,有效支持试验装备保障的数据规范化采集、管理和使用,为各系统之间数据互联互通互操作提供基础支撑。

3.2 规范末端信息采集方式

基于大数据的试验装备保障数据管理体系成功与否取决于各级管理部门及试验机构是否能及时获得或输出必要的信息,并快速高效地处理和传递信息。现行试验装备保障业务系统中的数据链与末端设备不通达,信息采集主要靠手工输入,装备管理和技术保障手段落后,远远满足不了试验装备保障的发展需求。在末端信息采集方式上,广泛使用军事物联网技术,将无线射频识别系统、卫星定位系统、二维码识读设备等相关信息传感系统通过统一的协议、标准进行互通互联,利用军用网络、无线网络、卫星网等作为媒介实现对试验装备的身份识别、跟踪定位、信息采集和有效管理。

3.3 充分运用数据分析展现技术

装备保障数据分析应具备完整性、合理性、独立性、一致性和稳定性[7]。

通过对不同层级试验机构(部门)的试验装备战术技术指标信息、装备故障处理信息、装备维修履历信息、试验任务保障调用信息等进行关联性分析,找出数据的相关性,提取有价值的信息,并将其用人机交互的可视化方式以地图、图像、动画的形式进行直观展示,为决策者决策提供数据支持和参考。

数据分析的意义主要表现在:一是对试验装备保障活动进行预测判断和模拟分析;二是对试验装备保障数据信息进行跟踪,便于业务人员和决策人员及时掌握最新的数据变化,随时把握保障需求;三是通过大数据实时监测能力,帮助决策者及时了解装备保障活动的实施情况,为后续保障任务提供决策参考。

3.4 总体架构设计

综合以上要素,依据我军装备试验管理机关及试验机构的实际需求和当前数据建设现状,构建试验装备保障大数据管理体系。总体架构如图1所示。

3.4.1 数据采集

主要包括实时数据采集、联网业务系统的历史数据迁移、非联网业务系统信息导入、纸质文本/多媒体信息手工录入等4种数据采集方式。其中,实时数据采集主要指基于物联网技术的试验装备末端数据采集,即通过装备内置传感器、射频及二维码识别设备、装备自动测试设备、维修终端设备以及相关试验数据采集设备等对试验装备管理保障活动中的使用状态、性能指标、使用环境、检测情况、维修数据、部分试验数据等要素信息进行感知、识别,并通过无线传感器网络传输接入军事专用网,实现终端设备的信息传输和上下传递,提高数据采集效率和精确性。

3.4.2 数据源

通过多种数据采集方式获取的试验装备保障数据主要分为3类。

一是结构化数据,主要来自于基于关系型数据库的业务系统或按二维表结构进行逻辑表达的数据。

2.相关性分析。根据表8相关系数计算结果,股票报酬率与风险、资产负债率成负相关关系,风险与企业成长力、股权集中度成负相关关系,净资产收益率与资产负债率成负相关关系,公司规模与股权集中度成负相关关系,股权集中度与资产负债率成负相关关系,其余均成正相关关系。通过检验,这些变量之间不存在多重共线问题,可进行实证分析。

二是非结构化数据,如图片、音频、视频、报告、文档等形式的数据。

三是半结构化数据,如XML、HTML文件等。

3.4.3 大数据应用服务支撑环境

3.4.3.1 大数据存储

鉴于数据源数据结构复杂繁多的特点,通过数据预处理、数据清洗、数据转换和加载、分类编目等初始化手段,并采用多种数据存储技术集成方式进行存储。对非结构化数据可采用分布式文件系统(HDFS)进行存储,对结构松散无模式的半结构化数据可采用分布式非关系型数据库(NoSQL),对海量的结构化数据可采用传统关系型数据库系统或分布式并行数据库,对决策类数据存储采用数据仓库实现。

图1 试验装备保障大数据管理体系总体架构

入库后的数据可划分为元数据库、基础数据库、业务数据库、综合数据库。

其中,元数据库用于完成对数据存储的有效管理,基础数据库包括基础代码、基础信息、数据字典等基础信息,业务数据库包括与试验装备保障业务相关的业务类信息,综合数据库是基于以上数据库构建的满足决策支持和个性化需求的综合数据模型。

3.4.3.2 大数据处理

试验装备保障大数据的应用类型较多,需要根据不同的业务需求采用不同的数据处理技术,如流计算、批处理、图计算、内存计算等。流计算用于处理实时性要求高的数据分析处理;批处理可用于实现大规模离线数据处理;图计算用于获取海量数据之间的关联性;内存计算可与批处理、流处理、图计算等计算模式相结合,提供高性能的大数据分析处理能力,同时实现对资源的统一管理调度和计算控制接口。

3.4.3.3 数据服务

数据服务包括数据分析服务、数据交换服务、数据可视化服务和数据管理服务。通过对数据分类、建立关联,充分利用机器学习和数据挖掘算法实现对试验装备保障大数据的深入分析,提取数据的特征和属性,提升数据利用价值;通过数据名录划分、数据检索查询,以及规范数据接口格式,实现数据交换服务;通过可视化设计、可视化决策、图形图像处理等数据展现技术,将数据分析结果呈现给用户;通过提供有效的服务组件封装、注册和发布手段,实现数据资源产品化管理,为业务应用层提供规范化调用接口。

3.4.4 业务应用

针对不同业务场景和业务需求,实现业务管理和决策支持方面的数据应用,如试验装备保障业务管理、试验装备保障综合信息展现、试验装备保障能力分析、试验装备发展趋势预测、试验任务保障能力评估等,最终实现试验装备末端信息与业务应用管控的有效连接和有机融合。

4 结束语

大数据时代,数据蕴含着巨大的价值。管理和利用好试验装备,保障全寿命全周期的大数据信息,对提高试验装备保障能力和有力推进我军信息化进程具有重要的战略意义。

本文针对当前试验装备保障数据建设方面存在的问题,及其数据量巨大、来源分散、格式多样等特点,引入大数据技术概念及核心技术,提出了一种试验装备保障大数据管理体系的构建思路,并对其总体架构、功能及关键技术进行设计和分析,为研究新形势下试验装备保障体系建设提供有益的参考价值,提高试验装备保障决策的科学性,使试验装备保障更加智能化、精确化、快速化。

猜你喜欢

装备数据库试验
这些精锐与装备驰援泸定
港警新装备
防晒装备折起来
CS95
驭胜S330
数据库
C-NCAP 2016年第八号试验发布
试验
数据库
数据库