大数据时代的军事数据管理机制研究
2018-03-21,
,
数据管理是指人们对数据进行采集、组织、存储、加工、传播和利用等一系列活动的总和,已经历了人工管理、文件管理和数据库管理3个阶段。21世纪,新一轮科技革命和产业变革兴起,全球科技创新呈现出新的发展态势和特征,数据正以前所未有的速度不断增长和积累,世界已经进入网络化的大数据时代。数据主权已经成为继陆权、海权、空权、天权之后,大国博弈的新焦点[1]。军事数据是未来信息化战争的战略制高点,联合作战、军队建设管理和军事科研活动对军事数据建设与管理提出了新的要求。针对海量数据,不仅需要具备存储和查询能力,更需要从数据海洋中提取隐含的知识,为作战决策、军队管理和军事科研提供定量支撑。顺应大数据时代的历史潮流,构建完善的军事数据管理机制,确保其“质”与“量”,对提升基于信息系统的体系作战能力,提高指挥员认知能力和决策能力,重塑信息化作战体系和保障体系具有重要意义。
1 军事数据管理面临的困难与挑战
随着移动互联网、物联网、云计算等技术的迅猛发展和广泛应用,全球数据规模呈爆发式增长,世界已进入由数据主导的“大时代”[2]。大数据在为人们生活提供极大便利的同时,也给传统的数据管理方式带来了极大挑战,并对经济发展、社会治理、国家和军队管理产生了重大影响。近年来,我国大数据技术和相关产业的发展十分迅猛,百度、阿里巴巴、腾讯、网易和京东等互联网企业都建立了各自的大数据平台,在分布式计算、信息推荐、非结构化数据处理等技术领域已走在世界前列,在电子商务、互联网金融等方面的应用也处于领先地位,但在军事领域,我国与世界发达国家相比仍存在不小差距。美国国防部从2015年起计划每年投入约2.5亿美元,用于支撑军事发展和军事决策[3-4]。与民用领域大数据相比,军事大数据具有数据采集环境复杂、类型多样、关联度高、安全保密要求严、实时性对抗性强等特点,导致军事数据质量保证难、高效融合难、数据分发难、精准分析难、安全防护难,给军事数据管理带来了严峻挑战。尽管军委机关有关部门和各军兵种结合各自业务需求,先期开展了一些大数据项目论证和应用研究,并对本部门相关数据进行了一定程度的采集、存储和使用,数据规模有了很大程度的提高,在部分领域初步实现了数据的综合与集成。但总体上看,目前我国军事大数据发展还处于起步阶段,落后于民用行业,与新时代科技兴军要求和建立数据驱动型军队发展模式需求还不相适应。从全军层次、大数据角度对军事数据综合管理与使用情况进行审视,可以发现我军在军事数据管理机制方面还存在着不少问题,严重制约军事数据创新引擎和决策支撑作用的发挥。
1.1 数据采集机制不完善,难以及时获取准确、完整、规范的数据
与科技情报研究相似,大数据时代数据管理的首要工作是数据采集,且采集对象十分复杂[5]。由于相关法规制度不完善,我军在数据管理方面还不同程度地存在着重硬件轻软件,重功能轻数据等现象;数据采集没有严格的采集制度,对应的管理部门也不够明确,大量数据未能完全及时有效获取;还有一些数据处于各个有关部门以及大量有关人员的分别掌握之中,状态零碎分散[6],因部门或个人利益等原因难以有效归集;加之数据采集渠道有限、手段较为落后、数据审查机制相对缺失,不仅存在数据短缺、陈旧、零散等问题,而且普遍存在数据流失、低效、重复与失真等情况,直接影响着数据使用分析结果的可信度。
1.2 数据管理系统建设各自为政,尚未构建一体化的数据共享环境
军事数据管理系统建设顶层设计不足,基础条件普遍落后,网络通信、存储备份、服务器集群等能力还有较大差距,也缺乏一体化的数据管理与共享环境。一是“信息烟囱”现象还较为严重,重复建设多,已建成的数据管理系统中存储大量同类信息,缺乏通用元数据标准,数据不能统一描述,不同部门、不同系统间的数据难以实现协同建设、有效共享和互联融合;二是数据存储结构没有得到充分优化,数据整合度不够、冗余项较多,存在数据名称、格式、编码、量纲不统一的现象,严重制约数据的一体化综合应用;三是在数据安全、数据辨伪、数据抗干扰和数据保密等方面,还不同程度地存在很多技术问题;四是缺少专门的规范数据共享的法规制度,数据共享在行政管理上还缺乏系统性[7]。
1.3 数据管理基础薄弱,数据积累不够、技术储备不足
由于缺少有效的分析应用,我军对历史数据积累重视不够,数据遗失、舍弃、漏采等问题也比较突出。以往大量珍贵的历史数据多以纸质形式存放,数字化程度不高,遗失损坏现象时有发生;对传感器和网络获取的海量数据的潜在价值认识不足,大多没有长期保存;数据采集整体规划不够,先进技术手段缺乏,急需的大量数据存在严重缺口;尚未建立完善的军事大数据技术体系,对军事数据处理、融合、分析、可视化等关键技术的探索研究仍处于起步阶段,军事大数据分析方法和模型不够丰富,导致很多数据不可用、不会用、不够用、不管用[8]。
1.4 数据资源管理手段和方法落后,难以发挥数据的应有价值
信息时代数据管理要求运用数据工程原理,强化数据资源的开发与利用,充分发挥数据的综合效益。我军各类数据需求生成、信息审核和有效激励等方面,还缺少有效的方法手段,挖掘有价值信息困难;各部门力量充分协同、相互配合不够,不利于数据的有效积累和使用;有些部门的数据管理系统建设缺乏长远规划,最终成为面子工程或烂尾工程;有些数据管理系统自动化程度较低,难以满足快速决策需求;有些数据管理系统实用性较强但受限过多,影响了用户对数据的访问与使用,严重制约数据价值的挖掘和发挥。
2 军事数据管理机制建设的总体构想
管理机制是指在人类社会有规律的运动中,影响这种运动的各因素的结构、功能及其相互关系,以及这些因素产生影响、发挥功能的作用过程、作用原理及其运行方式[9]。在大数据时代,研究设计科学合理的军事数据管理机制,是保证军事领域大数据建设持续、高效开展的基础。军事数据管理机制建设中,针对军事数据管理面临的矛盾和问题,除了需要不断完善军事数据的采集、共享、维护机制外,还需要建立完善军事数据的需求生成机制、审查机制和激励机制。
军事数据管理的6项机制为军事数据运行管理与有效使用提供制度保障,它们相互作用、耦合关联,彼此构成了有机的制度体系。总体上看,它以数据需求生成机制为牵引、以数据共享服务机制为核心、以数据采集机制为基础、以数据审查机制为手段、以数据维护机制为保障、以数据激励机制为动力,从全寿命角度保障军事数据的生成、采集、使用与维护,确保军事数据的按需获取、高效移动、快速重组、灵活配置和精准服务。图1为军事大数据管理6项机制的关系示意图。
图1 大数据运行管理6项机制的关系
3 军事数据各项管理机制的初步设计
科学的管理机制是军事数据运行管理持续、高效开展的基本保证,需基于现有基础,设计一整套适应国情军情的军事数据管理机制,涵盖数据需求生成机制、数据采集机制、数据审查机制、数据共享机制、数据维护机制和数据激励机制,从全寿命周期的角度,对海量军事数据进行全面有效的实时化、专业化和精确化管理。
3.1 数据需求生成机制
由于数据采集部门对军事数据需求理解不深、不透、不全,数据需求方提出的要求未被采集部门充分理解和消化,导致数据与应用脱节,收集的数据难以被有效使用。为此,技术部门或军事信息系统建设部门与决策部门应就业务工作流程和系统信息流程开展深入沟通,结合军队战略转型、新质作战力量建设、国防科研、训练保障、作战指挥等深入开展需求分析,分析具体领域、实际业务中的数据应用,明确数据的需求生成方式,保证数据与数据、数据与系统、数据与应用之间的关联。而且,应明确军事大数据建设需求主管部门,创建权威的军事大数据需求生成体系,构建需求信息发布和整合机制,规范数据需求信息的样式,明确数据信息的要求等。由数据需求主管部门将数据需求信息传达到有关技术部门或军事信息系统建设部门,并通过各部门的有效沟通和相互配合,提高技术部门或军事信息系统建设部门对数据需求信息的理解,提升数据需求信息生成的精准度,同时也使需求主管部门了解当前的技术状态,避免提出超出实际或不合常规的数据需求。
数据需求生成模式可分为“自上而下”和“自下而上”两种。“自上而下”模式中,各部门根据各自的数据需求提出请求,经整合处理后通过需求发布机制和收集机制,指导不同资质、不同渠道的数据采集方和供应方提供相关数据;“自下而上”模式中,数据采集方和供应方尽量采集捕获各类数据,汇总后由决策部门根据各自需求进行分类管理和使用。“自上而下”模式提出的需求有很强的针对性和目的性,而“自下而上”模式则可能触发新需求,两种模式互为补充。数据需求生成机制如图2所示。
图2 两种数据需求生成机制
3.2 数据采集机制
数据是大数据建设和运行的核心,数据采集是数据的主要来源,数据采集机制的科学性、合理性直接决定数据的质量。从流程上看,数据采集一般分为数据采集准备(包含数据来源渠道勘定、数据资源确权、基础设施建设、资源投入准备等)、数据采集、数据汇总及检测、数据的确认与验收、数据的入库与使用等阶段(图3)。此外,为确保数据库中有丰富、准确、完备的数据信息,必须明确各类信息源之间的关系,确立不同类型数据采集与认证的责任单位或岗位,明确职责分工,落实各自的工作内容。
图3数据采集的一般流程
数据采集机制运行,除需要明确执行机构和数据采集类别,建设数据采集手段外,还需要进行数据甄别校验。一是要明确每个阶段的成果和技术状态,确定需要采集的基础表、数据字典,明确采集流程中的关键节点和其他注意事项;二是加强数据采集手段的建设,强化动态数据的实时收集,通过建立数据通报、发布制度,健全网络报告、自动分发等机制,提高信息采集的时效性;三是通过竞争机制,遵循准确、完整、时效性强等原则,择优选择数据信息的供应机构;四是明确数据采集与认证的责任单位,以及相关入库工作的责任方,明确任务分工,便于各方有效履行职责。
3.3 数据审查机制
数据审查机制一般指运用一定的方法、技术,采用特定的指标体系和评价标准,按照规定流程,通过定量、定性分析,对大数据的质量和价值做出客观、公正的综合判断,从而支撑相关决策工作的有效开展。由于大数据建设工作长期处于建用结合的状态,在应用过程中需要不断对数据信息进行采集、审核验证及修订,确保数据信息的可靠性、适用性、有效性和权威性。这不仅决定着数据应用的效果,同时也决定着相关决策工作的成效。因此,在数据采集机制的基础上,数据的审查机制尤为重要。
数据审查的体系框架如图4所示。其中,审查管理部门的主要职责包括制定科学的审查规范,内容包括目的和范围、审查指标体系、审查方法和审查机制等;组织审查部门开展审查工作,及时发现审查中出现的问题并予以解决,为组织管理层提供有关决策咨询服务,将审查结果向相关部门或单位公示,并根据反馈的建议改进审查体系或数据管理体系。
图4 数据信息审查体系框架
在数据审查机制中,审查部门是审查活动的主体,是审查活动的具体执行者,对审查过程和结果负责,可以由专业的第三方审查机构、专门的审查专家委员会、管理咨询机构等承担。审查机构需要根据审查规范确定具体的审查范围、审查对象、设计审查方案、选择审查方法,并组织审查项目小组或经过大量训练的人工智能系统人机协同开展严肃、公正的审查活动,进行数据分析,完成审查报告。审查机构应与审查委托方建立沟通机制,及时解决审查过程中出现的问题。审查规范是建立数据信息审查机制的基础,重点研究如何构建客观、合理、公正的指标体系,包括指标体系的构成要素(如数据覆盖率、来源权威性等)、各要素的权重等。在构建数据审查指标体系后,重点研究采取何种审查方式组织相关机构对数据的质量、价值进行评估,并生成评估模型,通过第三方审核的引入,加强审查的公正性和权威性。
3.4 数据共享机制
现阶段,我军已经初步确立了以数据共享库、共享池为核心的共享数据体系框架,不断促进数据的有效集成、高效流动和低成本使用[9]。同时,大数据的共享还需要将“按权共享”和“按需共享”相结合,合理设计共享目录,实现对海量数据的分级管理[10]。此外,还需要加强网络建设、云计算及数据共享等领域新技术、模型算法和工具的研究与应用,解决好数据控制、审计、分布使用的效率和安全问题,以及在恶劣或拒止环境下、系统受损或失效状况下的应用服务问题,强化瞬时动态调度与安全移动管理。为解决我军大数据建设工作中的“信息烟囱”现象,还需要研究数据标准统一存储和使用模式。
在数据共享机制设计中,需要处理好数据信息采集、数据加工、数据管理及共享过程中的各种关系,重点研究为保障数据信息共享的安全有效运作,需要制定哪些政策法规科学指导数据共享,如何通过机制建设加强数据共享的管理,包括数据标准的制定、数据管理的规程等(图5)。
图5 数据信息共享
3.5 数据激励机制
激励机制分为外部激励机制和内部激励机制,其目标都是促进和推动不同个人、不同部门间数据信息的采集、共享与交换。激励机制设计需要在保证个体成员自身利益的基础上,追求全局利益的最大化。通常情况下,很难保证个体与全局利益的完全一致,因此要设计合理、有效的激励机制,充分发挥激励机制激发行为及制约行为的作用。激励机制的运行模型如图6所示。
图6 激励机制运行模型
构建科学合理的激励机制,包括明确激励机制内容、激励主体和客体、激励目标、激励手段方式,以及激励所期望达到目标等。激励机制的设计原则包括针对不同群体采取多样化激励手段,以满足各个数据提供者合理需要为出发点,采用科学的激励范围、激励力度与频度,平衡激励中的奖励与惩罚,确保公平公正的激励评价等。
3.6 数据维护机制
大数据建设使数据的价值得到了最大程度的发挥,但也使数据中的重要信息暴露在无孔不入的网络面前。随着信息普及面和数据共享面的拓宽,数据的时效性大大缩短,需要不断调整并适时更新相关数据、确保数据安全等,这些都离不开数据维护机制的有效运行。数据维护机制如图7所示。
在数据信息安全方面,按照其管理服务的对象可以分为对外安全管理和对内安全管理两部分,包括对无意识行为和有意识破坏行为的管理、对不可抗力情况下的灾害管理,以及妥善应对的安全技术策略,如容灾备份制度、防火墙技术、数据加密技术、数据访问控制技术以及病毒防治技术等。此外,还需要建立防控主管机构,设置防控预案,采取特定的防控工作流程,定期定人实施排查,既约束内部人员自身的行为,也约束数据访问者和使用者的动作,确保系统和数据的安全可靠[11]。
图7数据信息维护运行机制
在数据更新方面,主要包括以下三方面内容。一是确定数据更新周期,要对不同数据的时效性进行分析归纳,确定数据更新的时间间隔和频率。二是明确数据更新顺序,准确分析数据之间的关联,解决先后顺序、关联情况和制约关系等。三是采用适用的数据更新模式,对数据量较大、结构复杂的数据更新,可以采取数据接口方式实现;对数据更新规模较小,可以采取在线编辑方式实现。
4 结束语
大数据时代的军事数据管理机制建设是一项复杂的系统工程。本文从军事数据全寿命管理视角,探讨了大数据时代军事数据管理机制建设的总体框架,提出了军事数据管理机制的设计思路和方法,为推进我军军事数据管理机制建设工作提供参考和借鉴。从目前情况看,我军还没有建立起军事大数据思维观念,军事大数据技术基础还相对薄弱,相关配套设施与资源还不够完善。要建立操作性强、运行顺畅、实用高效的军事大数据运行管理机制,还有很长的路要走。这不仅是一项艰巨的任务,也是该领域研究的主要努力方向之一。