基于大数据的军事科研数据资源服务产品体系建设
2019-08-08
军事科研数据资源是现代化作战和军事科研的血液,是支撑军委机关战略管理和军事科研创新的重要基础。面对日益庞大与复杂的数字资源环境、用户知识化的信息需求、信息技术的广泛发展及应用等新形势,军事科研数据资源建设工作正面临新的挑战与机遇。军事科研数据资源服务产品是军事科研数据资源建设的外在表现形式,是数据资源服务有形化的承载体,承载着数据资源搜集、加工处理、序化组织、大数据技术研发等建设的重要成果。因此,从产品服务对象、服务需求、服务目标等方面提出了对科研数据资源的搜集范围、加工处理和序化组织的精细程度等工作的要求,希望对军事科研数据资源的整体布局建设起到一定的辅助作用。
1 军事科研数据资源服务产品体系建设需求分析
军事科研数据资源体系的不断完备对产品体系建设提供了新思路。大数据时代,数据量的激增使数据来源、收集手段、使用技术和展现方式多样化。数据资源不再仅限于传统信息资源,来源于开放获取的数据、深网挖掘的数据、新媒体传播的数据,以及各种机构产生的实验、模型、计算、材料等专业数据,已然成为其中的重要组成部分。因此,必须立足大数据的视野和理念,深入开展军事科研数据资源服务产品体系建设。
军事大数据智能挖掘技术的发展对产品体系建设提供了新途径。近年来,大数据环境下的信息源发现、信息获取、信息抽取、关联挖掘等情报挖掘技术不断取得突破,数据感知、数据融合、知识发现、知识表示、信息价值评估等技术、模型和方法为热点发现、态势评估、预警预见、真伪识别等类型的分析产品提供了技术实现途径。因此,必须充分跟上技术前进的步伐,完善军事科研数据资源服务产品体系建设。
2 国外军事科研数据服务产品典型案例及特点
2.1 产品服务对象以面向科研决策和作战为主
2011年,美国国防部开展实施的“技术监视和地平线扫描(TW/HS)”项目,重点基于专利、大学学报、期刊进行挖掘,实现对研发初级阶段新技术的有效跟踪。该项目旨在与国防部及情报界协同工作,建立一种广泛的地平线扫描与技术预报能力,并实施技术净评估等方法,对技术及“反制这些技术的能力”所呈现的机遇、威胁进行分析判断,帮助美国了解其在全球科学技术领域的相对位置,确定新兴技术对美国国防部能力的潜在影响和未来的威胁环境。
2013年,美海军启动了“海军战术云参考实施”的大数据云生态系统平台建设,希望开发融合大数据、云计算和数据分析的平台系统,实现对多种分布式文件系统和作战系统的操作,提供相关作战环境及其数据的实时视图,为美海军舰船和海军特种作战部队提供支撑,提升大数据在作战中的运用能力和效果。2016年,美空军启动了“多域指挥控制”计划,致力于将数据用作武器,获取来自于地面、空中、太空传感器等多种途径的数据,并将其转变成可供作战指挥官使用的情报。美空军认为,指挥官需要来自空中、网络、太空等所有作战域发展情况的相关数据以合成作战态势图,从而做出决策并获得更好的态势感知。
2.2 产品数据来源主要基于开源情报和专有数据
开源情报(OSINT)包括公开获取资源、灰色文献、长格式社交媒体内容和短格式社交媒体内容等4种类型[1]。其中,公开获取资源是传统意义上的信息资源,主要来源于开放获取资源、期刊、报告等商业购买资源、内容聚合网站等[2];灰色文献是来自研究机构、政府部门、智库、学界等非公开出版和发行的资源;社交媒体内容是自2005年新媒体快速发展以来催生出的新型数据类型,主要包括博客、Facebook、Twitter、LinkedIn等平台信息,长、短格式主要按照文本内容的大小区分。2014年,美海军启动了“语义目标定位和全源融合框架”自动化系统项目,旨在充分利用社交媒体(如恐怖分子Facebook)、传感器等的回收数据,寻找、跟踪和定位“高价值个人”,提高针对关键人物的情报分析能力。
专有数据特指有特殊或专门用途的数据,如无人机视频数据等。2017年4月,美国国防部部署实施代号为“Maven”的计划,其短期任务是研发计算机视觉算法,帮助军事情报分析人员克服国防部采集的海量动态视频数据所带来的挑战,将国防部海量数据快速转换为可付诸于行动的情报及见解。
2.3 产品开发手段以大数据智能分析为主
2013年10月,美国防科学委员会(DSB)为避免受到技术突袭,充分利用“技术监视和地平线扫描(TW/HS)”项目的成果,密切监视国内外新兴技术进展趋势,并结合专家咨询法,邀请10余位专家听取80多个一线技术研究项目负责人的汇报,最终形成并发布了《支撑2030年优势的技术与创新》报告。
2.4 产品生产模式以协同为主
2008年,美国国防部发起“密涅瓦”计划,主要侧重于对美国国家安全政策具有战略意义的领域,广泛与大学、地方科研机构合作,充分利用其优势研究力量和深厚的科研基础数据积累,弥补美国军方在政策制定、作战行动过程中在相关领域的不足。此外,美军也希望借此计划提高国防部发展尖端研究和跨学科、跨机构研究的能力,摸索出一条将学术研究更有效用于政策咨询的新模式。截至2017年底,“密涅瓦”计划通过加强对监测对象社会文化和政治动态的发展推动对舆情信息的分析研判,已通过资助项目向美参谋长联席会议主席、防御政策决策者、战场战斗指挥决策者等提供了大量有价值的研究成果。
2.5 产品形式以数据平台、知识库和分析报告为主
2016年,美国国防信息系统局启动了“网络态势感知分析能力大数据平台”项目,旨在通过大数据平台(BDP)对国防部信息网(DoDIN)的海量结构化和非结构化数据进行收集、关联,同时提供分析和可视化处理工具,便于国防部网络分析人员及作战人员以一种全新的综合性视角审视DoDIN上的数据,对数据进行正确理解,从而帮助做出指挥与控制决策。
翻开菜谱更是一股文艺气儿扑面袭来,不仅每页都有老北京的各种历史介绍、地名典故、过年习俗,连每道菜的名字下方都配有不同的诗词歌赋,尽显文艺气息,突然想起那句:“你吃的不是饭,是文化”。
2017年,美媒报道了美军正在加快建设“F-35高科技机载威胁数据库”。该项目旨在融合地区、地形数据和敌友双方不同资产数据,建立机载数据库,帮助飞行员精确识别在全球不同高风险地区作战的敌机,快速做出决策以打断敌人的决策循环,合理预判并先行摧毁对手。
2014年,美国特种作战司令部发布“自动可视化定制分析报告”项目,通过采集互联网上符合作战需求的开源数据,进而进行数据挖掘、过滤并自动形成可视化整理,从而实现将某个特定作战区域的分析数据分发到作战人员,及时满足特种作战部队特定需求的目的。该项目可自动生成可视化分析报告。
3 军事科研数据资源服务产品体系设计
3.1 产品体系设计思路[3]
基于以上需求分析和国外军事科研数据资源服务产品特点分析,提出了我军军事科研数据资源服务产品体系设计思路:突破现有以科技文献为服务单元的专题服务模式,基于军事数据资源池,从用户需求、服务覆盖面的大小、内容加工颗粒度的精细程度等方面考虑,构建由泛在化共享服务和个性化定制化精细化服务组成的知识服务内容架构,形成由服务门户、技术平台、知识库、领域技术快报、分析评估报告、数据年鉴等多种类型的系列知识服务产品,开发完善网络服务、移动服务和嵌入式服务等多种知识服务模式,面向军事科研、军事管理和联合作战提供服务。
3.2 产品服务内容架构
3.2.1 泛在化共享服务
泛在化共享服务以通用化数据库产品为基础,以服务门户、服务平台产品为媒介,面向广大军队和国防工业科研用户开展的服务,主要包括军事科学信息服务门户、军事数据镜像服务平台、武器装备图片视频库等。
3.2.2 个性化定制化精细化服务
从服务对象对科研数据服务的不同需求入手,个性化定制化精细化服务分为3类。
一是面向军事科研的数据服务。其中,助推科研信息化的产品主要包括情报协同分析平台、科研资源共享平台、科研信息管理与服务平台等,支撑关键技术攻关的产品主要包括技术领域知识库、特定主题知识库等,开发技术扫描的产品主要包括国防科技发展动态跟踪平台、领域科技快报、机构透视、领域发展综合态势分析、军事科技年度发展概览等,开发如军事科技技术预警平台等技术预警的产品。
二是面向军事管理的数据服务。针对军事管理的数据服务主要是立足军队建设管理科学化、专业化、精细化需求,围绕体制机制完善、管理流程再造、资源配置优化、短板弱项发现等问题,开展数据建设和分析,支撑机关运行管理决策,具体分为支撑体制机制完善的产品、支撑管理流程再造的产品、支撑资源配置优化的产品、支撑短板弱项发现的产品等。
三是面向联合作战的数据服务。数据服务重点在辅助指挥协调与筹划、作战态势研判上下功夫,将数据服务融入信息化、智能化作战体系,推动实现战场感知和作战决策的智能化,主要分为辅助指挥协调与筹划的产品和辅助作战态势研判的产品。
3.3 产品服务模式
产品服务模式主要包括3种:通过网络以服务门户形式面向广大用户提供一站式服务;开发APP应用、微信公众号等移动服务模式,提高数据服务的便捷性的移动服务;开发镜像服务系统,将军事数据服务嵌入到科研、政工、后勤、作战、装备等业务环境中的嵌入式服务。
3.4 产品类型
军事科研数据资源服务产品类型除了包括分析报告、评估报告、年度发展报告等传统情报研究类型以外,基于大数据环境主要包括以下3种类型。
3.4.1 平台即服务/产品
平台不仅仅是网络平台,还承载着数据以及开展分析应用的工具、软件、模型等。因此,平台本身就是产品。
3.4.2 数据即服务/产品
精细加工及按照特定知识要素和知识结构构建的数据本身就是一种产品,可以直接提供给用户使用。
3.4.3 知识库即服务/产品
知识库是以军事大数据分析和军事数据集成组织需求为牵引,采用实体识别、知识抽取和知识构建技术,在文献、动态、网络百科、工具书等类型的海量军事数据中识别、抽取军事知识实体及相关属性,并按照知识谱系的建设思想,将不同类型的知识实体进行有序组织、分层叠加构建的以服务门户为外在表现形式的产品,如作战计划知识库、军事行动知识库、机构知识库等。
4 对军事科研数据资源服务产品开发建设的建议
4.1 采用“数据+大数据挖掘技术+工具方法+专家智慧”的产品开发方法
兰德公司是美国最重要的以军事为主的综合性战略研究结构之一,其产品(研究报告)开发方法被描述为“兰德人+兰德信息资料+广泛的关系网络+人机结合的分析方法=多用途政策研究机器”[4-5]。在专家智慧方面,兰德不仅注重专家也重视挖掘专家的智力资源,开发了兰德式理性程序、自动数据分析框架等方法体系。大数据时代,应充分应用大数据挖掘技术优势,有效契合定量分析工具方法和专家智慧,开发出有价值、有说服力的产品(图1)。
图1 产品开发方法
4.2 采用军民融合的产品生产模式
大数据时代,基于军事科研数据资源的服务产品生产模式在3个环节都可充分采取军民融合的模式。一是数据资源搜集获取环节开展信息资源融合。军地双方的数据资源各有特色,都有着不可替代的作用,军地双方必须发挥各自所长,形成军地双方数据资源的有机融合和共享。二是大数据技术研发环节开展“众包”模式的技术融合。军事数据多领域、多层次、多形式等特点对传统信息建设思维、模式和技术手段都提出了更高的要求,技术研发要以自身技术力量培育和能力建设为主,联合高校、技术公司、企业等外部力量,围绕特色问题开展军地双方的技术研发融合。三是分析研究环节开展“总体+大外围”的研究优势融合。建立各领域的外围专家团队,充分依托专家的领域优势和研究力量优势,开发出高质可信的产品。
4.3 逐步开展各类型专题特色知识库群开发
面向重点领域和重大任务需求,开展特色知识库群体系设计,开发知识库构建与服务平台及系列工具。广泛跟踪搜集国内外相关重点技术领域和重大任务的数据资源,对各领域相关机构、学协会、智库、实验室、大学、咨询公司的新闻动态、科技文献、多媒体、项目数据、百科等进行深度加工集成,以特色知识库群为载体,为专家和国防科研人员提供契合需求的知识汇聚服务。知识库群类型主要包括面向技术领域的知识库群[6]、面向特定主题的知识库群、军事法规政策知识库群、数据年鉴、军事科技战略思想知识库群、机构透视类知识库群等。
4.4 重点开展面向前沿创新的智慧产品开发
面向前沿创新领域需求,开展智慧产品体系设计,开辟基于海量数据、人机结合开展智慧服务的新模式。如基于国防科技发展动态跟踪平台,对前沿创新技术领域期刊、会议、机构等特定信息源进行持续跟踪和监测,开展关键内容抽取和辅助编译研究,开发技术扫描类智慧产品开发;基于智能分析平台和多渠道强关联的全球科技资源数据,形成多维分析的智慧产品,开发人才评估型、机构评估型、技术交流型、科研评估型和综合评估型产品,为精准引进、精准合作、交流管控等提供有效支撑。