语义网技术及其在军事领域应用研究
2015-12-20李家良宋文宾刘炳磊
李家良,宋文宾,刘炳磊
(1.海装天津局,北京100073;2.中国舰船研究院,北京100192)
0 引 言
当今社会,在网络技术和电子技术等新技术的发展影响下,人类每天产生大量数据,图灵奖获得者Jim Gray 提出了一个关于网络环境下数据量的定律:网络环境下每18 个月产生的数据量等于有史以来数据量之和[1]。如此海量的数据中蕴含着大量的知识和财富。
可是利用计算机进行简单的数据查询并不能有效地发掘知识,计算机如果能代替人对数据进行理解并在理解的基础上进行处理分析,将会给使用者带来极大便利。语义网技术正是为了解决这一问题。
1 语义网的技术体系
语义网技术通过将万维网中的数据进行数据加工,并引入约束和逻辑关系等,使得计算机可以形式化描述数据,在此基础上对数据进行理解和推理,从而实现人机的智能交互。数据加工的过程也就是数据表示和组织的过程,通常采用的方法是进行本体提取,在本体提取的基础上,对本体进行约束限制和逻辑关系推理等。在应用中,针对不同应用的需求,往往引入安全技术以保证交互环境的可信。
1.1 语义网技术体系结构
语义网技术体系结构涉及语义网技术的实现基础和语义网技术为上层应用的技术支撑。针对语义网技术的实现机制和其在应用中发挥的作用,Berners-Lee 于2000 年提出了语义网体系结构,这也就是为人熟知的语义网体系结构模型,如图1所示[3]。
图1 语义网体系结构Fig.1 Architecture of Semantic Web
语义网技术体系结构是实现语义网的技术体系,体系按照从最底层的编码层到高层应用逐层构建。每一层为上一层实现提供接口或技术支持。该体系结构共有7 层,自下而上其各层功能逐渐增强。第1 层是字符集层,是整个语义网的基础,负责资源的统一编码和标识。第2 层是标记语言层,该层负责从语法上表示数据的内容和结构,通过使用标准的语言将网络信息的表现形式、数据结构和内容分离。第3 层是资源描述框架层,该层主要是为元数据的描述提供标准的描述框架,对元数据的语义描述形成标准规范。第4 层是本体层,该层是在资源描述框架层的基础上定义的概念及其关系的抽象描述,用于描述应用领域的知识,描述各类资源及资源之间的关系,实现对词汇表的扩展。第5 层是逻辑层,负责提供公理和逻辑推理规则,用于对资源与资源之间的关系以及推理结果进行有效性验证。第6 层是证明层,该层提供语义网可靠性和可用性等方面的技术。第7 层是可信层,它基于证明层和数字签名等,确保语义网所提供服务的整体可信。
除了7 层结构,语义网体系结构中也引入了数字签名和文档等。数字签名主要为满足应用中对安全和可信的需求,结合从资源描述框架层到证明层的技术进行实现。体系结构中的文档和数据指的是为各层技术提供支持的标准文档、扩展文档、相关数据等,例如在使用资源描述框架对专业领域的资源进行描述时,往往需要用到该领域专业的资源描述文件和以往的数据等。
1.2 语义网的关键技术
从技术角度出发,语义网体系结构每层所使用的技术主要用于在不同层面实现对数据和数据关系的表示和组织,为上层的使用提供支持。实现语义网的关键是要解决数据表示、数据和数据之间关系描述、机器理解以及安全保证等。作为通用标准,语义网体系结构采用广泛使用的标准技术作为每层的实现技术。其关键技术主要是XML(S)、RDF(S)和本体技术等。
1.2.1 XML 和XML Schema
XML 技术基于标签实现,与HTML 类似,但是XML 采用更加丰富的标签描述数据的每一成分,并借助XML 嵌套结构定义各成分之间的关系。XML还将显示与内容区分开来,这使得XML 不仅能够被计算机理解,而且同样的内容可以采用不同的风格显示给用户[4]。
XML Schema 是对XML 结构的扩展,它用于可替代文档类型定义和对可扩展标记语言文档的结构进行描述,是对XML 中组件的扩展,增强了XML的描述能力。
XML 和XML Schema 是语义网的技术基础。用来对数据进行词汇级别描述。它们的实现是基于统一编码规则和统一资源定位符(URI)。
1.2.2 RDF 和RDF Schema
RDF 是现在广泛流行的资源描述框架,一般采用三元组(<资源,属性,值>)的形式对本体中的实体进行描述。RDF 是建立本体、执行逻辑推理和描述Web 服务以及其他语义网行为的基础。RDF被设计为提供一种描述信息的通用方法,所描述的内容是以被计算机读取和理解。
基于RDF 的扩展RDFS (RDF Schema)是对RDF 数据模型中所使用的词汇的扩展。RDF 是允许用户使用自己的词汇描述资源的通用语言,用户使用RDFS 定义专业领域的语义[5]。
RDF 是领域无关的,采用RDFS 对其词汇扩展可以表示专业领域的资源,这种描述技术对所描述资源的约束少,这扩展了RDF 的使用范围。但是在本体知识层面,存在一定的局限性,例如属性基数约束困难,一个人有一个父亲和一个母亲,一门课至少由一个教授讲授等[6]。为实现对本体更全面地描述,语义网体系结构引入本体技术。
1.2.3 本体技术
本体由实体描述集、实体属性集、实体关系集、函数、限制、规则和公理等组成。本体目的是数据概念化、关系明确化、描述形式化和结果可共享。
本体提供语义交换的桥梁,能够在不同知识之间达成有关术语概念的共识,为概念共享和统一理解提供支持,是构建语义网的关键。本体层在体系结构中更接近上层应用,它为逻辑层直接提供支持,为进一步的推理提供子集。
2 在军事领域应用
2.1 军事信息系统中的语义网技术
语义网技术在军事领域的应用主要在资源描述、数据融合、信息共享等方面,重点应用于军事信息基础设施中网络化信息服务设施。网络化信息服务设施是支持信息按需共享和系统柔性重组,实现军事信息系统由以平台为中心系向网络为中心转变,提供“网络中心、面向服务、按需分发、柔性重组”等支持能力的核心基础设施[7]。语义网技术的应用,从信息表示,资源描述、理解和使用,服务组合、可信等方面有效提升了网络化信息服务设施能力,如图2 所示。
图2 语义网技术在信息服务设施中作用Fig.2 Semantic Web in information infrastructure
随着应用的不断深入和相关技术的发展,语义网技术将在智能辅助决策、预警侦察等方面发挥更大作用。
2.2 应用
2.2.1 军事领域“XML 数据战略”
当今军事领域中,随着各种传感器和雷达等信息获取设备的发展和网络中大量数据的发布,军事活动中所需要处理的数据量暴增。快速分析数据并从中提取重要信息的能力对夺取信息优势来说极其重要。
XML 数据战略是美军提出的信息化战争的数据战略的一部分。它的涵义是指导信息化战争在军事信息网格——新一代军事信息网络环境下实现数据共享的计划和策略。美军在信息化战争《联合构想2020》中指出,只有信息被决策者转化为相关知识乃至智慧,并及时正确地做出合理决策,才能真正夺取信息优势,赢得联合作战胜利。实现知识的可理解性及计算机自动智能化推理是知识智能化共享的关键[8]。
XML 数据战略的目标是实现数据的共享,作为“获取—共享—协作”信息链中的关键一步,采用XML 作为统一的标准进行数据标识,不仅能够为获取的数据提供统一形式的表示和组织,而且在信息资源的整合和管控中起到重要作用。语义网技术在军事领域中的应用为解决复杂战场环境中资源的管控、资源按需重组和网络信息安全等提供途径。
2.2.2 战场环境中增强的态势感知
AKTiveSA 工程在模拟国际人道主义援助方案中利用语义网技术支持信息融合和增强态势察觉。语义网技术为收获来自大量的、不同的信息源的信息提供新的机会,并能更好地支持复杂的知识融合。对越来越多的知识资源来说,通过综合考虑资源传播、环境情报等,以及采用语义网技术,能够实现态势察觉,即:在一定空间和时间的环境中对元素的察觉,对其意义的理解和在近期对其状态的投影。目前,要过滤并聚集大量的资源以找到最有关联性的信息较为困难。研究人员通过分析语义网初始和发展趋势,面向解决信息超载问题,研究为信息过滤和分类提供一个更具表达性的、结合上下文的方法。
3 发展和对军事领域影响
3.1 技术发展方向
语义网技术凭借互联网浪潮带来的数据处理需求快速发展,正应用到电子商务、电子政府、医疗、语音识别等多个领域,技术的发展日新月异[9]。
语义网技术发展至今,主要的几个研究方向是:关联数据[10]、本体抽取、查询语言、推理、纵向应用等[11]。
网络中数据量的膨胀和数据的松散组织关系使得数据之间关系变得更加复杂。关联数据技术借助语义网对数据之间关系进行发掘。未来,在电子商务领域、教育、军事情报等领域,必将成为一种关键技术,发挥重要作用;本体的抽取能扩展数据所表示的意义,使得数据蕴含的意义更加丰富,随着语义网技术应用范围变得更加广泛,领域内智能本体发现、领域间本体描述等技术将会成为关键;如果将采用语义网技术组织的所有数据看作是一个大型的数据集合,对这些数据的查询必不可少,查询语言将至关重要,实现快速、便捷、高效的查询仍然是智能检索等领域的关键技术;语义网技术通过制定规则,按照规则推理获得数据,在不同系统和语言之间通过规则的转化,实现推理过程;随着语义网技术的发展不断深入,不同领域之间、不同应用之间、不同数据之间如何实现语义网技术才能够屏蔽底层技术、内容等方面的不同,是纵向应用技术要面对的问题。
3.2 对军事领域的影响
科技是第一生产力,军事领域中,科技同样发挥极其重要的作用。伴随科技的发展,军事作战活动的样式、空间、时间等都发生了深刻变化,信息战成为战争最重要组成部分。信息战不仅是体系与体系的对抗,系统对系统的攻防,更是信息处理能力的较量。
以海战场为例,近年来我国海军的技术和实力得到了长足的发展,海战场中网络、传感器等共性信息基础设施等得到长足发展,数据从匮乏到丰富。但是新旧系统兼容性、技术体制不统一、缺乏总体设计等矛盾依然突出,海战场作战的元素多样性和环境多变性等决定了海战场作战中信息的多样化和处理的复杂化,数据处理能力的不足导致无法形成信息优势,严重制约了我国海军体系化协同作战的能力。
语义网技术起源于互联网,推动了网络中资源的描述和表示方式,并由此衍生出的数据挖掘、推理等都成为知识产生的重要途径。语义网技术在其他领域的应用证明了其进行可用性,为在军事领域中的应用奠定了基础,在作战资源描述等方面的应用为军事领域中资源标识提供了一种手段,伴随语义网技术的发展和在军事领域应用的深入,其必将成为推动电子信息战到知识信息战转变的关键技术。
4 结 语
语义网技术是伴随大数据时代人们对于数据内容处理能力的需求而提出的一项技术,它的使用为计算机理解数据以及智能发现和处理数据提供支持。语义网技术的发展必然会带来计算机对数据处理能力的提升,创造人与计算机交互的新局面。随着语义网技术的发展和在军事领域的应用,逐渐形成以数据为基础,以信息为主体,以知识为能力的信息时代军事战争发展的一个新方向。
[1]曹强,黄建忠,万继光,等.海量网络存储系统原理与设计[M].武汉:华中科技大学出版社,2014.
[2]W3C.Linked Open Data[EB/OL].[2014 - 6 - 20].http://www.w3c.it/events/2014/lod2014/.
[3]Tim Berners-Lee.Semantic Web - XML2000 [EB/OL].[2014 -6 -21].http://www.w3.org/2000/Talks/1206-xml2k-tbl/slide10 -0.html.
[4]M.Murata.XML Media Types,RFC3023,Jan,2001.http://tools.ietf.org/pdf/rfc3023.pdf.
[5]RDF Working Group.RDF Schema 1.1[S].W3C,2014.
[6]Grigoris Antonios,Frankvan Harmelen:A Sematic Web Primer (Cooperative Information Systems ) [M].Cambridge:The MIT Press.2008.
[7]蓝羽石,丁峰,王珩.信息时代的军事信息基础设施[M].北京:军事科学出版社,2011:43 -65.
[8]段荣婷.国际军事领域信息化条件下联合作战的战略创新——“XML 数据战略”的体系结构与应用研究[J].国防科技,2009,30(6):85 -90.DUAN Rong-ting.The innovative development of joint operation strategy under the condition of informatization in the international military domain:study on the architecture and application of XML data strategy[J].National Defense Science & Technology,2009,30(6):85 -90.
[9]周静怡,黄国彬.2007 -2008 年国外语义网研究与应用进展[J].图书馆建设,2009(1):19 -23.ZHOU Jing-yi,HUANG Guo-bin.Review of the theory and application of semantic web abroad from 2007 to 2008[J].Library Development,2009(1):19 -23.
[10]Archer P.LOD-2014[R/OL].[2014 -6 -20].http://www.w3.org/2014/Talks/0220_phila_lod2014/#(1).
[11]W3C.Semantic Web[S/OL].[2014 -6 -20].http://www.w3.org/standards/semanticweb/.