作战指挥教材知识图谱构建研究
2024-12-12张京丽马勇
关键词:作战指挥;教材;知识图谱
0 引言
教材作为人类知识的主要载体,其内容和形式直接影响能力培养、教学效果和学习效率。高质量教材体系的建设是一个全面而复杂的过程,涉及多个方面的内容和目标。教材体系可按教育阶段、内容形式和学科体系等方式进行分类,系统化、规范化的一套教材及其管理机制对学科专业建设具有重要影响。知识图谱(Knowledge Graph) 作为知识组织和知识表示的新技术,已在多个领域显现出强大的专业知识信息整合能力和智能检索能力。知识图谱在教育领域的研究由来已久,研究范围包括基于知识图谱的新型教材建设[1]、学科核心素养发展导向的教育领域知识图谱构建[2]、基于知识图谱的教育数字化转型,以及基于知识图谱的增强型混合式学习的教学实践与思考[3]等。面向不同教育层次的知识图谱是实现个性化授导的基础,也是教育人工智能领域需要优先开展的基础性工作[4]。
本文主要从横向和纵向两个维度考虑作战指挥教材体系的构建。横向维度关注单本教材的建设,纵向维度则涉及教材对应课程的学科专业体系。通过梳理教材建设与专业课程教材之间的逻辑关系,构建军队院校作战指挥教材的知识图谱,探索基于知识图谱的教材建设管理、教材体系研究和智能化学习辅助,为作战指挥教材的发展提供新的视角和解决方案。
1 作战指挥教材分析
作战指挥是指挥员及其指挥机关对所属部队实施作战的过程。作战指挥教材是指面向教育教学和军事学科发展需求,用于支撑教学大纲中明确的“作战指挥”课程板块教学的教材。这些教材遵循人才培养和作战指挥能力生成的规律,突出学科知识体系和作战基本理论,重点阐述各层级、各领域作战指挥的基本内容、程序和方法,体现院校教育的系统性、完整性和基础性,为打牢各级指挥员的作战指挥基本功提供有力支撑。
作战指挥教材可以从多个角度进行分类。从地位和作用角度分为核心教材、基本教材和拓展教材;从教育阶段的角度分为本科阶段教材、研究生阶段教材、初级培训阶段教材等;从内容的角度分为理论教材和实践教材;从学科分类的角度分为战略指挥教材、战役指挥教材、战术教材和保障教材。
教材体系是指用统一的观点来处理整个教学内容,因此可按照教育和培训阶段构建教材架构,包括专科高等教育、本科高等教育、研究生教育等。各教育和培训阶段可选取指挥相关专业,并继续选取用于支撑“作战指挥”课程模块教学的教材,战略、联合指挥、战术和保障类教材全面覆盖,从而构成相对完整的作战指挥教材体系。
在教材体系的梳理中,需要考虑两个维度。一是横向,即单本教材建设周期的维度,从申报、审批、编写、审定到教材使用、评估反馈和更新的整个过程形成的体系;二是纵向,即从教材对应课程的学科专业维度,形成教材知识点对学科知识点的涵盖和衔接等体系。
1.1 教材建设周期维度
作战指挥教材的建设生命周期包括教材申报、教材编写、教材审定、教材使用、教材评价反馈和教材更新等环节,如图1所示。
教材申报:是教材使用单位根据教学大纲、人才培养方案和课程教学计划等,明确教材适用对象、适用阶段及教学目标,深入调研分析学员需求、教育政策及学科发展趋势等因素,并向上级教材管理单位提出教材建设申请。
教材编写:包括教材编写计划的制定、教材大纲的编写、内容的撰写、自审和修订,是教材建设周期的核心阶段。应由教学经验丰富且具备深厚学术背景的专家担任主编,组建编写团队,根据编写依据进行撰写。编写过程需经历多次修改和完善。
教材审定:是在教材编写完成后,由本学科专业的专家和教材建设专家进行综合审定,严格按照编写标准和程序,以确保教材质量。
教材使用:是在审定通过后,投入实际教学中。新投入教学中的教材必须经过2到3轮教学实践检验,才能趋于稳定。
评价反馈:是在教材使用过程中,通过收集和分析教员及学员对教材的使用感受、问题和质量等方面的反馈信息,建立评价指标,对教材内容和质量进行监督和评估。通过评估现有教材的结构、逻辑性和可读性,确保教材内容的系统性和连贯性,并监控教材使用情况。一般教材评价指标包括教材内容结构、适用性、知识的全面性、准确性及深度、是否符合心理发展规律、学员能否通过教材掌握基本理论和技能、以及教材的呈现和配套资源等。
教材更新:是在评价反馈机制的基础上,针对使用过程中收集的问题和建议,对教学内容的逻辑性、实用性和实时性等方面进行持续的改进、修订和更新。
1.2 学科专业维度
不同教材内容之间的内在联系和顺序安排,确保了教学内容的连贯性、系统性和递进性,为学科专业和课程的培养目标提供支撑,有助于学员逐步构建知识体系。具体体现在以下几个方面:
1) 层次性。教材知识点按照由浅入深的层次进行组织,例如,先讲解基础理论,再深入高级理论;先教授简单技能,再进行技能进阶。此外,不同级别的教材也存在层次关系,以适应不同阶段能力培训目标的需求。
2) 顺序性。教材的顺序性体现在教材内容的安排上,按照逻辑顺序进行组织,并且先修教材为后续教材提供基础知识。
3) 关联性。不同教材之间可能存在内容交叉和联系。理顺教材间的关联性可以帮助学员理解知识点之间的内在联系,促进综合思维和能力的发展。
4) 递进性。教材内容的设计应体现知识和技能的递进发展,促进学员在原有基础上的拓展和深化,逐步建立知识体系结构,形成系统化的认知。
5) 互补性。教材之间可能存在互补关系,例如,理论教材与实践教材的结合,或不同视角和方法的教材相互补充,以提升学员对同一问题的理解深度和广度。
军队院校作战指挥教材涉及作战指挥相关专业,包括战术、指挥和装备等多类课程。从教育阶段的角度对作战指挥相关专业进行体系梳理,各教育阶段再按照专业进行细分,各专业再按课程模块进行再细分,直到具体课程使用的具体教材。
2 作战指挥教材知识图谱介绍
2.1 教材知识图谱
知识图谱的概念最早由Google于2012年提出,主要用于完善搜索引擎。它是一种基于图的数据结构,由节点(Point) 和边(Edge) 组成[5]。每个节点表示一个“实体”,而每条边则表示实体与实体之间的“关系”。知识图谱本质上是一种语义网络,使用符号形式结构化地描述物理世界中的概念及其相互关系,如图2 所示。
知识图谱的基本元素包括实体(Entity) 、关系(Re⁃lation) 和属性(Attribute) 。实体之间通过关系相互联结,形成复杂的网络结构。三元组是构建知识图谱的核心,通常表示为<实体,关系,实体>或<实体,属性,属性值>的形式。通过三元组的组合和推导,可以建立实体之间的关系和属性,从而构建出知识图谱的结构。其中,实体和属性值构成节点,关系和属性构成边。关系和属性之间没有明显的界限,根据应用场景和分析算法,两者可以相互转换。形式化描述为:知识图谱G由模式图Gs、数据图Gd以及两者之间的关系R组成。
其中,Ns表示类(节点)的集合,Es表示属性(边)的集合,例如rdfs:subClassOf、rdfs:equivalentClass;Nd表示实例(实体)和字符串(属性值)节点的集合,Ed表示边的集合。Ns对应知识图谱中的概念,Nd对应知识图谱中的实体,Ed对应知识图谱中的关系,连接两个节点表示一条三元组事实,例如。
知识图谱一般分为通用知识图谱和领域知识图谱。通用知识图谱是一个通用知识的结构化知识库,包含了大量的事实性知识、概念性知识和词汇性知识,覆盖面广,适用于多种领域和应用场景。领域知识图谱,也称为行业知识图谱或垂直知识图谱[6],是特定领域的知识库,例如金融知识图谱、医疗知识图谱、教育知识图谱等。其构建需要基于领域数据,具备领域特征和严格的数据模式,必须对该领域知识的深度和准确性有充分的理解。因此,领域知识图谱通常具有更专业的知识结构和更详细的领域细节。
教材知识图谱通过结构化的知识表示和智能检索技术,极大地提升了教材的可管理性和教学的个性化水平,为教育领域的数字化转型提供了有力支持。教材知识图谱是教育行业的领域知识图谱,利用知识图谱技术重构和展示教材体系的工具。它将教材建设内容、学科专业、课程教材及教材知识点等视为构建知识图谱的实体,将知识点之间的包含关系、课程教材间的衔接关系及教材建设流程视为知识图谱的关系。教材、知识点及其关系被视为三元组,通过图形化方式组织教材体系,最终形成语义网。教材知识图谱不仅能够提高教学效率和质量,还提供个性化学习体验,支持智能教育模式,优化教材内容,建设新型教材,并促进教育资源的共享,从而推动教学领域的数字化转型。例如,许斌[7]提出的基础教育知识图谱在智慧教育中的应用之一为知识链接,可以通过教材知识图谱将某一知识点链接到各类教材中,查看不同层次和类型教材中的相关关系,从而促进学员完善自身的知识体系。
2.2 作战指挥教材知识图谱应用
作战指挥教材知识图谱为军事教育和训练提供了创新的支持工具[8],特别是在提高教学效果、促进知识理解和应用等方面。应用模式不仅需要紧密结合作战指挥的实际需求,还要充分考虑教学过程中的认知规律。作战指挥类教材知识图谱主要应用在两个方面,面向教学工作和面向教学管理工作。如图3所示。
2.2.1 面向教学工作
针对作战指挥教材的复杂性,构建结构化、可视化的知识体系能够帮助学员更好地理解和掌握作战指挥知识,并在脑海中系统形成作战指挥的整体结构。通过利用作战指挥知识图谱中的脉络体系,并根据学员的知识背景、学习进度和兴趣提供定制化的学习路径,引导学员逐步深入学习,实现从理论到实践的有效转化。
2.2.2 面向教学管理工作
在教学管理层面,知识图谱可以实现教材内容的高效管理和应用,提升教学内容的组织性和系统性,同时促进教学资源的共享和再利用。具体措施包括:
1) 知识点分类。对作战指挥教材内容进行细致的分类,例如战术原理、指挥流程、案例分析、装备保障等,从而形成一个清晰的分类体系。
2) 教材内容标准化。对每个分类下的知识点进行标准化处理,包括统一术语、概念解释和知识点结构,确保知识内容的一致性和准确性。
3) 教材体系分析。对现有的作战指挥教材体系进行深入分析,以确保教材内容的全面性和系统性,识别可能存在的知识空白或重复,从而为教材的优化和更新提供科学依据。
4) 教材体系合理性分析。在教学管理工作中,确保教材体系在内容、结构和教学目标方面的合理性,以为学员提供高效、系统的学习体验。
3 作战指挥教材知识图谱构建
作战指挥教材知识图谱的构建过程主要分为三个部分:知识建模、知识抽取和知识融合。
3.1 知识建模
在作战指挥教材知识图谱构建过程中[5],主要包含以下步骤:
首先,构建作战指挥教材知识图谱的模式层,通过结合专家知识,采用自上而下的方法构建教材本体,并定义概念类及其相互之间的关系。
其次,进行知识抽取工作,从教材中提取作战指挥相关的知识三元组,并将其存储在图数据库中。
最后,开展知识融合工作,并实现可视化展示,从而构建出科学完整的作战指挥教材知识图谱。
1) 模式层。知识图谱的概念模型,对数据层进行规范和约束,可以采用本体作为知识图谱的模式层。
2) 数据层。是本体的实例,知识以(实体1,关系,实体2) 或(实体3,属性,属性值)的三元组形式存储。
知识建模即为构建知识图谱的模式层,如图4所示。通过这种结构,可以有效地管理和利用作战指挥教材的知识,提升教学质量和管理效率。
知识建模可以采用自顶向下、自底向上或两者相结合的方式[10]。由于领域知识通常难以获得、样本数量有限且要求精度高,通常采取自顶向下的构建方式,由领域专家结合领域知识的特点进行知识建模。自顶向下构建知识图谱的过程从顶层概念开始,逐步细化概念和关系,形成数据层次结构。首先,确定顶层概念。领域专家根据专业知识和应用场景设计领域的顶层概念和分类;然后细化概念和关系。确定顶层概念之后,逐步细化这些概念及其之间的关系,需确保概念和关系的准确性与全面性;最后,通过知识图谱构建人员与专家进行讨论和验证,不断完善和调整概念与关系的定义。通过领域专家的协作,构建出高质量的本体模型,为后续的知识抽取和知识推理等任务奠定基础。作战指挥教材的知识建模过程可分为以下三步。
第一步,以作战指挥教材建设需求为牵引,结合作战指挥教材知识图谱的应用场景,从教材体系的建设周期和学科专业体系的横纵两个维度进行考虑,以确定作战指挥教材的知识范围。教材建设周期体系知识包括教材的申报、编写、审定、选用、评价和更新等;学科专业体系知识则包括专业课程对应关系、教学大纲、人才培养方法以及教材知识点等。
第二步,进行作战指挥教材本体建模[11]。结合作战指挥教材知识图谱在作战指挥教材建设管理和知识体系梳理中的主要应用场景,选取、抽象并凝练作战指挥学科专业、课程、教材内容及教材建设周期中的主要概念,构建教材建设生命周期、专业课程体系和教材知识点体系三类概念本体,其本体结构如图5 所示。
第三步,进行作战指挥教材关系建模。教材建设周期概念之间的关系大部分可定义为属性,包括申报时间、审定时间、使用时间、适用对象、主编、审定专家、教材类型等等。教材内部及教材之间的关系包括两类,一般关系和领域关系。其中领域关系指教材领域特有的关系,如依赖关系、支撑关系等[12]。一般关系中,“包含”关系即层级关系,是概念与其他概念或实例间的上下级关系,比如知识点包含更细的知识点;“顺序”关系是知识点之间、教材之间前后顺序关系,可参考章节目录和课题体系。军队院校作战指挥教材知识图谱关系建模如表1所示。
3.2 知识抽取
知识抽取包括实体抽取、关系抽取和属性抽取[13]。实体抽取,又称为命名实体识别(NER) ,即识别并抽取原始文本中的概念和实体。关系抽取和属性抽取是从原始文本中抽取主谓宾三元组。目前,实体抽取主要依赖于基于机器学习和深度学习的条件随机场、LSTM-CRF、双层BiLSTM等算法[14]。关系抽取主要采用卷积神经网络(CNN) 、循环神经网络(RNN) 及MUSA-BiLSTM-CRF[15]等方法。传统的实体关系抽取方法属于管道抽取,即先进行实体抽取,再进行关系抽取,这种方式容易导致抽取误差的累积。为了克服这些缺点,研究人员提出了联合抽取方法,即同时进行实体和关系的抽取,相关算法包括基于自注意力的BiLSTM[16]和ALBERT-BiLSTM-CRF[17]。
对于教材知识图谱,原始文本数据可以分为三类:第一类是与教材建设相关的申报书、审批意见、教材编写指南、教材建设文件、使用情况说明和监测反馈表等;第二类是与学科课程相关的军队院校专业分类、教学大纲、人才培养方案及课程教学计划等;第三类是与教材内容相关的章节目录、一级标题、二级标题及其包含的知识点等。其中,大部分数据相对容易转化为结构化和半结构化数据,而小部分则为非结构化数据。针对作战指挥教材的数据类型,采取不同的抽取方法:对结构化的专业课程分类数据,采用D2R[18]方法直接导入图数据库;对教材章节目录等数据,首先利用规则抽取方法生成半结构化数据,再利用包装器导入图数据库;而对于教材编写指南等非结构化数据,由于军事领域缺乏开放数据源且无大量训练集,在领域实体数量有限的情况下,采用基于词典和规则的抽取方法[19]来进行实体、属性和关系的提取。
基于词典和规则的抽取方法包括建立所有实体的实体词典、属性词典和关系抽取规则。通过利用《军语》、“ 作战指挥术语清单”等文献,构建作战指挥教材的实体词典和属性词典。例如,教材实体“装甲步兵班战术教材”可建立“主编”和“适用对象”等属性,而知识点实体“班战术基础动作”可以建立“出现时间”和“对应能力”等属性。随后,将词典导入分词工具进行分词,最后利用抽取规则进行知识抽取。例如,规则模板为“实体+属性”,抽取的实例为“装甲步兵班战术教材的主编是张三”,提取的三元组为(装甲步兵班战术教材,主编,张三)。
3.3 知识融合
各院校的作战指挥教材在术语规范和缩略称谓上略有不同,这导致同一实体可能存在多个不同的称谓。因此,知识融合是一个必不可少的过程。作战指挥教材的知识融合是指在相同框架下进行不同来源教材的关系数据理解、冲突数据消解和冗余数据合并等,包括实体消歧和知识合并等[20]。作战指挥教材教材知识整合如图6所示。
实体消歧旨在建立不同来源教材实体之间的等价关系,解决命名实体指称项的歧义问题,并通过多种方法确保在不同上下文中能准确识别真正指代的实体[21]。这一过程对于提高信息检索和知识管理的准确性至关重要。例如,“教材审核”和“教材审定”都可指向“教材审定”,“装甲步兵”和“装步”都指向“装甲步兵”。实体消歧的方法主要包括基于规则的实体消歧、基于聚类的实体消歧、基于实体链接的实体消歧,以及结合词向量和图模型的方法等。
基于规则的实体消歧,通过构建实体映射库将不同的表述映射为同一实体;基于聚类的实体消歧则通过聚类算法对实体进行分类,解决同一个词在不同上下文中可能指代不同实体的问题;基于实体链接的实体消歧是通过将命名实体指称项链接到知识库中的特定实体来消除歧义;结合词向量和图模型的实体消歧方法则通过提取实体指称项背景文本的关键词及候选实体文本的关键词,利用训练好的模型对这些关键词进行交叉相似度计算,从而实现特定领域内实体的准确消歧[22]。
3.4 作战指挥教材知识图谱构建结果
现阶段,图数据库通过节点、边和属性的图形结构来表示和存储数据,并采用专门的图查询语言,如Cypher和Gremlin,进行数据查询。由于其更适合表达复杂的关系查询和快速处理多层关系等特点,图数据库已成为知识图谱存储的主流方式。项目组开发了知识图谱构建平台,以图数据库Neo4j存储教材知识,封装结构化、半结构化和非结构化数据的抽取方法。通过图形化界面构建作战指挥教材知识图谱的模式层,对三种类型的数据进行抽取,进而构建图谱数据层。
通过该平台,对两本步兵战术教材进行抽取,提取的部分实体、属性和关系如图7所示。该图展示了步兵班战术教材建设、步兵班战术课程、步兵分队战术课程和步兵指挥专业等实体及其之间的关系。
4 结束语
本文梳理了作战指挥教材体系,阐述了知识图谱的定义及其一般构建流程,分析了作战指挥教材的数据特点和知识图谱的应用场景。基于此,构建了作战指挥教材知识图谱的概念、属性和关系,并提出了针对作战指挥教材知识图谱的构建方法。
教材知识图谱的应用场景非常广泛,可以用于教材建设,从而促进教材建设的科学管理;可以用于课程教材体系分析,以检查学科知识的交叉和遗漏等问题;还可以应用于个性化教学,利用知识图谱及图嵌入算法处理个性化教学的知识需求;此外,它还能帮助学员理清学习路径。下一步的工作将不断根据新的应用场景,纳入更多的教材领域知识,更新和丰富知识图谱,并进一步开发基于作战指挥教材知识图谱的智能问答、智能分析、智能搜索和智能推荐等应用形式。