APP下载

人工智能课程领域知识图谱及其创新教学模式

2022-01-07朱卫平

软件导刊 2021年12期
关键词:图谱人工智能知识点

谢 榕,朱卫平

(武汉大学 计算机学院,湖北 武汉 430072)

0 引言

人工智能是计算机科学的重要分支,现已成为当今科学技术发展的重要前沿学科。2017 年国务院印发新一代人工智能发展规划通知,指出人工智能是引领未来的战略性技术[1]。人工智能基础课程,如《人工智能引论》等,是学生学习人工智能知识的重要专业课程,主要讲授人工智能的基本原理、方法与技术。该课程内容特点是概念偏多、理论抽象、算法复杂、内容难懂。在学习过程中,学生普遍反映学习该课程难度偏大,理解与掌握课程知识要点有一定困难,对该课程虽很有兴趣却望而生畏。当前课本知识所呈现的知识体系描述相对抽象,知识要点之间只是一种单维上下位关系,缺乏多维逻辑关系的体现。如果主讲教师仅采用传统方法开展教学往往难以取得较好效果。因此,如何运用科学先进的教学理念、通俗易懂的教学方法,特别是运用一些人工智能新技术作为辅助教学手段传授课程内容,对任课教师来说是一项极具挑战性的任务。

2012 年美国Google 公司提出知识图谱计划,引起了学术界与工业界的高度关注[2]。利用信息处理、数据挖掘与图形绘制等手段,知识图谱把学科最复杂的知识内容以可视化图谱形式形象地展现出来,可很好地体现学科整体知识架构、知识点以及相邻知识关联。因此,将知识图谱引入课程教学,可有效地对课程知识脉络进行梳理,有助于学生充分理解学科知识,对优化课程教学能够起到很好的辅助作用。近年来,国内一些高校也逐渐开始重视知识图谱教学方法,并将知识图谱技术应用于智慧课堂[3]、MOOC教学[4]以及翻转课堂[5]等,都取得了良好的教学效果。

然而,在开展人工智能课程教学调研时发现,目前国内外尚没有一套完整的人工智能课程知识图谱,也较少运用知识图谱开展人工智能课程教学实践。因此,本文旨在探索人工智能课程教学的创新方法,利用知识图谱技术构建一种面向人工智能课程教学的多媒态领域知识图谱,并基于所建设的知识图谱梳理专业知识,指导人工智能课程创新教学模式改革与实践。具体地,以人工智能引论课程为研究对象,优化教学内容,形成集先进性、前沿性与实用性为一体的人工智能知识体系、教学大纲和教学教案。在此基础上收集、整理知识图谱素材,利用分词、文本挖掘、语义分析、可视化等技术手段构建一个完整、多模态的人工智能教学领域知识图谱,运用所构建的知识图谱开展创新教学实践,并提出该教学模式的具体实施细节。

1 人工智能课程教学内容优化

1.1 人工智能知识体系

在我国现行新成立的人工智能本科专业中,人工智能引论为一门基础课程,一般只有32 学时。在教学时间十分有限的情况下,为了让学生们能够全方位地领略系统而完整的人工智能知识,尽快入门人工智能领域,并为进一步学习人工智能其它相关课程打下牢固基础,主讲教师需要考虑以什么角度组织、优化课程教学内容,才能让学生更容易接受、理解并掌握人工智能的原理、方法与技术。

人工智能是一门研究人类一切智能活动规律、模拟与扩展人类智能行为的学科。其是一个庞大家族,涉及人工智能众多基础理论、重要方法与实现算法、学科分支及应用领域等[6]。由于智能本身的复杂性,往往难以用单一理论与方法进行描述,因此一般可建立如图1 所示的人工智能学科知识体系,用基础层、抽象层、逻辑层和应用层等不同层次来描述智能本质。从基础层到抽象层和逻辑层,再到应用层,4 个层次层层推进,最终实现人工智能目标。

Fig.1 Artificial intelligence knowledge architecture图1 人工智能学科知识体系

(1)基础层。该层是人工智能的最底层,用于描述基于脑系统与脑认知的人工神经网络对现实世界的感知、认知以及与现实世界的交互与映射,包括脑系统(结构、机理、工作方式)、脑认知(感知、记忆、意识、学习等理论)、人工神经网络(感知器、反向传播神经网络、卷积神经网络、概率神经网络、递归神经网络、时间序列神经网络等)等内容。

(2)抽象层。该层是对人类知识的抽象与表达,围绕着对求解应用问题的理解,用于反映人类知识在人工智能中所扮演的角色,包括问题求解(状态空间搜索、知情搜索、约束满足问题等)、高级问题求解(自动推理、自然语言理解等)、知识及其表示(状态空间、问题归约、谓词逻辑、语义网络、框架、过程、产生式系统、本体等)、高级知识表示(知识图谱)等内容。

(3)逻辑层。该层是人工智能能力的集中体现,用于描述一切与人类智能活动有关的搜索、学习、规划、推理、决策模型,包括搜索(盲目搜索、知情搜索)、高级搜索(博弈搜索、CSP 回溯搜索、受自然启发的搜索等)、学习(观察学习、归纳学习、统计学习、解释学习等)、机器学习(决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习等)、高级机器学习(特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习、强化学习等)、深度学习、自动规划(现实世界规划与行动、任务规划、运动路径规划、轨迹规划、条件规划)、确定性推理(消解原理、规则演绎系统、自然演绎推理)、不确定性推理(概率推理、主观Bayes 方法、可信度方法、证据理论、模糊推理)、知识发现、决策(简单决策、复杂决策)以及智能计算(进化算法、遗传算法、群智能)等内容。

(4)应用层。该层涉及到智能化系统的开发及其应用,用于让计算机实现以往需要人的智力才能完成的各项工作,包括智能体(多智能体、智能体通信、智能体体系结构)、自然语言处理(语义分析、语音识别、机器翻译)、计算机视觉(模式识别、图像理解)、知识问答系统、专家系统、智慧医疗、智能机器人、无人系统、人工智能游戏、人工生命、人工智能应用框架(Tensorflow、PyTorch 等)、人工智能语言等。

人工智能学科知识体系为人工智能课程教学内容确定、教案编写以及课程知识图谱建设提供了重要依据。

1.2 《人工智能引论》教学大纲

1.2.1 教学目标

《人工智能引论》是人工智能、计算机科学与技术、软件工程及其相关智能专业的必修课程,研究如何用计算机模拟、扩展与实现人类智能行为及其规律。通过本课程的学习,使学生对人工智能发展概况、研究内容、关键技术、应用领域有初步了解,掌握人工智能基本概念、基本原理与实现算法,以及信息分析、决策支持等各类智能系统建立与应用方法,熟悉当今人工智能的主要前沿方向,培养学生运用经典人工智能方法与前沿技术解决实际智能应用问题的能力。

1.2.2 课程特点

介绍人工智能学科知识体系中的重点内容,覆盖人工智能基础层、抽象层、逻辑层及应用层的不同层次;注重理论与实践相结合,除基本原理、方法介绍外,还配有大量实例及应用案例;把握国内外人工智能研究领域最新进展与前沿动态;注重综合利用人工智能知识解决实际应用问题。

1.2.3 教学内容覆盖面

围绕“智能”本质,并体现人工智能的技术特征,即知识、搜索、学习、推理与决策,本课程着重讲解人工智能学科知识体系核心内容,包括神经网络、知识表示、搜索求解、机器学习、深度学习、自动规划、推理技术、遗传算法、群智算法等基础理论、方法与技术,以及智能体、自然语言处理、计算机视觉、知识问答系统、专家系统、智慧医疗、智能机器人、无人系统、人工智能游戏、人工生命、人工智能语言等前沿应用与关键技术。具体课程教学内容及其基本要求如表1 所示。

Table 1 Unit contents and basic requirements of the course of introduction of artificial intelligence表1 人工智能引论课程单元教学内容及基本要求

1.3 教学教案

依据知识体系与教学大纲,对国内外优秀人工智能教材的最新内容进行梳理、整合[9-15]。同时,从研究设计方案、科研项目、人工智能技术网站、GitHub 开源代码等多种渠道收集讲课素材。教师对所讲授的教学内容进行梳理,形成课程教案,教案内容包括所属教学模块、教学内容、教学目标及要求、教学重难点、实例/应用案例、复习题/课外作业、课外读物等。以教学模块“知识及其表示”中问题归约法的教学为例,形成如表2 所示的教学教案,为进一步构建该教学内容的知识图谱作准备。

Table 2 Teaching schedule of“problem reduction method”表2 “问题归约法”教学教案

2 人工智能课程多模态领域知识图谱建设

2.1 知识图谱基本组成

知识图谱是表示实体或概念,以及实体或概念之间各种复杂语义关系的一种大规模语义网络,用来对现实世界的事物及其相互关联进行形式化地描述,一般分为通用知识图谱和领域知识图谱。通用知识图谱较多,包括DBpedia、WordNet、谷歌Knowledge Graph、微软Probase、百度知心等。人工智能课程知识图谱属于后者,即聚焦、限定于人工智能课程范畴的特定领域。本文以人工智能引论课程为例建设该课程的领域知识图谱,由知识点、知识点属性、知识点关联组成知识图谱的三元组[7]。根据图1 所示的人工智能知识体系与表1 所示的单元教学内容及基本要求,形成人工智能概论、人工神经网络、知识及其表示、搜索求解策略、机器学习方法、深度学习方法、确定推理、不确定性推理、遗传进化算法、群体智能算法10 个知识大类,构建该课程领域知识图谱的基本骨架。

2.2 领域知识图谱建设一般流程

图2 给出了人工智能课程领域知识图谱建设的一般流程。首先,通过教学大纲、教材和网络资源等信息来源形成教案,从教案中提取知识点,并对知识点进行属性设计;然后,进行知识点关系关联,通过知识融合形成一张错综复杂的语义网络;最后,利用Neo4j 图数据库管理系统等可视化工具生成一个相对完整的多模态领域知识图谱[8]。

Fig.2 Flow of knowledge graph construction of the course of artificial intelligence图2 人工智能课程领域知识图谱建设流程

(1)知识点提取。从教案中对各单元教学模块的主要内容进行知识点识别,提取人工智能课程各个重要知识要点及内容,包括人工智能基本概念/定义、基本原理/工作原理、解题步骤、计算公式、推导、流程图、算法、源代码与结论等。同时,还包括一些考题类资源,如思考题、复习题、课堂练习、课外作业、大作业、讨论题等。对收集的各个知识要点和考题类资源进行分类汇总,知识点类型包括结构化(如关系数据库等)、非结构化(如图片、音频、视频等)以及半结构化(如XML、JSON、百科等)3 种。例如,在“人工智能概论”教学模块中,教学目标为了解从智能机器、学科、能力三方面对人工智能的定义;通过人类认知过程、图灵测试熟悉人工智能与人类智能之间的关系;了解人工智能学科知识体系、研究范围及应用领域;熟悉人工智能起源、简史与发展趋势;了解人工智能伦理。其中,讲解图灵测试时,涉及到图灵测试定义、图灵实验本质、图灵测试提问、图灵测试的争议与批评、新图灵测试等知识要点。此外,还可将知识点延伸到阿兰·图灵的人物介绍、发表的论文,以及如何研制图灵测试机器等内容。

(2)知识点属性设计。对各个知识点进行属性设计,标识知识点基本特性,包括所属教学模块、知识点类型(即基本概念/定义、基本原理/工作原理、解题步骤、计算公式、推导、流程图、算法、源代码和结论)、教学目标、教学要求(掌握、熟悉、了解)、重点程度、难易程度(难、一般、易)等。以图灵测试为例,其知识点属性设计具体内容如表3 所示。

Table 3 Attribute design of knowledge key points of“Turing test”表3 “图灵测试”教学内容知识点属性设计

(3)知识点关系关联。学习是一个循序渐进的过程,需要在不断的学习过程中掌握知识点之间承前启后的关系,这对于构建知识图谱来说至关重要。进行知识点关系关联时,需要确定各知识点之间在含义或语义上的相互联系,定义关系名并确定语义关系类型。其中,语义关系类型包括隶属关系、泛化关系、聚集关系、属性关系、实例关系、时间关系及其它关系。隶属关系表示知识点与其它知识点之间的内在本质联系,如某知识点的定义、方法、实现步骤等;泛化关系表示类知识点与更高层次抽象类知识点之间的联系,所有知识点可由此组织成层次网络;聚集关系表示知识点与其组成成分之间的联系;属性关系表示知识点—属性—属性值之间的联系;实例关系表示知识点与其实例之间的联系;时间关系表示知识点时间前序与时间后序的关系;其它关系包括聚类联系、易混淆关系等。对于一些相似的知识点,可将其聚类放在一起进行学习,强化学生对其的认识;对于一些易混淆的知识点,也可将其关联起来,使学生在学习时注意其区别。例如,“机器学习方法”教学模块中“示例学习”教学内容的知识点关系如图3 所示,包括隶属关系(定义、方法)、泛化关系、聚集关系与实例关系。

Fig.3 The relationship of knowledge key points in the knowledge graph of“learning by example”图3 “示例学习”知识图谱中的知识点关系

2.3 多模态领域知识图谱可视化

在建设人工智能课程领域知识图谱时,将知识点、属性及其关系导入其中,完成知识图谱的创建与可视化。在知识图谱中,可用不同颜色表示知识图谱的基本组成,如用紫色表示该教学模块核心内容,红色表示重点知识点,蓝色表示思考题、课堂作业、课外作业和大作业,黄色表示课外读物、教学视频、应用案例等。图4、图5 分别为“人工智能概论”教学模块中“图灵测试”以及“知识及其表示”教学模块中“问题归约法”的多模态知识图谱展示。使用如Neo4j 图数据库等工具,可进行多模态领域知识图谱的可视化。

Fig.4 Knowledge graph of the unit of“Turing test”图4 “图灵测试”教学知识图谱

Fig.5 Knowledge graph of the unit of“problem reduction method”图5 “问题归约法”教学知识图谱

3 领域知识图谱驱动的人工智能课程教学实践

基于所建设好的领域知识图谱,可设计一些知识图谱的课堂教学应用,包括知识图谱实践教学、知识图谱智能问答等,用于辅助教师授课并帮助学生实现真正的个性化学习。

3.1 知识图谱实践教学

针对书本知识点关系单一、缺乏知识之间的导航、传统教学方法学习效果不佳等问题,开展人工智能知识图谱实践教学。图6 展示了运用知识图谱开展人工智能课程教学的整个过程。

Fig.6 Teaching process of artificial intelligence course driven by domain knowledge graph图6 领域知识图谱驱动的人工智能课程教学过程

以“问题归约法”教学为例,根据教学目标与教学内容,上课前首先向学生提出思考问题并展示该教学模块的知识总图谱(见图5),让学生把握该模块的总体框架。然后,以该知识总图谱为基础,生成针对该教学模块的一系列知识子图谱,如问题归约法所涉及到的全部基本概念汇总(见图7(a))、知识要点及其关联(见图7(b))、所有要求重点掌握的内容及难点内容(见图7(b)中的红色标识)、“梵塔难题”应用实例(见图7(c))、课外作业(见图7(d))等。以知识子图谱中涉及的知识点为重点讲解内容,并根据知识点之间的关系组织课堂教学,让学生有序地学习相关基本原理、方法、技术及实现算法。在课堂教学中,针对具体问题设计教学知识图谱,并在实际中加以应用。

充分运用多媒体知识图谱教学手段展示与讲解课程内容,包括图片、音频及视频等。图谱可视化信息为多媒体教学提供了丰富的教学资源,这些资源依附于相应知识点,使学生在进行课堂学习和课后复习时能够以知识图谱为主体,充分利用相关教学资源。

3.2 知识图谱智能问答

Neo4j 图数据库管理系统提供了一种简单、方便、快捷的操作语言Cypher[8]。借助知识图谱问答技术,其能够在知识图谱中进行搜索查询(Query),快速查询知识图谱中的知识信息,并直接回答有客观答案的问题及一些汇总信息。例如,在复习“问题归约法”教学模块时,查询“梵塔难题的解题步骤是什么?”知识图谱可回答梵塔难题的3 个解题步骤(见图8)。通过这种知识导航式的查询方式,学生可以从局部到整体学习基础知识与案例,也可以从整体到局部,先形成课程知识总体印象,再导航到具体知识要点。

4 实施效果

本文对知识图谱应用实践效果进行分析,分别选取20名2016 级、15 名2018 级学生作为研究对象,对教师课堂教学未采用知识图谱(未用)、教师课堂教学采用知识图谱(单用)、教师课堂教学采用知识图谱且学生制作知识图谱(双用)3 种情况下学生课堂测验的学习成绩进行统计。如图9 所示,未用情况下(教师给2016 级学生讲课时尚没有应用知识图谱),90 分以上的学生人数偏少,而60-70 分偏多;单用情况下(教师给2018 级学生讲解第二章知识表示方法时,除介绍传统状态空间表示、问题归约表示、谓词逻辑表示等方法外,还讲解了知识图谱表示方法及构建技术),90 分以上的学生人数相比未用情况有所增加,而60-70 分的人数有所下降;双用情况下(教师要求2018 级学生在课堂练习前复习相关内容并动手制作章节内容知识图谱),获得高分的学生人数进一步上升,而低分人数进一步下降,说明知识图谱有助于学生对所学知识的理解。

Fig.7 Knowledge sub map of“problem reduction method”图7 “问题归约法”知识子图谱

Fig.8 Intelligent Q&A on the knowledge graph of the"Tower of Hanoi Problem”图8 有关“梵塔难题”的知识图谱智能问答

Fig.9 Evaluation of the effects of knowledge graph teaching图9 知识图谱实践效果评估

从实践效果来看:①教师层面。借助知识图谱技术手段将人工智能课程教学内容相关知识进行抽取、融合,形成完整的知识网络,有利于教师高效、合理地安排教学;②学生层面。通过多模态知识图谱进行直观而具体的教学展示能有效帮助学生更深入、全面地理解人工智能课程知识体系,培养学生对人工智能学科的兴趣,并辅助学生以关联学习方法进行高效学习;③教改层面。将知识图谱教学法运用于人工智能课程教学中,可将离散、碎片化的知识点串联起来,并将知识点之间的关联关系以多模态可视化的方式展示出来,从而有效优化课堂教学,显著提高教学效果。

5 结语

目前国内外尚没有一套完整的人工智能课程知识图谱以及相关知识图谱教学实践方法。借助知识图谱最新技术手段与工具,本文提出基于人工智能知识图谱的创新教学方法,可有效梳理知识之间的关联,获得人工智能领域专业知识的整体逻辑体系,生成紧密关联的教学知识序列,从而较好地支撑教师对教学知识的讲解,并显著提高学生的学习兴趣与学习效率,为传统教学注入新的活力。

猜你喜欢

图谱人工智能知识点
一张图知识点
一张图知识点
第四页 知识点 歼轰-7A
绘一张成长图谱
2019:人工智能
人工智能与就业
数读人工智能
补肾强身片UPLC指纹图谱
关于G20 的知识点
杂草图谱