知识图谱课程教学探索与实践
2021-12-08谢丽
谢 丽
(广州城市理工学院,广东 广州510800)
1 知识图谱课程背景
知识图谱的诞生是为了让机器具备认知的能力,其以图的形式描述客观世界中的实体及其间的关系,在智能搜索、智能问答、大数据分析、自然语言理解等领域展现出巨大的应用价值[1]。知识图谱作为人工智能的一个分支,其具体方法大都来自计算机或人工智能的其他领域,涉及知识工程、自然语言处理、图数据库、机器学习等技术。
综上所述,知识图谱已经成为一门独立学科,设置在我国新增的人工智能学科目录下。在人工智能专业中开设知识图谱课程,让学生能够从整体、全局和系统的视角看待和应用知识图谱技术,并了解知识图谱相关领域的最新进展,具有非常重要的作用和意义。本文从教学现状的分析、教学目标的定位、教学内容的选择、教学方法及考核方式的探究等方面阐述对知识图谱课程的教学探索与实践。
2 教学现状分析
知识图谱作为人工智能专业的一门重要基础课,目前在高校开设本课程将面临以下问题。
2.1 课程开设时间短
“知识图谱”一词诞生于2012年,谷歌将其应用于搜索引擎,以提高用户的搜索质量。随着人工智能技术的发展和应用,知识图谱才逐渐成为关键技术之一。因此,目前还极少有适合用于本科教学的知识图谱教材,也没有统一的开发语言以及软件平台来辅助课程的教学。除此之外,人工智能专业是2017年教育部提出新工科建设之后高校才逐渐增设的,因而开设该课程的学校还相对较少,对该课程的教学经验相对缺乏。
2.2 课程知识点多
由于课程内容具有学科交叉性,学科覆盖内容的知识较广,且内容本身具有一定的理论深度,学生的学习难度加大,容易产生畏惧心理。此外,很多同学单纯地“为学而学”,不知道怎样将学到的知识加以应用,容易产生厌学心理。因此,怎样在有限的学时中既有效地讲授课程核心理论知识,又能够联系实际并实践成为知识图谱课程开展好坏的关键。
3 知识图谱课程教学目标
知识图谱是结构化的语义知识库,用于描述客观世界中的实体及实体间的关系,其基本构成是“实体-关系-实体”三元组。实体指现实世界中具体或抽象的事物,如人、地方、组织机构、概念等;关系描述实体之间客观存在的关联,如人与人、人与物之间的关联,概念与某个物体之间的关联等。因此,以知识图谱为核心建立一个具有语义处理能力与开放互联的知识库,可以在智能问答、自然语言理解、大数据分析、个性化推荐等领域产生重大应用价值。
学生通过该课程的学习,了解该领域的技术发展前沿、掌握知识图谱的相关技术,并初步具备构建小型知识图谱的能力,以及基于知识图谱进行数据分析、文本分析的能力。
4 知识图谱课程教学
课程教学坚持以学生为本,教学相长的指导思想。针对知识图谱课程的教学现状、教学目标和学生已有的知识能力,明确相应的教学内容、教学方法及考核方式,减少学生因课程内容复杂而产生的畏惧心理、厌学心理,帮助学生切实地理解和掌握知识图谱相关技术。
4.1 教学内容
知识图谱生命周期一般经历:知识建模、知识获取、知识融合、知识存储和检索、知识推理以及知识应用等阶段[3]。因此,该课程的教学内容可以按照知识图谱的生命周期进行讲授,由简到难,循序渐进地梳理知识图谱的相关理论知识和基本方法[2]。具体的教学内容如下:
(1)知识图谱概述,介绍知识图谱的相关概念、发展历程、典型的知识图谱项目、应用价值以及学习知识图谱所必需的基础知识等。
(2)知识建模,介绍典型的知识表示方法,并以Protégé工具为例讲解知识体系构建的具体实现过程。
(3)知识获取,讲授如何从不同的数据源(结构化数据、半结构化数据、非结构化数据)中采用不同的方法获取知识。
(4)知识融合,讲授如何将获取到的知识进行融合并构建数据之间的关联。
(5)知识存储与检索,介绍知识图谱存储的主要特点和难点、当前常用的几种图数据库技术,并以Neo4j为例讲授如何有效地存储和检索知识图谱。
(6)知识推理,介绍如何从已有的知识库中经过推理,挖掘出隐含的知识并建立实体间的新关联。
(7)知识应用,基于知识图谱的应用技术展开介绍,包括智能搜索、自动问答、图谱可视化等。
4.2 教学方式
知识图谱是人工智能专业的核心课程之一,其内容是建立在自然语言理解、数据挖掘、机器学习、Python语言等基础课程上,是具有更高层次的专业知识。因此,课程可安排在本科高年级阶段的第6或者第7学期,分配32学时(2学分),其中理论教学占24学时,实验教学占8学时。在教学过程中,可以试行讲课与课堂讨论、项目实践、自学结合的教学方式[3]。具体如下:
(1)教师应仔细遴选教材,选取学生易于理解且易于实践的书籍作为入门参考书。授课时从应用实例展开,通过问题引导、启发、课堂讨论等方式,激发学生的学习兴趣并让其积极参与到课堂中来,提高学生学习的积极主动性。
(2)选取典型章节,增加项目教学的环节,将本章的知识点都融入项目中。目前国内外很多研究机构都推出了面向大众、开放的知识图谱,如国外Freebase、Wikidata、国内OpenKG等,以及一些开源工具,适合初学者学习知识图谱。因此,教师可从中选取难度适中的项目,也可由学生自己选择和定制项目课题,再引导学生有步骤地完成,培养学生的动手能力和实践精神。
(3)教师每年依据知识图谱技术的发展,定期删减陈旧的理论知识,增加新的理论和研究成果。制作和完善多媒体课件、教学项目内容、课外学习资料等,建设资源共享网站,让学生可以利用网站共享资源完成自主学习,进一步增强学生学习的积极主动性,提高教学质量和学习效果。
4.3 考核方式
考核属于教学活动的一部分,在以期末考试成绩和平时成绩为主的考核方式上,增加教学项目的考核内容。由于该课程的应用性较强,卷面考试成绩只占50%,考查学生对基本内容的理解和掌握;平时成绩占15%,包括作业、上课考勤等;教学项目考核占35%,从资料搜集与学习、项目的完成度、项目答辩和课程报告四个方面进行考核,贯穿课程教学的各个阶段。这种考核方式有效地将理论与实践结合,要求学生既要学好课程内容又需做好自己的教学项目,有助于提高学生的学习效果和培养学生的综合素质能力。
5 结语
知识图谱是人工智能应用不可或缺的资源,其在问答系统、智能金融、智慧医疗等领域具有广阔的应用场景,未来会有更多高校的人工智能专业开设知识图谱课程。通过本课程的开展,让学生对知识图谱有一个较全面的认识并具备基本实践能力,让更多的学生可以在知识图谱细分研究方向上更加深入地学习,是具有较大挑战性的教学活动。本文分析了该课程的教学现状,明确了教学目标、教学内容、教学方式及考核方式等方面的内容。此外,由于人工智能技术发展迅速,而知识图谱课程在高校开展时间较短,所以还需要在实践教学中继续优化课程内容,细化教学大纲,为培养我国人工智能专业人才打下良好的基础。