APP下载

基于知识图谱的户外动态学习资源智能生成与服务模型研究

2022-04-28赵刚初洁朱文娟尹江华杨丽君蒋姝凡吴林静

电化教育研究 2022年4期
关键词:知识图谱

赵刚 初洁 朱文娟 尹江华 杨丽君 蒋姝凡 吴林静

[摘   要] 户外学习要求其学习资源具有碎片化、动态性与强交互等特点,而现有学习资源构建模式存在高成本、低效率、适应性差等问题,且缺乏系统性的知识结构,无法满足智能户外学习需求。因此,文章结合大数据和人工智能技术,提出了一种基于知识图谱的户外动态学习资源智能生成与服务模型,利用多种数据源信息构建户外学习领域知识图谱,基于推理规则智能获取户外学习场景的实体与属性关系,然后对网页上的关联资源进行动态提取与组织,生成多样化、轻量化、碎片化、交互性强的动态学习资源,为不同认知风格的学习者提供具有差异性的动态情境化学习内容。同时,对模型加以应用分析,研究结果显示,动态情境化的学习资源与传统网页资源在学习资源内容、结构和学习体验方面均存在显著性差异,且视觉型、听觉型与动觉型学习者在学习资源内容和结构方面差异更为显著。研究表明,基于知识图谱的户外动态学习资源能够满足不同类型学习者的智能户外学习需求,为智能户外学习资源开发研究提供了新路径。

[关键词] 知识图谱; 智能户外学习; 动态学习资源; 智能生成; 动态本体

[中图分类号] G434            [文献标志码] A

[作者简介] 赵刚(1981—),男,江西奉新人。教授,博士,主要从事多媒体技术与处理、智能学习分析研究。E-mail:zhaogang@mail.ccnu.edu.cn。初洁为通讯作者,E-mail:chujie@mails.ccnu.edu.cn。

一、引   言

人工智能技术的发展为全民终身学习教育体系构建提供了技术支撑,学习者能够突破时空限制进行学习,真正赋予学习者自主学习的权利[1]。户外学习指学生置身于户外环境的学习,通过增加学习者与环境的交互, 以弥补传统课堂单向知识传递的缺陷,有利于实现终身教育价值理念。现有学习资源具有开发成本高、效率低、适应性差等问题,虽然部分户外学习资源具有碎片化等特点,但缺乏系统性的知识结构,无法满足智能户外学习知识需求。知识图谱可以对繁杂无序的网络资源进行重新构建,合理组织领域知识体系。基于此,文章聚焦户外学习对户外学习资源的要求,深入分析当前户外学习资源开发模式存在的问题,结合大数据、自然语言处理等人工智能技术,提出一种新型的基于知识图谱的户外动态学习资源智能生成与服务模型,实现户外学习资源的动态生成,为学习者提供户外学习智能服务,满足智能户外学习需求。

二、相关研究

(一)户外学习资源

户外学习思想来源于自然学习,关注人与自然的关系问题[2]。随着户外学习定义的发展[3-7],户外学习场景变得丰富多样。目前户外学习研究集中在户外探索式学习和户外体验式学习[8]。教师创建固定教学资源并提供脚手架,学生通过移动终端基于资源进行学习[9-10],本质是将传统课堂学习资源迁移至户外进行学习。余日季等人设计了博物馆文化教育体验系统[11],学习者可通过多种感官进行人机交互,但其为学习者提供的数字化资源一成不变。赵刚等人设计的户外增强现实工具[12]增加了学习者户外学习体验,但其需要手动构建资源库,开发成本高、效率低。

目前的户外学习资源呈静态化特点,开发成本高,效率低,适应性差,存在交互方式单一等问题。有些需要手动更新资源库[13],能够结合学习者特征实现半自动化资源推荐[14],见表1。本文的户外学习强调学习的情境性、学习过程的动态性和学习者的主体性,因此,户外动态学习资源应具有多样化、碎片化、轻量化、交互方式丰富、动态生成以及知识的完整性等特征,以适应不同学习者的户外学习需求,提高户外学习体验。

(二)领域知识图谱

谷歌公司于2012年首次提出知识图谱是由具有多个属性的实体通过关系联结而成的网状知识结构[15]。领域知识图谱是以某一领域问题的逻辑关系为核心,与相应的知识体系和能力体系建立映射关系的工具[16]。教育知识图谱作为领域知识图谱的典型代表,是教育信息化时代的重要资源。我国《新一代人工智能发展规划》中指出,要关注教育知识图谱,重点研究知识图谱构建与学习技术[17]。北京师范大学构建了育人领域的知识图谱[18]以及能够进行个性化知识呈现的数学智能教学系统[19]。这些知识图谱能够有效表示学科领域知识,支持学习导航、认知诊断等智能教育应用。此外,教育知识图谱还能够对在线教育资源进行有效组织[20]。现有学习资源适应性差且缺乏完整的知识结构,无法满足智能户外学习需求。因此,将领域知识图谱引入户外学习中,能够对户外学习知识与网络学习资源实体进行规范化语义标引,进而实现户外学习资源的有效动态组织,提高户外学习知识完整性。

三、基于知识图谱的户外动态学习资源智能生成与服务模型

要解决当前户外学习资源开发成本高、效率低、适应性差等问题,需要结合户外学习资源特征,遵循情境性、服务性、动态性和交互性等原则,从学习资源开发和应用的主要环节进行创新和改进。因此,本文基于大数据、人工智能、知识图谱等技术,从学习资源需求分析、学习资源组织、学习资源生成、学习资源服务与应用反馈等环节出发,构建全新的户外学习资源生成与服务模型。首先,通过数据采集和学习者建模来实现户外学习场景感知并确定户外学习需求;其次,通过构建户外学习领域知识图谱实现学习资源的知识融合与高效组织;再次,结合学习者特征与领域知识图谱智能动态生成与呈现学习资源;最后,通过为学习者提供个性化智能服务与资源应用反馈,提高学习资源应用效率。因此,本文提出的户外动态学习资源智能生成与服务模型包含数据采集、学习者模型、户外学习领域知识图谱构建、户外动态学习资源智能生成、戶外学习智能服务与户外学习资源反馈六个部分, 如图1所示。

(一)数据采集

户外学习情境是由学习者、户外学习时空、户外学习设备、户外学习环境等因素组成的户外场景[21]。要为学习者提供适合当前学习情境的学习资源,可以基于移动智能设备,利用全球定位系统(GPS)等传感器技术获取学习者时空信息,结合学习者需求与个性化特征,通过无线网络与人工智能技术为学习者提供动态学习资源。

(二)学习者模型

学习者在户外学习中居于主体地位。学习者对周围环境的掌控有利于激发其内在学习动力和探索欲望,发现适合于自身的独特认知风格,促进和改善学习[22]。由于学习者具有个性化特点,因此,需要结合学习者先验知识水平、学习习惯、学习偏好等静态特征数据以及学习兴趣、学习路径[23]、学习方式等动态特征数据,综合分析挖掘学习需求,为学习者提供动态学习资源及智能学习服务。

(三)户外学习领域知识图谱构建

学习资源作为学习过程的主要支撑材料,服务于学习者知识建构,因此,对学习资源的组织应该围绕知识展开[24]。户外学习的随机性、情境性与开放性要求户外学习资源具有多样性、灵活性与动态性等特点,而通过网络获取的资源存在繁杂冗余、聚合不足等问题。领域知识图谱作为知识表示的一种重要方式,是实现户外动态学习资源智能生成的基础,能够为学习者反馈结构化的户外学习知识。图2为户外学习领域知识图谱构建与动态学习资源智能生成过程。

1. 户外学习知识获取

网络资源是领域动态本体和领域知识图谱构建的重要数据来源[25]。本文通过数据采集工具实时抓取户外学习领域知识,通过分词、关键词提取等处理得到户外学习领域信息数据集,并以此作为户外学习领域动态本体和领域知识图谱构建的数据基础。

2. 户外学习领域动态本体构建

领域知识本体是领域知识图谱的模式结构,突出领域内概念间的关联关系。动态本体以自动构建为主,能够降低时间成本[26]。本文利用机器学习等技术从多种数据源中自动抽取户外学习领域知识概念和术语,结合学习者户外场景感知需求,使用专用工具对户外学习概念关系和规则进行挖掘,智能解析数据,從而自动化构建户外学习领域动态本体,为户外学习领域知识图谱的构建奠定基础。

3. 户外学习知识抽取与表示

知识抽取包括实体抽取、关系抽取和属性抽取[27]。首先,通过面向开放域的实体抽取方法[28]实现户外学习领域的实体抽取;然后,将获取的结构化数据训练实体属性标注模型用于关系与属性抽取。户外学习知识采用三元组描述实体间的关系,包括(实体1,关系,实体2)和(实体,属性,属性值)。实体是户外学习领域知识图谱的最基本元素,如绿萝、辛亥革命博物馆;关系存在于不同实体之间,如生长于、坐落于;属性指户外学习场景对象具有的特征,如颜色、建设周期;属性值指对象属性的值,如黄色、2年。

4. 户外学习知识融合

户外学习知识抽取与表示获取的实体、关系及属性可能包含冗余和错误,知识融合可以剔除冗余、消除错误,从而建立更加清晰完善的户外学习领域知识体系。户外学习知识融合包括实体对齐和实体链接。首先,从各类数据源中进行户外学习领域实体抽取,然后,通过实体消歧与共指消解等操作,对户外学习知识库中的各个同名实体是否指向同一户外场景、多个实体是否存在含义相同等情况进行判断;最后,将该实体与户外学习知识库中相应的正确实体进行链接。

5. 户外学习知识推理

知识图谱在构建过程中可能有关系或属性的缺失,使知识图谱存在不完备性和不正确性。知识推理可以基于已经建构的知识图谱,通过一些推理算法得到该领域新的事实[29]。由于户外学习知识多样化,且其数据收集方式缺乏整体性,因此,可以通过知识推理方法扩展户外学习领域知识图谱[30]。例如,户外学习领域知识图谱中存在由不同数据源得到的两个三元组:(含笑花,属于,常绿灌木)和(含笑花,又名,白兰花),可以利用知识推理来获取新的事实知识(白兰花,属于,常绿灌木)。

(四)户外动态学习资源智能生成

户外学习场景种类丰富且具有多种属性,直接从网络获取的资源可能存在分散无序、缺乏关联性等问题,导致学习者耗费大量时间提取学习内容。因此,本文通过户外学习领域知识图谱对户外学习相关网络资源进行知识标引,结合户外学习领域知识图谱的推理规则智能获取户外学习场景的实体与属性关系,基于实体与属性对网页上的关联资源进行动态提取并做碎片化处理,结合学习者个性化特征将获取到的资源动态组织并呈现给学习者,以满足其智能户外学习需求。

1. 户外学习资源知识标引

户外学习领域知识图谱将匹配的户外学习知识元以标签的形式标引到网络资源内容上,通过在网络资源的不同位置添加标签,建立网络资源内容与标签的关联关系[31],进而将户外学习领域知识图谱与网络资源紧密结合,使网络学习资源成为有语义关联关系的结构化知识。

2. 户外学习资源提取与碎片化处理

利用规则+机器学习相结合的方法,建立实体、关系、属性等访问约束和推理规则,结合学习者对特定户外学习场景的动态感知确定学习需求,实现基于户外学习领域知识图谱的资源智能检索与提取。对资源进行碎片化处理,如网络视频可通过视频处理工具自动截取关键部分形成微视频,网页文本可直接进行关键内容截取,以满足户外学习资源短小精悍、简明扼要的需求。

3. 户外学习资源动态组织与呈现

不同户外学习场景需要的资源类型不同,将获取的大量碎片化网络资源无序地呈现给学习者会增加认知负荷,根据学习者个性特征将无序资源进行有序组织,可以帮助学习者迅速准确地得到所需要的资源。

认知风格作为学习者个性特征的重要组成部分,是学习过程中稳定的行为表现方式[32]。Neil Fleming开发的VARK认知风格模型,是基于学习者个人的信息接收和感知方式对认知风格进行的分类,包括视觉型、听觉型、读写型和动觉型[33]。在对户外学习资源进行动态组织时,需要根据学习者认知风格设计不同的资源组织方式,基于学习者认知风格的媒体偏好总结户外学习资源页面设计规则,为户外学习资源动态组织提供依据,如图3(a)所示。以菊花为例设计不同的页面呈现方式,示例如图3(b)所示。

(五)户外学习智能服务

基于知识图谱的户外动态学习资源智能生成与服务模型满足服务型原则,能够结合学习者需求提供户外学习个性化推荐服务、智能检索服务与知识可视化服务。

1. 个性化推荐服务

户外学习领域知识图谱作为一种户外学习知识表征工具,能够反映户外知识间的先后关系。基于该知识图谱,结合户外学习情境,根据学习者对户外学习资源的需求、学习者的认知风格与知识状态等静态和动态个性化特征,通过有效的推荐算法,能够精准实现学习资源的个性化推荐服务[34-35]。

2. 智能检索服务

基于知识图谱的智能检索能够根据学习者查询的户外学习情境,结合学习者意图进行推理,基于知识图谱实现对术语概念的检索,且其检索结果具有层次化与结构化等特征。比如,学习者检索郁金香,基于知识图谱的搜索引擎就会结构化呈现郁金香的形态特征、品种分类等场景属性信息。

3. 知识可视化服务

户外学习知识可视化服务表现在知识结构的可视化和知识内容的可视化。知识结构的可视化是通过图表等视觉表征手段为学习者展现户外学习领域知识的内在关联,并为学习者提供脚手架。知识内容的可视化表现为系统提供可视化三维资源以增加学习者的交互体验。

(六)户外学习资源反馈

户外动态学习资源的开发以学习者需求为中心,因此,需要对其进行有效的评价反馈。一方面,学习者可以通过自主探讨板块与其他学习者交流自己的想法;另一方面,可以通过小范围系统试用调查,对动态学习资源的内容、结构以及学习者的学习体验效果等方面进行分析,并基于此迭代修正户外动态学习资源智能生成与服务模型。

四、基于知识图谱的户外动态学习资源

智能生成与服务模型应用分析

(一)实验设计

为了验证模型的适用性,本研究以武汉某学校的72名学生作为调查对象,将其随机分为实验组和对照组,以学校草坪作為户外学习场景进行学习。对于实验组(38人),我们提供了动态情境化学习资源,其可根据不同学习者的认知风格及学习情境进行学习内容和页面布局的动态调整与呈现。对于对照组(34人),我们提供传统网页作为学习资源,其内容在任何情况下都是相同的。在学习之前,研究人员为每位学习者讲解学习资源的使用方法;学习之后,借助问卷星平台对每位学习者进行后测问卷调查。实验过程中所有学习者均使用平板设备进行学习。

(二)问卷的信效度

户外学习资源使用情况调查问卷由学习者对学习资源的期望、学习资源内容、学习资源结构以及学习体验四个维度构成,借鉴了前人有关学习资源问卷的部分题项[36],共20个题目,其中个人基本信息3题,学习者期望3题,学习资源内容6题,学习资源结构4题,学习体验4题。该问卷基于李克特量表进行编制。克隆巴赫α系数作为问卷信度的度量,当α系数值大于0.7时表明问卷信度良好。学习者期望、学习资源内容、学习资源结构以及学习体验维度的信度分别为0.907、0.859、0.803和0.830,α均大于0.7,且问卷整体信度为0.882,表明此问卷所测得的结果具有较高的稳定性和一致性。通过探索性因素分析方法检验该问卷的结构效度,其KMO为0.782,明显大于0.6,说明问卷整体具有良好的建构效度。

(三)实验结果分析

1. 两组学习者的学习资源使用情况

本研究采用独立样本T检验对数据进行分析,结果见表2,两组学习者在学习资源内容、学习资源结构、学习体验三个维度均存在显著性差异,而学习者对学习资源的期望方面无显著性差异。

结果表明,使用动态情境化学习资源的学习者相较于使用传统网页的学习者,在学习资源内容、学习资源结构、学习体验三个维度都有明显的差异。相比于对照组,实验组学习者对学习资源内容的满意程度较高(t=-4.710,p=0.000<0.001),学习者认为学习资源能够动态生成,不会产生重复(M对照=2.68,M实验=3.74,t=-4.742),且能够满足其个性化学习需求(M对照=2.71,M实验=3.79,t=-4.088);实验组学习者对学习资源结构的满意度也高于对照组(t=-6.807,p=0.000<0.001),实验组普遍认为学习资源具有良好的结构性,能够实现独立自主的学习(M对照=3.06,M实验=4.13,t=-5.717)。此外,实验组学习者认为学习资源导航清晰、容易使用,可以交流互动,对学习体验的满意度较高(t=-3.072,p=0.003<0.01)。两组学习者在学习前对学习资源的期望没有差异,且在总体上对学习资源充满期待(M对照=4.03,M实验=4.08,t=-2.60)。

2. 四种认知风格学习者的学习资源使用情况

户外动态学习资源智能生成与服务模型可以根据学习者的认知风格提供不同的学习资源,通过问卷统计,视觉型学习者最多,占61%,其他三种类型比例相当,如图4所示。为对比四种认知风格的学习者对动态学习资源和传统网页学习资源的使用态度,本研究进行了实验分析,结果见表3。

结果表明,四种学习者在学习期望维度没有显著性差异,每类学习者对学习资源都抱有较高期待。除读写型学习者外,其他三类学习者在学习资源内容和结构方面均有显著性差异,证明本研究的动态情境化学习资源较传统网页能够为学习者提供较好的资源内容和结构,而传统网页以文本为主,符合读写型学习者学习特点,因此,两种学习资源对两组学习者差异性不大。听觉型(t=-5.220,p=0.002<0.001)和动觉型(t=-3.101,p=0.017<0.05)学习者的学习体验差异较大,可能因为这两种动态情境化的学习资源具有较强的交互性,使得学习者体验较好。

五、结   语

本文针对户外学习资源开发模式存在的问题,基于户外学习资源特点,结合学习者的户外学习需求,提出一种基于知识图谱的户外动态学习资源智能生成与服务模型,并初步尝试了该模型的户外应用。实验结果表明,相较于传统网页资源,动态情境化的学习资源在学习资源内容、学习资源结构和学习体验方面均有显著性差异,且视觉型、听觉型与动觉型学习者差异较大,读写型学习者仅在学习资源内容方面有差异。该资源基本能够满足不同类型学习者的户外学习需求。后续,我们将继续扩大应用对象与范围,以验证并完善户外动态学习资源智能生成与服务模型的适用性,以期为户外学习资源的研究提供一些参考。

[参考文献]

[1] 中共中央,国务院.中国教育现代化2035[EB/OL].(2019-02-23)[2021-06-20].http://www.gov.cn/xinwen/2019-02/23/content_53679 87.htm.

[2] ADKINS C, SIMMON B. Outdoor, experiential, and environmental education: converging or diverging approaches?[EB/OL]. (2002-08-04)[2021-06-21]. https://files.eric.ed.gov/fulltext/ED467713.pdf.

[3] ROUSSEAU J J. Emile: or on education [M]. New York: Basic Books,1979.

[4] AGASSIZ L. The structure and growth of domesticated animals[J]. The American naturalist,1873,7(11):641-657.

[5] CHUCK W. Boy scouts of America: a centennial history[M]. Dorling Kindersley:DK Publishing, 2013.

[6] LEWIS C. The Administration of outdoor education programs[M]. Dubuque: Kendall Hunt Publishing Company, 1975.

[7] DONALDSON G W, DONALDSON L E. Outdoor education a definition[J]. Journal of health physical education recreation, 1958, 29(5):17-63.

[8] STYMNE J. Mobile learning in outdoor settings: a systematic review [C]//16th International Conference on Mobile Learning. Portugal:Iadis Digital Library, 2020:63-70.

[9] JONG M, LUK E. Adopting eagleeye in outdoor exploratory learning from the teacher perspective[C]//International Conference on Advanced Learning Technologies. Greece: IEEE Press, 2014:617-21.

[10] 周东波,赵琼,钟正.构建基于泛在学习理论的地理户外探究学习系统[J].中国远程教育,2013(2):80-85.

[11] 余日季,蔡敏,蒋帅.基于移动终端和AR技术的博物馆文化教育体验系统的设计与应用研究[J].中国电化教育,2017(3):31-35.

[12] ZHAO G, LIU S, ZHU W J, QI Y H. A lightweight mobile outdoor augmented reality method using deep learning and knowledge modeling for scene perception to improve learning experience[J]. International journal of human-computer interaction, 2021,37(9):884-901.

[13] 王小根,鄧烈君,王露露,范水娣.基于知识元的移动学习资源组织模式研究[J].电化教育研究,2017,38(1):86-93.

[14] 李宝,张文兰.智慧教育环境下学习资源推送服务模型的构建[J].远程教育杂志,2015(3):41-48.

[15] 李振,周东岱,王勇.“人工智能+”视域下的教育知识图谱:内涵,技术框架与应用研究[J].远程教育杂志,2019(4):42-53.

[16] 范佳荣,钟绍春.学科知识图谱研究:由知识学习走向思维发展[J].电化教育研究,2022,43(1):32-38.

[17] 国务院.新一代人工智能发展规划[EB/OL].(2017-07-20)[2021-07-10].http://www.gov.cn/xinwen/2017-07/20/content_5212064.htm.

[18] 余胜泉,彭燕,卢宇.基于人工智能的育人助理系统——“AI好老师”的体系结构与功能[J].开放教育研究,2019,25(1):27-38.

[19] 万海鹏,余胜泉.基于学习元平台的学习认知地图构建[J].电化教育研究,2017,38(9):83-88,107.

[20] 张波,金玉鹏,张倩,赵勤,王娇燕.试论一种新型在线教育资源大数据组织框架[J].中国电化教育,2018(3):41-46.

[21] CHEN M, YU S Q, CHIANG F K. A dynamic ubiquitous learning resource model with context and its effects on ubiquitous learning[J]. Interactive learning environments, 2017, 25(1):127-141.

[22] QUINN J. New learning worlds: the significance of nature in the lives of marginalised young people[J]. Discourse studies in the cultural politics of education, 2013, 34(5):716-730.

[23] AHMAD A, KARDAN, MOLOOD, et al. A new personalized learning path generation method: ACO-MAP[J]. Indian journal of scientific research, 2014, 5(1):17-24.

[24] 王萌,龙乐思,朱嘉麒.我国图情档学科关于文化信息数字资源整合的研究——以博物馆研究为视角[J].图书馆杂志,2020,39(4):80-91.

[25] PENG Z, EL-GOHARY N. Ontology-based automated information extraction from building energy conservation codes[J]. Automation in construction, 2017, 74:103-117.

[26] 高桓,漆桂林.动态本体(Dynamic Ontology)[EB/OL].(2017-11-07)[2021-07-22].https://zhuanlan.zhihu.com/p/30799669.

[27] 翟社平,馬蒙雨,马传宾,高山,郭琳.一种多策略的中文领域本体概念抽取方法[J].西安邮电大学学报,2017,22(1):94-98.

[28] 刘峤,李杨,段宏,刘瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600.

[29] 官赛萍,靳小龙,贾岩涛,王元卓,程学旗.面向知识图谱的知识推理研究进展[J].软件学报,2018,29(10):2966-2994.

[30] 郭琳.面向Web数据的知识图谱学习与推理关键技术研究[D].西安:西安邮电大学,2018.

[31] 张曾昱,徐坤.基于手机终端的免费网络资源知识元标引实践探讨[J].图书馆工作与研究,2015(12):106-109,112.

[32] 谭顶良.学习风格论[M].南京:江苏教育出版社,1995.

[33] POONAM K, PARAMITA S P, MANISHA J, et al. The learning styles and the preferred teaching-learning strategies of first year medical students[J]. Journal of clinical & diagnostic research jcdr, 2013,7(6):1089-92.

[34] 师亚飞,彭红超,童名文.基于学习画像的精准个性化学习路径生成性推荐策略研究[J].中国电化教育,2019(5):84-91.

[35] 丁继红,刘华中.大数据环境下基于多维关联分析的学习资源精准推荐[J].电化教育研究,2018,39(2):53-59,66.

[36] 王瑞霞.基于知识地图的移动学习资源设计与实现——以“媒介素养”学习资源为例[D].南京:南京师范大学,2016.

猜你喜欢

知识图谱
国内外智库研究态势知识图谱对比分析
国内信息素养研究的知识图谱分析
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析
国内酒店品牌管理研究进展的可视化分析
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
专家知识图谱构建研究