APP下载

基于网络学习行为的学习者本体构建

2019-10-08张紫毓李玉斌

软件 2019年4期
关键词:个性化学习数据挖掘

张紫毓 李玉斌

摘  要: 随着多媒体技术的发展,教育技术进入到大数据时代,数据挖掘等学习技术对教育领域的各种原理研究十分重要,然而怎样把数据挖掘这种技术有效的应用到教育教学中是问题的关键所在。其中,本体构建就是一个重要的方法,该方法将会对研究行为规律、分析学生的行为产生重大的影响。本文在已有本体构建方法基础上,通过总结本体构建过程,设计网络学习空间中学习者本体构建方法并成功实施,最后对学习者本体进行一致性分析。这将为学习者提供精准的教学支持服务,实现个性化学习。同时,学习者本体的成功构建也将为智慧教育提供重要帮助。

关键词: 数据挖掘;本体构建;一致性分析;个性化学习

中图分类号: G434    文献标识码: A    DOI:10.3969/j.issn.1003-6970.2019.04.036

本文著录格式:张紫毓,李玉斌. 基于网络学习行为的学习者本体构建[J]. 软件,2019,40(4):168174

【Abstract】: With the development of multimedia technology, education technology has entered the era of big data. Learning technology such as data mining is very important to the study of various principles in the field of education. However, how to effectively apply data mining technology to education and teaching is the key to the problem. Among them, ontology construction is an important method, which will have a significant impact on the research of behavior rules and the analysis of students'behavior. Based on the existing ontology construction methods, this paper summarizes the process of ontology construction, designs and successfully implements the method of learner ontology construction in web-based learning space, and finally makes a consistent analysis of learner ontology. This will provide precise teaching support services for learners and realize personalized learning. At the same time, the successful construction of learner ontology will also provide important help for wisdom education.

【Key words】: Data mining; Ontology construction; Consistency analysis; Individualized learning

0  引言

近年来,本体构建成为人工智能领域发展较快的一项技术。对于本体的理解,不同的学者有不同的说法,有学者指出,本体的目的是知识共享和互操作;也有学者认为本体是不同个体间进行交流的一种语义基础。此前,本体研究在资源、生物、医学等领域已经得到了广泛的应用。例如,在个性化学习系统中对于数据库原理这一学科的学习,要通过本体技术表示个性化学习系统中的学习资源,以此实现个性化学习系统的共享和个性化学习路径推荐[1]。但是本体研究在学习者领域的应用还比较鲜见,本文是一个新的尝试。学习者本体构建,就是要对学习者的信息进行标准化的描述,实现学习者信息的重用,为学习者提供个性化的教学支持。本文中,我们主要基于学习者学习行为这一属性展开研究。

在进行学习者本体构建之前,首先要确定学习者本体构建的内容和范围。《基于xAPI开放学习者画像的构建与应用研究》一文已经为本文学习者本体构建提供了重要的理论基础[2],在此基础上,本文將学习者本体构建对象分为成绩、人工制品、学习报告、操作性行为、课程学习行为、互动交流行为、总结反思行为、学习投入、学习满意度、使用意愿、学习动机和学习态度共12个方面。学习者本体包含与学习者本体构建对象相对应的12个子本体,这些子本体有机的组合在一起,形成完整的学习者本体。

学习者在网络学习空间中的信息多种多样,个体间又具有独特性,因此学习者本体对象的划分会根据我们研究的需求不同而不同。学习者的行为特征是学习者本体构建中最基本的对象,其他学习者本体构建对象都围绕学习者行为特征进行刻画和描述。

1  学习者本体的构建方法

1.1  学习者本体构建方法研究现状

80年代,人工智能领域正式将“Ontology”用来表示建立抽象模型的一种理论;90年代,关于本体的研究逐年增长;进入21世纪,本体作为一项重要技术,广泛应用于各个领域。国内外学者提出了很多本体构建方法,他们通过这些方法,从流程、技术、方法的细节、应用领域等方面进行了系统的比较[3-4]。例如:冯兰萍等通过重用等技术把本体用模块的形式进行表示[5];李勇和张志刚提出本体构建流程包括8个环节[6];张文秀和朱庆华综合多种方法的优点提出了“循环法”[7]。

本研究以“循环法”为理论基础,通过对本体构建过程和方法的总结,设计学习者本体构建方法,主要包括3个阶段:学习者信息的收集阶段、学习者本体模型的建立阶段和学习者本体的一致性分 析[8]。该方法有两点优势:

(1)增加信息的需求分析。在构建学习者本体之前,从不同的维度对本体构建所需数据的需求进行总结。这样才能在收集数据时,明确需求,保证学习者本体中信息的标准化和精确性,切实解决教学利益相关者关注的焦点问题。

(2)模型构建阶段明确给出学习者本体的词汇表,保证学习者本体的可扩展性和易维护性。

1.2  学习者本体的构建原则

本文按照电影本体的构建原则并根据学习者本体的特点[8],给出以下学习者本体的构建原则,如下:

(1)尽量使用标准术语对本体进行描述

(2)要做到定义清晰。

(3)确保不使用不同的动词来表达相同的概念,同层次概念保持最小的语义距离。

(4)可扩展性。学习者本体提供一个可共享的词汇表,有足够的动词来清楚的表达任何可预见的学习事件。

(5)学习者本体位于信息的表达层次,与特定的符号级编码无关。

1.3  利用本体开发软件构建学习者本体

本文以OWL DL作为本体描述语言,它可以为本体构建提供描述逻辑的推理功能,描述逻辑是OWL的形式化基础。Protege4.1作为本体编辑工具,具有如下几个方面的优势[9]:

(1)作为一种开放资源,Protege4.1提供在线及本地两种使用模式

(2)支持多种国际标准本体文件格式存储,并且提供格式转化功能。

(3)Protege4.1开发界面友好,易于学习和使用,提供平台手工编辑本体,通过可视化操作直接生成OWL语言,本体开发人员可以随时对其进行访问并直接管理本体。

(4)Protege4.1不断更新,功能日趋完善。

2  学习者本体的构建过程

2.1  学习者本体构建三阶段

第1阶段  学习者信息的收集。

数据的采集是一个非常重要的环节,采集到的数据的质量对后续结果的分析有着直接的影响。在网络学习平台中,学习者可以通过多种途径进行学习,当我们对其学习信息进行收集时,要注意以下两点。

(1)你需要什么样的数据[2]?

结合自身的经验推测在网络学习空间中,学习者会产生哪些学习行为?

对于学习者产生的所有学习行为数据对本体的构建工作是否都具有意义?

(2)如何获取数据[2]?

当我们确定了所需数据的类型和范围,下一步的工作就是要获取这些数据。有以下几种方法:

将xAPI技术直接嵌入到学习平台中对学习者的学习行为数据进行获取,这是一种最为常用的方法。

对与学习行为相关的事件进行跟踪。比如,你可能发现某学习者点击了某节课程。

让学习者自己记录自己的学习经历。

让其他人报告学习者的学习经历和成就,比如教师、同学等,这是评估学习者的学习表现的最合适的方法。

第2阶段  学习者本体模型的建立。

(1)学习者本体范围的界定。学习者本体是学习者各方面特征的综合。学习者本体模型越完整,对学习者的刻画就越全面,就越有利于对学习者提供个性化的服务。本文基于行为特征这个维度构建网络学习空间中学习者本体。

(2)建立学习者本体词汇表。类是具有相同属性的一组对象的集合。类与类之间存在父子关系,即Superclass父类,Subclass子类;Equivalent class相同类,主要用于推理;Disjointclass互不相交关系。学习者本体中设置学习者相关联的同级类共12个,每个类包含相应的子类。属性是对于一个对象的抽象的刻画,有对象属性和数据属性两种。

(3)确定学习者本体的类和实例。实例就是个体,是本体构建中最基本的对象。类的等级体系的建立是确定属性关系的基础。这一步中我们需要根据本体的描述力度来确定学习者本体对象中哪些可以作为类。

(4)划分学习者本体的类间关系。本文学习者本体的构建采用综合法,形成以“基于行为属性的学习者本体”为父类的多级树状结构。学习者本体的分类结构如图1所示。(另外还有知识水平和态度特征两个维度的分类结构,在这里不一一列出。)

(5)复用已有本体。本体复用是本体信息共享的重要步骤。

(6)描述学习者本体类的属性。最简单的结构是<执行者+動作+对象>,其中执行者是学习者,动作比如浏览、点击等,对象指交互的对象,该对象可以是学习者的表现,也可以图片、文字、视频等有形的物体。执行者、动作、对象这三个是必选属性,其他属性从不同的侧面对学习者进行描述。

(7)利用OWL描述公理和规则,对学习者本体的一致性做出分析。

第3阶段  学习者本体的一致性分析。这一部分在第3节中进行详细说明。

2.2  类

依据上文提出的学习者本体包含的12个子本体,现将学习者本体的类词汇分为:成绩、人工制品、学习报告、操作性行为、课程学习行为、互动交流行为、总结反思行为、学习投入、学习满意度、使用意愿、学习情绪、学习动机。本研究结合开放学习者画像构建活动流设计[2],分别给出了12个类的子类。例如,“课程学习行为”包括“搜索”、“浏览”、“保存”、“中断”、“轨迹”和“点击”。学习者本体的类表如下表1所示。

2.3  属性

属性是对一个对象的抽象的刻画。子类和父类的属性之间存在继承关系。本研究结合网络学习环境中学习资源呈现的多种表现形式[10]以及网络问题学习行为的研究[11],列出了5个对象属性和5个数据属性。具体描述如下表2所示。

2.4  实例描述

我们通过以下实例对学习者本体进行直观的描述,表3给出学习者小红的实例。

学习者小红的OWL DL表示如下:

< /owl:NamedIndividual rdf:about=”Ontology/学习者#小红>

< rdf:type rdf:resource=”Ontology/学习者#学习者”/ >

< 搜索次数 rdf:datatype=”&xsd;string”>5次

< 课程成绩 rdf:datatype=”&xsd;float”>5次

< 在线答题正确率 rdf:datatype=”&xsd; float” >5次

< 发帖提问的频次 rdf:datatype=”&xsd; float” >5次

< 姓名 rdf:resource=” & 学习者信息;小红”/ >

< 性别 rdf:resource=” & 学习者信息;女”/ >

< 点击 rdf:resource=” & 操作性行为;学习管理平台”/ >

< 浏览 rdf:resource=” & 课程学习行为;浏览知识点提纲”/ >

< 轨迹 rdf:resource=” & 课程学习行为;首先观看了第一节视频,然后又观看了第二节视频”/ >

< 评论 rdf:resource=” & 互动交流行为;对其他人提出的问题进行评论”/ >

< 在线答题 rdf:resource=” & 总结反思行为;

完成练习和自我测试”/ >

< 积极情绪 rdf:resource=” & 学习情绪;可以成功的在网络学习空间中进行操作,完成学习任务”/ >

< /owl:NamedIndividual >

2.5  公理和推理规则

公理表示永远存在并且永真的条件,它用来描述类之间存在的约束条件。学习者本体的公理也同样依据领域本体的公理集,如表4所示[8]。为了便于描述,这里设定 (i=1,2,…,n)表示领域本体中的一个类。

根据学习者本体的属性和关系,列出学习者本体的公理集,如表5所示[8]。公里集中的字母定义:a,b,c分别表示类名或实例名,p表示属性,lo表示LearnerOntology,即学习者本体。

推理规则可以对学习者信息进行维护和完善,以此来确保本体的一致性。学习者本体构建的推理规则如下表6所示。

3  学习者本体一致性分析

关系可以描述类或概念之间的某种联系。一般情况下它是一个动词,表示一个命题。学习者本体构建中的某一对象导致其他对象的属性的形成或学习者的某一行为促进某一属性都属于学习者本体的

推理规则 描述

规则1 (?学习者 lo:点击学习管理平台频次低?操作性行为)(?学习者 lo:学习动机?学习兴趣不高)

规则2 (?学习者 lo:浏览观看视频频次低?课程学习行为),(?学习者 lo:知识点的学习顺序不正确?学习轨迹)(?学习者 lo:在线答题正确率低?总结反思行为)

规则3 (?学习者 lo:在线答题正确率高?总结反思行为)(?学习者 lo:个人学习报告质量较高?总结反思行为)

规则4 (?学习者 lo:无目的浏览?课程学习行为),(?学习者 lo:目标不明确?目标信息)(?学习者 lo:无效学习?学习效率)

规则5 (?学习者 lo:保存视频?课程学习行为)(?学习者 lo:学习兴趣?学习动机)

规则6 (?学习者 lo:发帖求助?互动交流行为),(?学习者 lo:搜索相关知识?课程学习行为)(?学习者 lo:对学习内容较为关注?积极情绪)

规则7 (?学习者 lo:学习中断?课程学习行为),(?学习者 lo:知识点的学习顺序混乱?学习軌迹)(?学习者 lo:作业完成质量不高?总结反思行为)

规则8 (?学习者 lo:获得文凭?学习动机),(?学习者 lo:回应问题?互动交流行为)(?学习者 lo:积极情绪?学习情绪)

类间关系。本体的一致性是指类之间不会出现矛盾的情况,本体各部分之间所形成的逻辑关系都是合理的。学习者本体类间的两种关系定义如下:

定义1  对于任意个体,若它同时属于类1和类2,则称类1和类2之间是继承关系。

定义2   对于任意个体,若它既不是类1的实例也不是类2的实例,则称类1和类2之间是不相交关系。

3.1  类间关系的一致性分析

不相交关系会引起学习者本体的类间关系的不一致,即不存在一个个体同时属于所有类当中的任意2个或多个,也可以说类之间的交集为空。如果我们没有定义两个类之间为DisjointWith关系,那么就会出现一个个体同时属于两个类的情况,而且这种情况是被protege中的推理机默认的,因此就出现了本体的不一致性。

图2给出学习者本体不一致性判定算法的流 程图。

3.2  基于公理的一致性分析

基于公理的一致性分析是指学习者的多种行为信息之间不存在矛盾的关系。由于学习者行为信息收集的方式多种多样,学习者的行为数据又十分复杂,本体构建者所获取的信息和数据有可能存在误差,这些都可能是造成本体不一致的原因。下面结合表6列出的学习者本体推理规则做出以下分析:

以规则2为例,(?学习者 lo:浏览观看视频频次低?课程学习行为),(?学习者 lo:知识点的学习顺序不正确?学习轨迹) (?学习者 lo:在线答题正确率低?总结反思行为)

该规则说明对于任意一个学习者,在他的在线学习过程中表现为观看视频的频次较低并且没有按照正确的顺序对知识点进行学习,则他的随堂在线测试成绩不理想。如果学习者本体中出现观看视频的频次较低并且没有按照正确的顺序对知识点进行学习,而随堂在线测试成绩很理想的情况,则报告本体出现不一致情况。本体的一致性分析涉及本体的类、属性和实例各个方面,作为本体构建者,我们要有组织有计划地收集学习者数据,对数据进行有效的分析,以定性数据为主,将定量信息归类为定性数据,聚类出不同类型的学习者群体,采用强相关信息,忽略弱相关信息。同时,对于学习者本体的构建不能太细,虽然对学习者的细致刻画更有利于解决利益相关者关注的问题,但是与此同时也提高本体构建的成本,导致学习者本体的使用度下降。

4  结语

学习者本体的构建是基于大数据、学习分析等技术的发展而产生,有利于促进学习者个性化学习和全面健康成长。本文基于行为属性提出了学习者本体的构建过程并作出一致性分析。学习者本体的成功构建可实现在教学实践中精准识别不同的学习者群体,为不同学习者群体提供个性化的教学支持;同时,学习者本体的成功构建也将为智慧教育的发展提供重要的帮助。本体构建工作是一个反复叠加的过程,随着信息的丰富和开放环境的不断发展变化,学习者本体模型将随时更新,不断完善。

参考文献

[1] 郝娟, 林华. 个性化学习系统中领域本体构建研究[J]. 2016, 07: 65-66.

[2] 乔惠. 基于xAPI开放学习者画像的构建与应用研究[D]. 华东师范大学. 2018.

[3] 李景, 孟连生. 构建知识本体方法体系的比较研究[J]. 现代图书情报技术. 2004, 07: 17-22.

[4] 尚新丽. 国外本体构建方法比较分析[J]. 图书情报工作. 2011, 09: 116-119.

[5] 冯兰萍, 朱礼军, 蒋亚东. 一种模块化本体构建方法研究[J]. 现代图书情报技术. 2010, 06: 53-59.

[6] 李勇, 张志刚. 领域本体构建方法研究[J]. 计算机工程与科学. 2008, 30: 129-131.

[7] 张文秀, 朱庆华. 领域本体的构建方法研究[J]. 图书与情报. 2011, 01: 16-40.

[8] 高小龙, 朱信忠, 赵建民, 曹存根, 徐慧英. 电影本体的构建与一致性分析. 计算机应用. 2014, 34(8): 2192-2196.

[9] 李晓瑛, 李丹亚, 夏光辉. 肿瘤本体构建研究[J]. 数字图书馆论坛. 2015, 8: 37-42.

[10] 方海光, 刘静, 黄荣怀, 李玉顺. 基于学习对象化的移动学习资源自适应引擎的研究[J]. 中国电化教育. 2009, 07: 51-55.

[11] 彭文辉. 网络问题学习行为研究[J]. 远程教育与网络教育. 2014, 02: 40-45.

[12] 孙吉鹏, 袁郭苑, 杜泽林. 学习行为分析的段落粒度在线教程系统[J]. 软件, 2018, 39(4): 137-141.

[13] 岳钢, 王楠. 网络学习中知识可视化效率研究[J]. 软件, 2015, 36(2): 92-96.

[14] 赵旭剑, 邓思远, 李波, 等. 互联网新闻话题特征选择与构建[J]. 软件, 2015, 36(7): 17-20.

[15] 蒲杰方, 卢荧玲. 基于聚类算法和神经网络的客户分类模型构建[J]. 软件, 2018, 39(4): 130-136.

[16] 孔令東. 基于WF Flowchart的UML活动图动态构建与测试[J]. 软件, 2018, 39(5): 121-125.

猜你喜欢

个性化学习数据挖掘
基于并行计算的大数据挖掘在电网中的应用
微视频在初中英语听力教学中的应用探索
基于微课翻转课堂的职业院校远程教育创新模式的研究
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
基于GPGPU的离散数据挖掘研究