基于游戏教学的分层数据挖掘方法研究与应用
2019-06-11张琳李小平来林静吴晓兵孙清亮
张琳 李小平 来林静 吴晓兵 孙清亮
摘要:该文基于游戏教学和数据挖掘算法,首次开展了游戏教学的数据挖掘方法问题研究,提出了分层挖掘的概念和应用方法,通过研究游戏教学中的数据元素、教学目的和教学效果之间的关系,完成了游戏教学形态化的设计。提出了游戏教学的数据框架、数据元素、数据定义和数据驱动,构建了分层数据挖掘模型和分层挖掘逻辑结构,分析了数据视点层、数据意义层、数据元素层和元素来源获取层之间的关系,提出了不同视点在教学管理、教学设计下的数据挖掘函数嵌套分量和控制关系。首次提出了游戏知识的获取、知识的聚类和知识挖掘的方法,提出了数据挖掘量化强度的概念,构建了基于数据分层挖掘的游戏设计与能力培养评测关系控制模型,为未来游戏教学设计框架及元素设计提供了参考标准。
关键词:数据挖掘;游戏教学;分层挖掘;数据视点;教学控制
中图分类号:G434 文献标识码:A
一、引言
游戏数据挖掘是针对学习者对游戏教学中各种教学设计元素所产生的反应与要评价的学习者能力之间关系的挖掘,是一种能力的映射效果。在游戏教学中,游戏元素的设置体现了设计者自身的素质和能力,是教学智能性和科学性的反映。游戏元素设置是否成功、是否对教学产生积极作用是通过学习者的体验反映出来的。因此,只有对其教学行为数据进行挖掘才能实现教学效果的验证。
传统的教学数据挖掘主要针对网络教学平台中产生的各种教学数据,通过对数据库数据的提取以及利用日志搜索分析技术完成用户日志数据的采集,得到各种在线分析数据。常见的研究包括学习者在线学习行为规律的分析、学习者学习影响因素的分析以及学习者学习模型的建立等。这些数据挖掘的过程通常都是单一层次的挖掘,有些挖掘具有一定的盲目性以及目标的不清晰性。数据挖掘必须基于一定的挖掘视点,明确挖掘目标,而且要进行多次分层挖掘,这样才可以找到教学数据之间更深层次的关系。针对游戏教学,数据挖掘的目标就是要挖掘出学习者对教学设计元素的反应能力,明确这些元素的设计与学习者的能力是否能够对应、教学能否成功等。数据挖掘必须有先决路径和存在的元素才有挖掘的意义,才能反映出游戏的特有视点,即数据挖掘的原点。数据挖掘原点决定数据视点,不同的应用具有不同的原点,游戏的原点来自于设计元素功能所体现的初衷,即学习者在游戏教学中展现的能力。只有找到挖掘原点才能找出培养学习者对这些元素适应能力的规律,通过设计元素的修正再去培养学习者的能力,通过教学元素模型的不断训练,可以形成优质的游戏教学模型和架构。
游戏数据挖掘中除了常规的数据挖掘问题之外,还存在一些自身特有的需要解决的问题,例如为什么要对游戏进行挖掘?谁来进行游戏挖掘?如何对游戏进行挖掘?挖掘的结果为谁?挖掘的内容包含什么?游戏挖掘是否具有目的性?如何确定挖掘的深度?能否对游戏行为直接进行挖掘?游戏挖掘需要具備哪些条件?本文针对以上问题展开了深入研究。
二、游戏教学挖掘
游戏教学是借鉴游戏的设疑、挑战、自主等理念,把教学目标隐藏于游戏活动中,根据学习者的特征以及教学内容,采取相应的游戏化教学策略,从而使学习者在放松的状态下,从乐趣中获得知识、提高技能和陶冶情操。游戏教学是在数据获取和数据挖掘的基础上,通过情形、环境等的设计体现人才培养的目标、意义和方法的一种新型的教学形态。游戏教学不是为了告诉学习者什么是知识,而是通过综合知识或技能冲突空间的设计使学习者在游戏中获得能力的提升,从而建构学习者自身的知识体系,并用自身感知的知识和技能去解决问题。学习者能够在兴奋或刺激的气氛中,以忘我的本能和态度“建构”或“毁灭”虚拟空间,从中获得影视教学设计中的悬念、惊奇和满足三大体验。学习者将自己的行为轨迹通过在游戏空间中与各个元素作用所产生的效应数据记录下来,以此来展示和证明自己解决问题的能力。所有学习者在游戏中的历史行为记录构成了游戏行为大数据,游戏大数据为游戏数据挖掘、教学效果与游戏设计关联问题研究提供了数据基础。通过游戏数据挖掘可以找出教学问题的规律,找出教学数据之间的关系,找出设计元素与教学之间的关系,找出游戏元素及游戏空间设计与教学效果、游戏学习者能力提升三者之间的关系,找出知识与教学元素的关系以及游戏教学设计的平衡量和控制关系,构建教学控制模型并实施教学控制。通过关系的挖掘形成游戏问题的数据视点,由此提出挖掘分层、问题聚类、数据挖掘量化分析、游戏教学能力与元素的控制模型和反向设计模型。
游戏教学挖掘模型如图1所示。游戏教学是一种传统教学通过教学形体转换形成的新型的教学模式,学习者在游戏学习过程中产生了大量的教学行为,这些行为通过游戏系统记录到相应的数据库中,通过对大量学习者游戏痕迹的挖掘,可以实现游戏元素与学习行为关系的提取,将不同的关系存储在相关关系库中,可以构建相应的教学控制策略。
三、教学数据挖掘视点
教学数据挖掘视点是研究教学数据挖掘的立场、目标和态度,是探究基于不同的视角获取和挖掘数据的研究过程。教学数据挖掘视点是基于教学数据基础上,结合观测者本人的视点以及研究视点需求的基础上,提出自己对数据的获取方法和获取手段的观点。教学数据挖掘视点是根据技术环境和信息获取方法及途径,通过多种表现形态的数据给出事件真伪与对错以及是否与事实相符的结论。
人们在观察事物的时候总是带有一定的态度,视点本身含有一种主观性.是根据主观的态度对所要获取的客观数据进行分析的过程。由于挖掘者本身带有主观的感情和情绪,所以挖掘的立场各不相同,挖掘数据的关注度也各不相同。很多问题需要基于一定的生活经历和知识基础,通过技术手段或人为手段对教学数据和现象进行分类判断、从数据中获取需要的信息。
数据挖掘视点是专家经验的体现,经验越丰富,视点越准确,找到相关的因素越全面,挖掘出的规律与事实越相符。因此,挖掘视点对大数据挖掘效率及准确性起着重要作用。视点最初是人为经验,根据人为经验可以建立初始事件影响因素的挖掘模型。随着数据的不断挖掘,可以将挖掘结果与模型进行比对,在挖掘中不断校正模型,最后产生一个相对优化的模型,挖掘出事件的因果关系。因此,大数据挖掘是通过寻找相关因素去更深层次地探寻其因果关系。
在游戏教学中,由于教学数据的类型和结构各不相同,大量的数据以不同的形式存储在教学数据库中,因此对于游戏教学数据的挖掘必须具有明确的挖掘视点、管理方向和目标。这就是数据挖掘的原点,数据原点决定数据视点,不同的应用具有不同的原点,不同的挖掘需求具有不同的原点。
四、游戏教学数据分层挖掘方法
分层挖掘是指根据不同视点将挖掘目标分解成多个中层挖掘元素,并将这些元素与数据进行关联挖掘分析,确定挖掘目标与数据集元素关系的过程。当顶层挖掘目标与底层数据库的数据集之间关系不明确或关系太复杂,无法直接挖掘到底层数据与顶层目标之间的关联关系时,中间层的建立有效实现了二者关系的建立。分层挖掘是一种多元组合、嵌套式函数关系深度挖掘,它体现了数据挖掘的多维特性。
(一)分层挖掘模型
分层挖掘模型如图2所示,模型共分三层:顶层根目标层、中层元素层和底层数据层。顶级到中层的挖掘是指标分解挖掘,中层到底层的挖掘是学习者轨迹行为效果聚类的挖掘。
1.根目标层
根目标的视点是可变的,站在不同的教学设计者角度,根目标的挖掘具有不同的意义。数据挖掘的最终目标是建立根目标与底层数据元素之间的关系。例如,当确定学习效果提升为最终根目标之后,需要通过对底层数据库中学习者活动痕迹数据进行挖掘分析,明确哪些因素对于提升学习效果起到重要的作用。如果通过根目标层直接挖掘底层数据,虽然可以找出关联关系,但如果关联不明确,就无法构成学习的逻辑规律,因此有必要对挖掘目标进行分层聚类,在不同的聚类中找出对学习效果影响强烈的元素。
2.中层元素层
中层元素层构造的是顶层与底层之间的关系,中间层元素可以有自己独立的数据意义或管理意义,可以是基于教学管理经验构造而成的独立数据,它无法直接从数据集中获取,而是通过大量的数据关联关系分析,最终确定影响根目标的重要中间元素。例如,底层记录的学生闯关成功的行为数据与根目标层学习效果提升之间缺乏直接强相关性,但闯关成功实际是学生对于已知知识的有效运用,甚至是对知识的创新,它与根目标具有很重要的关联关系,如果利用传统的单层数据挖掘,这样的数据将被忽略,就会使得最终的挖掘结果出现偏差。
在分层数据挖掘模型中,可以根据挖掘难度构造多个中间层,中间层元素在整个数据挖掘策略中起到了承上启下的作用,既要作为自变量支撑第一视点根目标层的数据挖掘因果关系,又要作为因变量挖掘与底层数据之间的因果关系。
3.数据层
底层数据层记录的是教学系统的过程数据,它们来源广泛,体现了游戏设计的功能元素,被存储于不同的数据库中。不同的底层元素聚类形成关系的数量就是因果关系的强度,是所有学习者对某一个元素反应的概率,是所有学习者对这个元素反应的能力评价。建立某一个元素的聚合挖掘特性,以强度作为因果关系系数或权重,在其中根据概率进行权重计算,就可以系列地构成各层数据挖掘因果关系控制模型,控制模型从质到量上对数据挖掘进行了方法性描述,通过控制模型的构建,可以使教学视点的观察者明确根目标的影响因素及控制方。
(二)分层挖掘逻辑结构
分层挖掘逻辑结构如图3所示,自下而上分别是元素来源获取层、数据元素层、数据意义层和数据视点层。其中每一个上层的数据均可以被看作因变量y,其下层数据则是自变量x,下层数据经过大数据挖掘形成的相关函数f转换后可以求得上层数据的值。自变量可以是自然的数据源或情节故事源,也可以是人为隐含构造出来的教学中间行为结果,因变量和自变量是一个相对的概念。每一层既可以是它上层的自变量,也可以是它下层的因变量,因此便可以形成顶层数据与底层数据的多级嵌套转换关系。挖掘中以誰为核心点,则可以视其为y,是挖掘的原点,视点决定数据挖掘的方向,视点不同,原点不同,挖掘路径不同。
多级嵌套分层数据挖掘提出了自顶向下的挖掘方向和自底向上数据组合方向,形成了完整多层次函数嵌套挖掘框架。自顶向下的挖掘由挖掘根目标为源头出发,以正序方向进行挖掘问题需求式延伸。自底向上数据组合是由反方向底层数据因果关系挖掘结果与中间层子挖掘目标衔接,进而获得根目标的因果关系表达。
(三)分层挖掘量化控制
分层挖掘中可以通过大数据挖掘聚类,完成各元素量化控制。聚类实现的是不同元素的聚合,是对学习者人群的综合评价,是对触及挖掘目标的学习者的整体挖掘,挖掘的是学习者在各种影响元素中表现的反应能力和行为能力。因此,数据挖掘实现的是最终所有学习者闯关概率的计算,这个概率构成了在总体目标中的权重。
在游戏教学中,游戏行为动作反映了学生的学习轨迹、考虑问题的思路和掌握知识的能力,这些行为动作被记录在轨迹数据库中,体现了学生是否成功解决问题、是否在规定时间内通过关卡等内容。这些动作不是在一个时间段内完成的,而是按照游戏进程,在每个阶段都会产生同步的故事情节、气氛以及环境。因此,需要根据不同的视点建立先决的挖掘路径和元素,在此基础上,挖掘所有人在该元素中的表现能力和概率,最终形成某个能力的聚合挖掘特性。
分层挖掘的量化包括中层元素的量化以及根目标的量化。中层元素的量化模型通过数据挖掘聚类产生,反映了底层与之相关的数据对该元素的影响程度。根目标的量化模型是建立在中间层元素量化模型基础之上,通过利用已有的中间元素与根目标之间的权重关系,最终确定根目标的取值。
公式1所示me为中层元素的控制模型,其中fe为与该中层元素相关的底层数据,共有j个fe与me相关,fw为该底层数据fe在中层元素me控制中所占的权值。
公式2所示为总体根目标rg的控制模型,其中me为中层元素的计算取值,mw为各中层元素对应的权值,每个根目标rg与i个中层元素me相关。
游戏教学层次挖掘的目标是通过数据挖掘构建多个中层元素的控制模型,最终组合形成根目标的控制模型,实现多因素多目标综合评判,为游戏教学设计提供量化依据。
五、游戏教学分层挖掘方法应用研究
任何对人的能力的数据挖掘都是建立在人与事物发生作用以后所产生效应的基础上进行挖掘的。游戏教学不是挖掘游戏中部件的使用情况,而是要挖掘所有游戏者与游戏部件、游戏路径、游戏关卡发生关系之后所产生的作用与效应,通过数据效应的挖掘,找出效应的大小,并根据游戏定义的自身功能与创新能力等中间层的关系,对中间层聚类的强度进行计算。游戏教学挖掘要求底层的数据元素要具有与教学相关的、隐含的或直接的教学作用,根据每个人对元素的反应情况,例如是否通过关卡,进行相应的强、弱或发生、不发生等关联强度分析,最终通过挖掘聚类分析找出整体目标的控制模型。挖掘应用分层是聚类与聚类之间发生的挖掘关系,不是底层单元素之间的关联,单元素的挖掘对于游戏教学的管理意义相对较小,必须挖掘出学习者对于游戏教学环节所产生的效果,才能真正反映出教学设计是否成功。
本研究以北京理工大学汽车实验游戏教学设计为例,在分层挖掘模型和逻辑架构的设计基础上,明确了实验中记忆能力、运用能力、技能能力、超越能力和创新能力等中间层元素。通过对学习者运用虚拟现实技术实现的车辆性能原理分析、观察仿真与解析、拆装技能实训、虚拟排故演练和故障导航等实验中的教学痕迹的挖掘,获得了各中间层的影响子因素及其对中间层元素的影响权重,并由此建立了中间层元素及根目标的控制模型。
(一)游戏教学分层挖掘模型
1.根目标层
在汽车实验游戏教学中,从管理者视点出发,明确汽车专业人才培养素质是数据挖掘的顶层根目标。
2.数据层
一个元素可以具备多个教学设计发生的事件,例如部件的维修设计可以体现创新和超越两种能力,如果维修速度超过已有最高记录,是超越能力的体现,如果创新地利用某些其他手段完成这一功能,则体现了学习者的创新能力。数据层通过对存储的学习者在汽车游戏教学中所留下的底层各种教学痕迹元素的挖掘分析,可以聚类出不同的学习者对学习能力的反应。
3.中层元素层
分层挖掘通过挖掘不同底层数据元素与中层元素之间的因果关系,可以明确如何提升记忆能力、运用能力、技能能力、超越能力以及创新能力。由于五个元素无法同时达到最佳状态,因此将人才培养素质提升定义为五个元素的组合,在组合中找出最佳结合点,构成因果到因果的关系,从而使游戏教学设计达到最佳的状态。如图4所示为汽车专业人才培养素质的分层挖掘示意图,本实例中从教学管理的视点出发,以顶层人才素质培养作为根目标,展开形成五个中间层分支节点。底层数据层是对所有学习者与不同的功能元素作用产生的效果的聚类,对每一个元素的聚类中可以体现多种学习能力,假设元素1实现的是发动机的检测功能,则对元素1的聚类中,既体现了知识的运用能力,又体现了学习者的超越能力。同样,对于同一个中间层元素而言,它的能力也体现在学习者对不同元素的反应中,例如创新能力既可以体现在元素2的分聚类中,也可以体现在对元素n的分聚类中。例如在发动机拆装过程中学习者可以创新闯关方法,也可以在漫游中创新学习路径。
汽车人才培养素质的控制模型构成如公式3所示,其构建示意图如图5所示。
汽车人才培养素质=记忆能力+运用能力+技能能力+超越能力+创新能力 (3)
(二)游戏教学分层挖掘逻辑结构
以人才培养素质中总成绩评价为例,形成了如图6所示的总成绩评价分层挖掘逻辑结构。元素来源获取层中拥有大量的与成绩相关的实体数据库,数据库中记录了每次操作轨迹记录的各层内容和各层表现的成绩,包括编导库、轨迹库、成绩库、元素触发库等,通过对数据库中数据的关联等操作,形成数据元素层中与成绩相关的底层軌迹记录集,记录集记录的是学习者学习轨迹、学习动作和底层成绩,对这些数据进行挖掘分析,便可以形成数据意义层中在各个游戏中产生的逻辑成绩和游戏过程的表现子成绩,最终根据已有的成绩训练模型,形成数据视点层的总成绩评价,即游戏教学结束后的总成绩。
(三)中层元素构建
五个中层元素的定义、基本元素组成、驱动及环境参数如表1-5所示,其中符号“V”代表了多个元素的并集,符号“八”代表了多个元素的交集。由于汽车实验游戏教学具有很强的时间连续性,随着时间的不断推移,学习者会通过不同的学习行为表现出其对知识的理解、对知识的运用和对知识的创新所具有的不同表现形式,五大因素的基本影响因素在不同的时间段中会有不同的表现。
1.基本元素
基本元素是学习者在游戏教学中各种行为的记录,底层的基本元素是数据记录集,例如在游戏教学中,它们可以是来自游戏的设计元素反馈结果,路径或关卡等触发回馈结果,或来自影视编导同步设计元素,如气氛等。
2.定义
若干个关联性很强的基本元素进行合取运算,形成了对中间元素的综合影响,而每个中间元素的影响因素会有多组相关性很强的综合结果组成,这些结果通过析取运算进行组合,共同构成了对中间元素的定义。如对于创新能力的定义有多种,可以是首次挑战新的教学方法,可以是学习者构建与他人不同的知识体,也可以是在教学中具备选择最优路径进行学习的能力。由于在不同的游戏情形下对于创新的含义和表现各不相同。因此,对于这些中间元素给出了多种定义方式。
3.环境参数
环境参数是由故事空间编导同步设计的,对于不同的中间元素性能的提升,需要构造不同的设计环境。例如,为了给学习者的创新营造一定的环境,适当的关卡设置、气氛渲染以及影视故事情节的编排都可以使学习者产生身临其境的感觉。
4.驱动
驱动实现了各元素之间关联关系的建立,它通过将中间元素与环境参数进行合取运算,实现了在不同环境下该中间元素性能的提升。环境的兴奋点与能力的提升具备正向关系,例如学习者自身的学习兴奋状态、对知识和技能的联想能力、对比手段的有效运用等都可以对创新能力提升起到积极的正向驱动作用。
(四)教学元素设计与教学效果评测标准
游戏教学元素设计与教学效果评测标准如表6所示。通过在游戏中加入环境、故事、关卡、工具、空间、知识等设计元素,使学习者能够充分感受游戏带来的教学体验,不断实现知识体系的构建。游戏教学系统能够对学习者的轨迹进行追踪实现其学习效果的评价,从而为游戏教学设计的改进提供相应的指导。
(五)控制模型的构建
在游戏教学过程中,学习者的学习行为动作和路径被不断记录在相应的数据库中,例如学习者整体操作速度提升、游戏的设备运用、动手能力增强和游戏难度升级等都是学习者最后成绩的反映,它们的总和形成了最终的学习成绩。学习成绩是超越能力的基本组成元素,因此与超越能力产生关联,根据关联的次数形成了成绩在超越能力中的权重。通过数据挖掘手段,可以实现对这些底层元素之间关联关系以及五大因素之间关联关系的分析,实现分层关联关系的构造。数据之间的关联性分为强关联、弱关联和无关联,数据挖掘关联性的强度取决于两个数据之间发生关联的次数,关联次数越多关联度越高,關联性越强。通过对关联次数的挖掘,可以判定数据元素之间的强弱关系,从而为挖掘的目标找出有效的影响因素。超越能力的影响因素聚类示意图如图7所示,在汽车游戏教学中,根据对超越元素的挖掘共形成多个聚类,每个聚类中有不同的影响因素,每个因素都具有相应的权重值w,其中各权重值满足公式4-8。
w1+w2+w3+w4=1 (4)
w11+w12=1 (5)
w21+w22=1 (6)
w31+w32=1 (7)
w41+w42=1 (8)
对超越能力的影响因素进行关联分析后按照自身时间轴发生事件聚类,根据聚类产生对超越因素的影响比例,形成超越能力的控制模型,如公式9所示。
超越能力= (w11×w1+w21×w2)+w12×w1+(w31×w3+w41×w4)+w22×w2+w32×w3+w42×w4 (9)
人才培养的类型不同,五个中层元素对于总体人才素质的影响权重各不相同,因此需要根据事先训练形成的人才素质模型获取不同类型人才的影响因素比例,如技能型人才、创新型人才等,最终通过五个元素的权重计算,叠加形成人才培养素质的控制模型和控制结果,如公式10、11所示。
汽车专业人才培养素质=记忆能力×权值1+运用能力×权值2+技能能力×权值3+超越能力×权值4+创新能力×权值5 (11)
六、结语
本研究以游戏教学为例,研究了教学数据挖掘中的视点问题和挖掘方法问题,明确了教学挖掘必须具有一定的视点,必须具备明确的挖掘目标和明确的子目标衔接节点,必须具有明确的以问题为导向和符合逻辑的因果递推关系。游戏教学的性质是经过操作和体验完成能力的提升,它对知识和问题的理解和体验都作为行为痕迹存储在数据库中,必须要进行数据挖掘,找出学习者学习的规律,总结出由此获得能力的提升与游戏设计所形成的关系,形成另一种形态的教学统计评价反馈的机制。游戏教学挖掘的对象是人对元素作用后产生的效果,在所有效果的数据统计基础上找出教学设计与能力提升之间的关系。由于游戏知识学习的获取评价主要反映在游戏教学之后个人的能力提升方面,因此数据挖掘对人的能力进行评价也是对游戏教学效率的评价。游戏教学挖掘的层次与管理者的自身管理分层有关,例如是否设置中间层分量,是否进行间接分类将直接决定挖掘的有效性。游戏教学不仅是教学方法的革新,而且是教学范式的革新,是基于数据挖掘和行为分析得到的一种新型教学形式。在数据隐藏层中自行设计挖掘规则,体现了教学设计者的设计意图,对于数据挖掘的效率提升具有重要的指导作用。
作者简介:
张琳:副教授,在读博士,研究方向为教育游戏、大数据挖掘、智能信息处理、图像处理和人工智能(zhanglin@bucea.edu.cn)。
李小平:教授,博士,研究方向为大数据挖掘、智能图像处理、虚拟现实和人工智能(lxpmx@263.net)。