APP下载

电子游戏测评综述

2019-05-23温迎付玉黄贝萱

电脑知识与技术 2019年8期
关键词:认知能力人机交互

温迎 付玉 黄贝萱

摘要:在心理测评的领域中,互联网的快速发展使得基于计算机的游戏测评迅速发展。与传统的心理测评相比,电子游戏测评有着其独特的优势,但同时也有其避免不了的劣势。该文根据已有的文献资料,将电子游戏测评所测得能力分为认知和非认知能力,并介绍这种测评的优势和劣势,以及其发展展望。

关键词:电子游戏测评;认知能力;非认知能力;人机交互

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2019)08-0178-03

1引言

自从党的十一届三中全会以来,心理学重新得到重视,其中心理测评迅速发展,并得到医学界、心理学界、教育界、组织人事部门等领域重视,且积极应用在人才的培养或选拔等方面。心理测评是对人类心理活动的一种测量、量化和描述的技术(蔡明燕,2010)。传统的关于能力的心理测评越来越不适应当代的要求。所以近几年来出现了一个新的领域:游戏测评(game-based assessment, GBA),它指的是通过游戏或游戏化的活动,来对某一对象某些能力进行测评(Heinzen, Landrum,Gurung,&Dunn, 2015;孙鑫,黎坚,&符植煜,2018)。在这个概念里提及的游戏没有限制,可以是传统的游戏,像是下棋,过家家等线下游戏,也可以是以电子产品为平台所呈现的像连连看、推箱子等电子游戏。电子游戏(Electronic Games),又称视频游戏(Video Games)或者电玩游戏(简称电玩),是指所有依托于电子设备平台而运行的交互游戏。GBA具有一定的趣味性、隐蔽性和真实性。GBA是建立在游戏的基础上展开的,相比于传统的心理测量,有一定的可玩性(孙鑫,黎坚,&符植煜, 2018)。也正是有游戏这件“隐形衣”做保护,参与者是很难意识到实验人员的真正目的,进而也减少了参与者的社会称许性作答,使得参与者更容易真实作答(Heinzen et al.,2015;Shute,Ventura,2013)。目前,随着互联网的迅速发展,已经有许多研究者开始将心理测验与计算机结合起来,将传统的心理测验转换为计算机上的游戏,或者是利用现有的电子游戏去测量参与者的某些能力。国外有研究者把利用电脑技术对解决复杂问题的能力的评估称为“微观世界”(microworlds),研究者通过“微观世界”来了解被参与者解决问题的过程(Wirth &Funke, 2005)。总之,这种基于计算机的游戏心理测评在将来一段时间仍是研究的热点。

2电子游戏测评的类型

认知能力和非认知能力作为能力的一体两面,对个人的社会发展起到重要作用(王子涵,王小军,2016)。关于这两者的界定,目前学界有比较一致的观点。认知能力主要是从课堂教学学到的,如学科知识、记忆力、思维能力等。所以这类能力的测量主要体现在学业成绩上。而非认知能力相对来说比较复杂和多样,包括像毅力、专注力、情感能力、社会适应能力、团队合作能力等。对于非认知能力的测量方法主要是使用量表,像是大五人格量表;内外控制点量表;自尊量表等(陈雨露,秦雪征,2018;余继,闵维方,2018)。综上,在本文中,将电子游戏测评的所测内容主要分为两大类,分别为认知能力和非认知能力。

2.1认知能力的电子游戏测评

认知能力是指人脑加工、储存和提取信息的能力。知觉、记忆、注意、思维和想象的能力都被认为是认知能力。目前,使用率较高的游戏是伦敦塔游戏(the Tower of London,TOL),它是在临床上和实验神经心理学上用来评估计划能力常用的工具。所以有大量的研究者通过线下或线上的伦敦塔游戏来评估个体解决复杂问题的能力。K?stering等人利用伦敦塔游戏作为技术媒介,发现可以通过测量人们计划能力来评估认知障碍的程度(K?stering et al., 2015),也有许多研究发现TOL可以预测患者的认知功能状态(Masson et al., 2010)。 Li, Zhang, Du, Zhu和Li (2015)发现推箱子和伦敦塔两个游戏的计划时间和玩游戏花费的总时间的比与学业成绩有显著相关,所以认为时间比可以成为元认知计划的线上测量指标(Li et al., 2015)。孙鑫等人也发现利用线上的推箱子的游戏可以预测学生推理能力和数学成绩(孙鑫等人,2018)。Sonnleitner等研究者发现利用基因实验室(Genetics Lap)游戏得到的解决复杂问题能力的评估结果与学生的学业成绩有显著的相关性,且学生对GL的接受度很高(Sonnleitner et al., 2012)。

2.2非認知能力的电子游戏测评

宽泛地说,如果将一个人的认知能力可以视为其“智商”,那么可以把非认知能力视为其“情商”。由此可见,非认知能力对一个人来说也是十分重要的。Ventura和 Shute提供了游戏牛顿游乐场(Newtons Playground,NP)是可以有效评估个体坚持性的证据,这一电子游戏的评估要优于个体的自我报告(Ventura &Shute, 2013)。在Baumert, Schl?sser和Schmitt的研究中,利用独裁者、最后通牒和三人博弈的游戏来预测个体潜在的公平性和利他性(Baumert, Schl?sser, & Schmitt,2014;孙鑫,黎坚,&符植煜,2018)。

3电子游戏测评的优势

电子游戏除了在引言中提到的优势,还有以下五点比较突出的优势。第一,国外的研究者认为人们生来喜欢被测评,因为测评的时候会涉及社会比较(social comparision),社会比较指的是在游戏过程中,通过把自己的积分、排行榜和徽章等和他人进行比较,这种视觉反馈可能比老师劝说学生努力学习要更有激励作用,更能激发学生的积极性(Heinzen et al., 2015)。所以更容易获得真实有效的数据。第二,游戏测评可以即时反馈有效信息。参与者一旦做完游戏,就可以得知自己的排名等反馈数据。第三,游戏测评是一个连续的过程。利用游戏,研究者可以得到参与者每一步过程的数据,而不是仅仅只有最后的结果,从而可以推导出参与者在解题过程中的心理过程。第四,游戏测评可以最大地激发参与者的积极性。一个设计良好的游戏是基于科学的心理学知识来制定的,本身的科学性、交互性、合理性都是可信的。第五,人人都害怕失败。准确地来说不是害怕失败本身,而是失败后所带来的后果。正是出于对失败的恐惧,所以很多学生难以在学习上表现优秀(Klassen&Kuzuci, 2009)。电子游戏测评不仅注重参与者成功的一面,更关注其失败的信息,关注失败的原因是什么,而不是失败本身。

4電子游戏测评的劣势

首先,电子游戏测评也避免不了传统心理测评的问题,就是测量对象群体的差异化。年龄差异是比较突出的问题。儿童期是在成长过程中身心发展比较迅速的时期,各种能力在这一期间也会有较大的发展。对于这个时期年龄段的划分要比其他年龄层的划分更为细致,那到底以几年或几个月为一阶段合适呢?这个需要经过前期大量的实验数据的收集才能确定。第二,游戏测评要优于传统心理测评一个突出的点是其生动性,尤其是针对儿童。所以需要这就考虑人机的交互性。除了游戏本体的设计,在游戏界面的设计也需要花费大量的心思。既不能分散儿童的注意力,又要有一定的吸引力。第三,目前,学界常用的计算机过程数据追踪技术——log-file来收集数据。log-file指的是受测者所有活动足迹的日志文件,它可以收集到比较全面的数据,取代了传统的人工收集数据,且在收集数据过程中不影响受测者(孙鑫等人,2018;Moharil et al., 2014)。但同时也会出现一个问题:log-file可以收集较多的数据,所以实验者在数据的筛选、确定和分析等方面需要明确知道自己的所需,不同的游戏有不同的数据指标,即使是相同的游戏也可能存在不同的数据指标,哪些数据可以代表因变量等一系列问题需要实验者思考。

5未来研究展望

5.1施测对象

目前,游戏测评这一领域迅速发展,且多用在教育、医疗等领域,而其施测对象多为中青年。但事实上,最需要游戏测评的人群是儿童和老人。

对儿童来说,游戏更具有吸引力,且比较容易学会。相比于传统的心理测试,游戏测评还有一个比较大的优势在于不容易受到干扰,因为有的儿童达不到某些心理测验所需要的理解能力,这时成年人在旁边过多解释或指导,会影响到儿童真实的反应。因为成年人的语言帮助或多或少带有主观想法。

认知功能障碍(cognitive impairment, CI)是指介于正常衰老和痴呆之间的一种人中功能损伤。研究资料显示,每年大约有8%-25%的CI患者进一步发展成为痴呆(Hughes et al., 2013)。游戏测评一个突出的作用在于可以预测潜在的有认知障碍的老人。目前,已有研究者通过手机上的七款小游戏的成绩能够综合预测可能存在认知障碍的老人(Bonnechère et al., 2018)。但这七款游戏对老人挑战难度比较大,使得得分普遍不高。所以在今后的研究中,如何设计合适难度的游戏将仍会是一个较大的问题。一些游戏测评是可以发展成帮助老人训练和认知康复。这也将会是一个未来主攻的方向。

5.2观察指标

普通的测评小游戏,像是找不同、看图分类等可以收集准确率或反应时的数据。但像是推箱子等复杂的游戏观察指标的选取有待商榷。像是孙鑫等人选取完成箱子的比例、第一部计划的时间与总时间的比值、完成推箱子所要的步数等作为观察指标,然后利用机器学习技术,对log-file所收集到的数据进行分析,得到比较理想的结果(孙鑫等人,2018)。但Li, Zhang, Du,Zhu 和 Li (2015)通过推箱子游戏测量被试的元认知计划, 只使用第一步时间与总时间的比值(Li et al., 2015)。针对不同的研究目的就有不同的选取,但选取哪一个或一些观察指标最优呢?因为电子游戏测评是较新的一个领域,目前相关的文献有限,学界也没有统一的说法。

5.3人机交互界面

人机交互(Human-Computer Interaction, 简写HCI)是指人与计算机之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与计算机之间的信息交换过程。简单来说,就是开发者更加注重产品的“用户友好性”。而GBA中比较热门的领域是利用电子游戏进行测评。所以说如何让电子游戏测评更具有“人性化”是目前需要关注的问题。目前,有许多研究者已着手研究儿童教育软件的交互界面,并卓有成效。但是针对其他年龄段人群的相关研究还需进一步发展。

参考文献:

[1]蔡明燕.儿童心理测验方法的介绍和发展趋势[J].中医药临床杂志, 2010,22(10):930-932.

[2]HeinzenTE, LandrumRE, GurungRA, DunnDS. Game-based assessment: The mash-up weve been waiting for[M]. In Gamification in education and business,Springer, Cham, 2015: 201-217.

[3]孙鑫,黎坚,符植煜.利用游戏log-file预测学生推理能力和数学成绩——机器学习的应用[J].心理学报,2018,50(07):73-82.

[4]ShuteVJ, VenturaM. Stealth assessment: Measuring and supporting learning in video games[M].MIT Press, 2013.

[5]WirthJ, FunkeJ. DynamischesProbleml?sen: Entwicklung und Evaluation einesneuenMessverfahrenszumSteuernkomplexerSysteme [Dynamic problem solving: Development and evaluation of a new assessment to control complex systems]. In E. Klieme, D. Leutner, & J. Wirth (Eds.), Probleml?sekompetenz von Schülerinnen und Schülern (pp. 55-72). Wiesbaden, Germany: VS, 2005.

[6]王子涵,王小军.包含认知能力的教育回报率估计-基于chip2007年数据的实证研究[J].教育与经济,2016(1):39-46.

[7] 陈雨露,秦雪征.相貌对个人认知能力与非认知能力的影响——基于中国家庭追踪调查(CFPS)数据的研究[J].劳动经济研究,2018(04):71-96.

[8]余继,闵维方.学习空间对大学生认知和非认知能力的影响 ——基于学生学习视角的实证研究[J].现代远程教育研究,2018(6):79-88.

[9]K?SteringL, SchmidtCSM, EggerK, et al. Assessment of planning performance in clinical samples: reliability and validity of the tower of London task (tol-f)[J]. Neuropsychologia, 2015,75: 646-655.

[10]MassonJD, DagnanD, EvansJ. Adaptation and validation of the tower of london test of planning and problem solving in people with intellectual disabilities[J].J Intellect Disabil Res, 2010,54(5):457-467.

[11] LiJ, ZhangB, DuH, et al. Metacognitive planning: Development and validation of an online measure[J].Psychological assessment, 2015,27(1):260.

[12]SonnleitnerP, BrunnerM, GreiffS,et al. The Genetics Lab. Acceptance and psychometric characteristics of a computer-based microworld to assess complex problem solving[J].Psychological Test and Assessment Modeling, 2012,54:54-72.

[13]BaumertA, Schl?sserT, SchmittM. Economic games: a performance-based assessment of fairness and altruism[J].European Journal of Psychological Assessment, 2014,30(3):178-192.

[14]KuzucuE, KuzucuE. Academic procrastination and motivation of adolescents in turkey[J].Educational Psychology, 2009,29(1):69-81.

[15]MoharilB, GokhaleC, GhadgeV, et al. Real time generalized log file management and analysis using pattern matching and dynamic clustering[J].International Journal of Computer Applications, 2014,91(16).

[16] HughesTF, FlattJD, FuB, et al. Engagement in social activities and progression from mild to severe cognitive impairment: the myhatstudy[J].International Psychogeriatrics, 2013,25(4), 587-595.

[17]BonnechèreB, VanVM, BierJC, et al. The use of mobile games to assess cognitive function of elderly with and without cognitive impairment[J].Journal of Alzheimers Disease Jad,2018,64(4):1-9.

【通聯编辑:代影】

猜你喜欢

认知能力人机交互
社会主义核心价值观进高校案例调查及启示
无人驾驶车辆认知能力测试方法
我国大学生健康认知能力培养思路研究
小学体育教学中如何发挥体游的寓教于乐的作用
新课程视野下高中政治有效教学探析
人机交互课程创新实验