APP下载

图书情报领域认知负荷测量研究综述

2018-11-12

信息资源管理学报 2018年4期
关键词:测量法生理主观

陆 泉 田 敏 陈 静

(1.武汉大学信息管理学院,武汉,430072; 2.华中师范大学信息管理学院,武汉,430079;

3.武汉大学信息资源研究中心,武汉,430072)

1 引言

认知负荷(cognitiveload)最早由澳大利亚新南威尔士大学的认知心理学家约翰·斯威勒(JohnSweller)于1988年提出,它以美国心理学家Miller的脑力负荷或心理负荷研究为基础,是指在一个特定的作业时间内施加于个体认知系统的心理活动总量[1]。一般而言,心理努力、认知负荷和心理负荷被认为是相关的甚至被描述为同一概念[2]。认知负荷的理论自提出以来就受到包括心理学、工程学、教育学、医学等在内的诸多领域的关注和研究。由于认知负荷应用的领域和背景不同,认知负荷的测量方法就成为研究的重点对象。

情报具有认知属性[3],认知负荷数据作为用户行为数据的一种,是情报学研究的重要对象。在复杂的人机系统中,作业人员往往需要在较短的时间内处理大量的信息并快速作出反应与决策,容易出现超负荷现象,从而导致效率下降。因此,如何准确、有效地测量信息处理过程中作业人员所产生的认知负荷成为了情报学领域研究的一大热点。

本文选取图书情报学领域(Library&InformationScience,LIS)里有关认知负荷测量的文献,从测量方法、测量指标和研究领域三个维度进行梳理和分析,从而得到五点启示,以此掌握认知负荷测量在情报学中的发展脉络及趋势。

2 LIS学科中的认知负荷测量研究

通过相关标准筛选相关文献,从测量方法、测量指标、研究领域等三个方面进行文献梳理和分析。

2.1 文献来源

本文收集的论文主要包括中文和英文。其中中文论文通过中国知网进行检索,学科指定为“图书情报与数字图书馆”,主题限制为“认知负荷”;英文论文则先从WebofScience数据库中通过主题检索获取相关的题录摘要,学科指定为“Library&InformationScience”,检索主题包括:“cognitiveloadmeasurement”、“mentalworkloadmeasurement”、“subjectivecognitiveload”、“physiologicalcognitiveload”、“dualtaskcognitiveload”、“NASA-Task-Loadindex”、“heartratecognitiveload”、“eyemovement(pupildilationeyeblinkeyeblinkrateeyeblinkinterval)cognitiveload”、“ERPscognitiveload”、“EEGcognitiveload”和“effortcognitiveload”。之后再通过Springer、Wiely、Elsevier、Emerald等数据库进行全文检索,一共检索到中英文共139篇可用文献,去重后得到122篇文献,最后筛选出适合本研究的44篇文献(中文3篇,英文41篇)进行梳理分析。筛选过程中论文的采纳与排除标准如下:

采纳标准:

(1)撰写语言为中文或英文的论文;

(2)将测量认知负荷作为应用的工具和手段的论文;

(3)进行了实证研究,其中包括实验目的、被试者和实验结果说明的论文;

(4)描述了包括实验设置在内的研究方法的论文。

排除标准:

(1)只针对认知负荷或者认知负荷的测量进行理论梳理而没有实验验证的论文;

(2)只针对认知负荷测量方法进行实验而没有加以应用的论文。

2.2 测量方法分析

现有的认知负荷测量方法基本上都是沿用脑力负荷或心理负荷的测量技术[4]。图书情报领域目前常用的认知负荷的测量方法主要有四类:生理测量法、主观测量法、任务绩效测量法和行为测量法。部分文献也综合采用这四种方法来测量认知负荷。

(1)主观测量法

由于学习者在任务完成过程中或者完成之后能够回顾并表达他们感受到的任务难度以及付出的心理努力,因此主观测量法可以根据学习者的反馈来评价认知负荷。选取的文献中采用主观测量法进行认知负荷测量的文献共有13篇。

(2)生理测量法

生理测量法是通过客观的评价指标来对学习者的认知负荷进行测量。它通过测定学习者在任务完成过程中出现的生理反应来间接评价其认知负荷。其理论前提是生理指标可以反映生理功能的变化,由于认知负荷的变化也是一种生理状态上的改变,因此可以采用生理测量法进行测量。选取的文献中采用生理测量法进行认知负荷测量的文献共有17篇。

(3)任务绩效测量法

任务绩效测量法属于另一种客观的直接测量方法。它通过测定学习者完成指定任务的客观绩效来获取此任务给学习者带来的认知负荷,分为单任务测量法和双任务测量法。采用任务绩效测量法的所选文献全部都采用双任务测量法进行认知负荷的测量。双任务测量法的理论假设是人的工作记忆信息加工能力是有限的,但这种能力可以灵活地被分配到任务解决的不同方面[5]。具体而言,它要求学习者在规定的时间内同时完成两项任务——主任务和次任务。在完成过程中,学习者把主要精力放在主任务上,而把剩余的精力放在次任务上。在该范式中,次任务的成绩被假定成是由主任务导致的认知负荷的一个直接表现。选取的文献中采用任务绩效测量法进行认知负荷测量的文献共有16篇。

(4)行为测量法

行为测量法通过不让被试意识到自己的行为正在被记录作为搜集其完成任务过程中的数据,从而对认知负荷进行客观、非侵入性以及隐性的分析。具体的方法包括手写特征提取法和口语特征提取法。具体而言,由于心理负荷对手写行为具有影响,因此可将手写行为(handwriting)作为衡量健康人群心理负荷水平的指标[6];而Khawaja等总结指出,口语特征提取法可以可靠地反映被试执行任务的心理过程[7]。选取的文献中采用行为测量法进行认知负荷测量的文献共有6篇。

目前综合采用四种方法进行认知负荷测量已经成为一种趋势。按照这四种基本方法的组合使用情况,44篇文献中:有9篇文献使用了两种及以上的测量方法来测量认知负荷。其中,视觉研究领域的Gowrisankaran等[8]、电子医疗领域的Mazur等[9],以及人机交互领域的Zekveld等[10]共3篇文献采用了主观测量法和生理测量法;Epling等1篇研究文档阅读领域的文献[11]采用了任务绩效测量法和主观测量法;同时有1篇由Na等研究的网页搜索领域的文献[12]综合采用了主观测量法、任务绩效测量法和行为测量法这三种方法测量认知负荷,张云秋等[13]则综合采用了主观测量法、生理测量法和任务绩效测量法这三种方法测量认知负荷。

2.3 测量指标分析

从主观测量法、任务绩效测量法、生理测量法和行为测量法这四种方法的相应指标入手,对采用相应指标的文献分别进行了统计与分析。

(1)主观测量法指标

在选取的文献中,主观测量法的工具主要包括NASA-TLX评价量表和主观评级。其中NASA-TLX评价量表在使用主观测量法的所选文献中应用更广。

所选文献中采用了主观测量法来测量认知负荷的研究至少有13篇。其中主要使用NASA-TLX评价量表的数量为10篇(占比77%);人机交互领域的Zekveld等[10]和视觉研究领域的Gowrisankaran[8]采用了主观评级的方法来测量认知负荷,而网页搜索的张云秋等[13]则是通过Paas和Sweller的主观测量法来测量认知负荷。

(2)生理测量法指标

早期的生理测量法一般采用心率及心率变异性等作为指标;而与眼活动相关的具体指标主要包括瞳孔指标、眨眼指标、眼跳指标、注视指标和凝视指标;在脑指标中,脑电图(简称EEG)和脑参数也是用来评价认知负荷的指标。

所选文献中采用了生理测量法来测量认知负荷的研究至少有21篇。其中,采用眼动指标进行认知负荷测量的文献共有11篇,相关眼动指标主要包括:瞳孔指标(瞳孔扩张、瞳孔大小)[9-10,14-17]、注视指标(注视次数、注视时长)[13,18-21]、凝视指标[19]、眨眼指标[8,14,17,21]、眼跳指标[20-21]。使用脑参数(主要为脑电图EEG)进行认知负荷测量的文献共有9篇[9,22-25,27-29];使用心脏参数进行认知负荷测量的文献只有1篇,是Bousefsaf等关于人机交互的研究[30];而Mazur等在电子病历领域的研究[9]则综合采用了眼动指标和脑参数。

(3)任务绩效测量法指标

任务绩效测量法通常采用的测量指标包括任务反应时间、准确率和错误率。

所选文献中采用了任务绩效测量法来测量认知负荷的研究至少有16篇。由于大部分任务所涉及的心理资源不同,单任务的指标很难完全表达其复杂的内在机制;同时任务的性质不同使得单任务的指标很难作横向比较[4]。鉴于单任务测量的缺陷,全部研究都使用双任务法来测量认知负荷。常用的相关指标包括:任务反应时间、任务准确率。16篇文献中,Epling等[11]、Papesh和Goldinger[16]、Savage等[31]、Rieh等[32]、张云秋等[13]、刘佳等[53]和李建华等[54]这7篇的研究使用任务反应时间指标来测量认知负荷;Kwon等[26]、Cho等[33]、Na[12]、Cameron和Webster[34]、Pérezmoreno等[35]5篇的研究使用任务准确率指标来测量认知负荷;而Spronk和Jonkman[27]、Tim等[36]、Gwizdka[37]、Koornneef等[38]4篇的研究则综合采用任务反应时间和任务准确率来测量认知负荷。

(4)行为测量法指标

行为测量法中的手写特征提取法采用书写平面上的压力、时间(笔在空气中和在纸张上的持续时间)、空间(段路径长度、宽度、高度)和书写时的角速度作为其测量指标;而口语特征提取法采用音调、韵律、语音能量、基本语音频率以及语言语法特征等作为其测量指标。

所选文献中采用了生理测量法来测量认知负荷的研究至少有6篇。其中,Durning等在电子医疗的研究[39]、Na在网页搜索的研究[12]以及Parirokh等在网页搜索中的研究[40]都是通过出声思维法来测量认知负荷;Khawaja等在交流沟通领域的研究[7]以及Huttunen等在人机交互领域的研究[41]则通过抽取语言及语法特征对认知负荷进行测量;而Luria等在人机交互领域的研究[6]分别通过对手写的笔迹压力、时间、空间、角速度以及声音特征的抽取来测量认知负荷。

2.4 研究领域分析

根据文献的梳理结果,可将认知负荷在情报学中的应用领域划分为七部分:电子医疗、人机交互、文档阅读、交流沟通、视觉研究、网页搜索和信息系统。

(1)电子医疗

有4篇文献探讨了认知负荷测量在电子医疗领域的应用。其中,Mazur等采用了主观测量法、生理测量法评估了电子医疗任务需求、负荷与绩效之间的关系[9],Durning等采用行为测量法探索了影响医学专家临床推理表现的情境因素[39],Saleem等采用主观测量法比较了四种电脑临床提醒软件[18],Sox等采用主观测量法研究了个人的健康应用程序[42]。四项实验的结果显示,主观测量法有利于测量该领域用户的认知负荷,而生理测量法则可能与该领域相应的任务需求无明显关系,这一点被Mazur等的实验[9]所证明。

(2)人机交互

有11篇文献研究了认知负荷测量在人机交互领域的应用。其中,Chen等、Hirshfield等、Trimmel等、Gevins等、Cannon等、Bousefsaf等都采用生理测量法衡量认知负荷[14,22-25,30],Zekveld等采用生理测量法、主观测量法对听力感知过程中认知负荷的影响因素进行了分析[10],Luria和Rosenblum采用行为测量法测试了心理负荷对手写行为的影响[6],Syrdal等采用主观测量法探究了机器人对日常任务的影响[43],Aloise等采用主观测量法进行了脑机接口的测试[44],Huttunen等采用行为测量法对航空语音中的认知负荷进行了测量[41]。在人机交互领域采用的测量方法包括生理测量法(7篇)、主观测量法(3篇)和行为测量法(2篇)。

生理测量法是应用于该领域研究的热门方法,该方法可以有效评估心理状态[30],使用生理测量法中的脑电指标在人机交互领域中进行认知负荷的监控是可行的[22]。而主观测量法的TLX量表则被证实在实验中的对比模式间没有显著差异[39]。

(3)文档阅读

有13篇文献探索了认知负荷测量在文档阅读领域的应用。其中,Epling等通过结合双任务法和主观测量法研究单词回忆任务[11];Demberg和Sayeed采用生理测量法测量语言处理方面的认知负荷[15],Tamaoka等采用同一方法探讨日语阅读过程[19],Payne和Stine也采用该方法探讨语句理解中语义集成处理的程度[20];Kwon等采用双任务法和生理测量法研究单词回忆中认知负荷与神经网络的关系[26],Spronk和Jonkman用这两种方法研究词汇测试[27],Papesh和Goldinger探究语言处理中认知努力的分配[16];Cho等采用双任务法研究阅读理解被损害的情形[33],Savage等采用该法探究儿童阅读中的困难[31],Tim等通过双任务法探究听觉输入的词汇生成是否与发音输出的词汇生成不同[36];通过生理测量法Fernández等探究儿童学习词语的差异[28],Kim等评估电子书与纸质书之间的差异[21];Koornneef等通过双任务法研究阅读中的工作记忆能力[38]。双任务法和生理测量法被该领域广泛采用,其中,学习障碍的儿童展示出的生理(脑电图)差异可以解释他们的认知缺陷[28],双任务法能够更纯粹地反映出儿童注意力问题中的认知困难[31],且测出的结果与认知资源理论相符[11]。

(4)交流沟通

有4篇文献研究了认知负荷测量在交流沟通方面的应用。其中,Khawaja等采用行为测量法中的口语特征提取法测量协同交流环境中的认知负荷[7],Roberto等采用主观测量法探究三种交流环境中的协同工作效率[45];Funke等采用主观测量法探究认知负荷和基于文本的协作工具对团队绩效的影响[46];Cameron和Webster采用双任务法来探究多元交流[34]。

(5)视觉研究

有3篇文献探索了认知负荷测量在视觉研究中的应用。其中,Gowrisankaran等综合采用生理测量法和主观测量法来探究观看视频中认知负荷对昏厥症状的影响[8],Pérezmoreno等采用双任务法研究视觉感知在空间图像和语言任务中的影响[35],Jiang等采用生理测量法来测量计算机视觉中来自眼睛视频流的眨眼[17]。

分析发现,该领域主要采用生理测量法,特别是与眼动指标相关的生理测量法来测量认知负荷,可以有效地测量出认知负荷对眼动状态的影响[8]。

(6)网页搜索

有8篇文献[12-13,32,37,40,47,54]集中研究了网页搜索中的认知负荷测量。其中,Na综合采用双任务法和主观测量法探究心理需求对于网页搜索者思想、情绪、努力和表现的影响[12];Na和Lee采用主观测量法探究搜索任务中协同搜索和个人搜索技术的不同[47],Rieh等采用双任务法探究用户感知对在网页搜索引擎和图书馆系统中投入心理努力总量的影响[32],Gwizdka采用此方法来探究搜索任务不同阶段认知负荷的动态变化以及影响认知负荷的因素[37],刘佳等和李建华等都采用双任务法探究信息检索过程中用户认知负荷的动态变化[53-54];Parirokh等采用行为测量法中的口语特征提取法调查google查询扩展功效的反应[40];而张云秋等则综合采用生理、主观和任务绩效测量法从日志和认知的角度综合比较分析探索式医学搜索行为的特点和规律[13]。

该领域有6篇文献(占比75%)都采用了双任务法进行认知负荷的测量,也可以证实查询行为和总认知负荷无明显关系[47]。双任务法可以有效测量出网页搜索及图书馆系统中的心理努力[32],同时可以证实信息检索过程中用户的平均认知负荷是动态变化的[37,53-54]。

(7)信息系统

有1篇文献研究了信息系统中的认知负荷——Ana等采用生理测量法验证了隐性神经生理状态-记忆负荷和分心-显性神经生理状态和挫折-前因在信息系统行为信念的感知有用性和感知易用性形成中产生的相互作用[29]。

通过分析可知,LIS学科中有关认知负荷测量的研究,更多地集中在文档阅读、人机交互和网页搜索等需要考虑认知负荷的学科热点领域中。

3 研究启示

本文分析了国内和国外在图书情报领域中的认知负荷测量研究现状,试图揭示认知负荷测量在相关领域研究中应用的全景与趋势。对44篇重点文献的分析主要涵盖三个方面:测量方法、测量指标和所属领域。总体来说,图书情报领域关于认知负荷测量的研究呈现出融合拓展趋势。

(1)测量方法与研究领域学科特色明显

近年来,用于生理测量的相关仪器(眼动仪、红外网络摄像头等)在学术研究中得到了普及和应用,由于生理测量法客观和可信度高的特性,采用生理测量法进行认知负荷测量逐渐成为图书情报领域中测量认知负荷的热门方法(占比39%),这与心理学领域主要使用主观测量法有明显区别。其中,由于眼动指标获取相对容易,可以精准采集与认知负荷有关的信息内容,所以在图书情报领域中采用眼动指标的测量占比高达27%。有趣的是,与生理测量法紧密相连的文档阅读(生理测量法占所有方法的61.5%)和人机交互(生理测量法占所有方法的63.6%)领域也是研究的热点领域。

(2)主观量表研究与使用不够全面

在使用主观测量法对认知负荷进行测量的研究中,有11篇文献都是采用NASA-TLX量表来进行测量,表明图书情报领域研究人员更偏好使用这一量表。有关研究显示,Paas量表容易产生社会赞许效应[48];而NASA-TLX量表更适合测量人类工程学领域高负荷的任务或工作[4]。但是,各种量表对于图书情报领域研究的适用性差异,尚未得到深入研究。

(3)传统的主观评级方法仍有可用性

虽然图书情报领域对于认知负荷的主观测量大都采用心理学量表,但是仍然有两篇文献采用了主观评级的方法来测量被试的认知负荷[8,10]。同时,Merat等研究表明主观评级的方法与生理测量法和任务绩效测量法一样能够敏感地感知到任务难度对于绩效的影响[49]。因此,传统的主观评级方法在图书情报领域研究中仍具有一定的适用性。

(4)新颖独特的行为测量法有待重视

尽管其他很多学科中并未将行为测量法纳入测量认知负荷的方法体系,但图书情报领域对认知负荷进行测量时,较多地使用了行为测量法。例如,电子医疗和网页搜索领域有研究使用了其中的口语特征提取法[39,12],交流沟通领域中有研究通过抽取语言及语法特征对认知负荷进行了测量[7],而人机交互领域中有研究分别通过对手写的笔迹压力、时间、空间、角速度以及声音特征的抽取来测量认知负荷[6]。这些应用体现了图书情报领域的特色。但是仍有很多认知负荷相关行为未得到重视,如鼠标点击与键盘按键行为等。

(5)综合测量方法是主要发展趋势

生理测量法和行为测量法不能直接揭示被试的心理感知[50],主观测量法容易掺杂过多的个人因素,而任务绩效测量法受到导入次任务方法的干扰[51]。Ryu等[52]发现综合指数较单项指标能更准确地区分不同难度任务中被试的负荷水平。因此,综合利用多种方法进行认知负荷测量,近年来越来越受到图书情报领域的重视[12-13]。

4 结论

准确、有效地测量信息处理过程中作业人员所产生的认知负荷已成为情报学研究的一大热点。本文从WebofScience数据库的LIS学科中筛选出有关认知负荷测量的英文论文并在Springer等数据库中进行全文检索,同时从中国知网的图书情报与数字图书馆学科中筛选出相关中文论文,从测量方法、测量指标和研究领域等三个方面进行梳理和分析,可以掌握认知负荷测量在情报学中的发展现状、热点和趋势,最后总结了五点对于图书情报领域的研究启示,可以看到情报学区别于其他学科在研究认知负荷测量的侧重点和特色。

从文献数量可以看出,国内对于认知负荷测量的研究不如国外广泛、深入,因此通过对国外相关研究的梳理可以为国内认知负荷测量的发展提供良好的参考和借鉴。同时,情报学作为一门交叉学科,其他学科诸如心理学、工程学的重要研究进展可以被情报学融合和利用,这也是今后需要关注的重点。

猜你喜欢

测量法生理主观
“美好生活”从主观愿望到执政理念的历史性提升
加一点儿主观感受的调料
打破生理“平衡”
基于BP神经网络的旋转血泵生理控制
刑法主观解释论的提倡
基于比较测量法的冷却循环水系统电导率检测仪研究
妈妈们产后的生理烦恼
垂直面内建立基线的特殊点位高程测量法
航空摄影测量法在农村土地确权登记发证工作中的应用分析
“DIY式”小创新在神经电生理监测中的应用