高校图书馆用户信息浏览行为研究*
2021-12-13叶新友张路路孔成果
叶新友 张路路 孔成果
(1.江南大学图书馆 江苏无锡 214122)(2.中央财经大学图书馆 北京 100081)
用户在查找信息时,最主要的两种行为方式是检索与浏览。用户通过检索与系统进行交互,通过浏览对系统所反馈信息进行判断[1]。高校图书馆为用户提供了丰富的馆藏资源,通过分析用户浏览行为有助于促进图书馆系统在资源导航和定位方面与用户需求进行对接,提升用户对资源的发现度和满意度,达到资源利用最大化的目的。
1 信息浏览行为相关研究现状
图书情报领域对用户信息浏览行为的研究起源于20世纪20年代,最初主要关注用户在学校浏览室的浏览行为[2]。随着信息技术的发展,越来越多的研究者不再局限于用户在实际物理环境下的浏览行为,而更多地将关注点转移到虚拟环境下的浏览行为,侧重于探讨用户信息浏览行为的定义、类型及影响因素。
研究者从元理论和认识论的角度出发,将信息浏览行为归为生物驱动型和理论导向型两类。生物驱动型是美国著名情报学家Marcia J. Bates[3]所提出的,她从行为论角度出发,将用户信息浏览行为视为生物演化史中动物觅食的探索性行为,是探索性行为认知和活动表达的具体形式,它包含了大量并行处理式活动,如扫视、选择、检验、获取、放弃等具体活动。而理论导向型是丹麦著名情报学家Birger Hjorland[4]所提出的,他以历史主义和诠释学认知论为基础,将信息浏览行为视作一种系统性、探索性行为。这种行为受到用户元理论或范式的支配,而这种元理论或范式是社会、文化、专业等因素综合作用的产物。他认为用户浏览行为实际是用户所具备的理论、预期和主观性共同塑造的导向策略。王琳等人[5]借助于眼动仪实验,对信息浏览行为的本质进行探索,结果发现用户在浏览日常生活信息网页时信息浏览行为不具备显著差异,符合Bates的生物驱动型理论,而在浏览本专业信息网页、非专业信息网页时行为有显著差异性,符合Hjorland的理论导向型理论。
由于对信息浏览行为的定义不同,信息浏览行为也演化为不同的浏览方式。Hoffman等人[6]根据用户是否有明确目标,将信息浏览行为分为目标型导向浏览和非目标型导向浏览两种。目标型导向浏览认为用户可以借助于浏览来获取所需信息,这类用户往往具有较强的目标性,伴随着浏览行为的发生,浏览策略会围绕着目标进行调整。目标型导向浏览行为包括用户检索、对于信息筛选、评价以及信息追踪等,用户通过不断浏览接近检索目标满足信息需求。如Prefontaine等人[7]在研究基于用户浏览的系统功能设计时,将用户浏览行为定义为“用户与信息空间进行交互的一系列动作”。非目标型导向浏览认为用户浏览行为是一种信息偶遇,缺乏计划性。这类用户的信息需求往往比较模糊,浏览行为比较随意。非目标型导向浏览包括用户的游走行为、信息偶遇、对于信息的扫视以及略读等。如Marchionini等人[8]将用户浏览行为视为一种探索性信息搜寻策略。Carmel等人[9]根据用户是否具有明确的浏览目的,将浏览行为分为查询式浏览和偶遇式浏览两种。查询式浏览是指用户有一个查找目标,根据这个目标来浏览系统所反馈的信息。偶遇式浏览是指用户没有目标,只是尝试着通过浏览来发现一些信息需求。Apted等人[10]根据用户目的明确程度不同,将用户浏览行为分为特定性浏览、一般目的性浏览以及一般性浏览三类。特定性浏览是指用户有明确目标,并采用一定的检索策略来实现信息搜寻的浏览。一般目的性浏览是指用户为发现一些新的、非特定的信息而进行有计划或者无计划的浏览。一般性浏览是指用户非常随意的、没有目的同时具有消遣倾向的浏览。邓小昭[11]根据用户浏览时超文本链接技术的不同,将网络用户浏览行为分为页内浏览、页面间浏览和系统间浏览三种。页内浏览是在同一个页面内进行浏览,页面间浏览是在同一系统中不同页面浏览,而系统间浏览是指用户通过超链接在不同系统间进行跳转浏览。
对于浏览行为影响因素的研究主要涉及用户因素和系统因素两方面。用户因素包括用户年龄、职业、所具备的专业知识、检索经验、学习态度[12]、心智模型[13]等,如Marchionini等人[14]在研究初学者的信息浏览行为时,发现用户检索经验越丰富其浏览行为频次越少。系统因素包括用户上网费用、资源、系统软件、传输速度、网页质量、人机界面等[15]。如Schmidt等人[16]在研究用户信息检索行为时,发现用户浏览行为受网络传输速度的影响,网络传输速度越慢用户浏览行为频次就越少。
综上所述可知,用户浏览行为研究主要关注于用户浏览行为的定义、分类以及影响因素,对浏览行为规律的探索较少,尤其是在特定情境下特定用户的信息浏览行为研究更加有限,同时也缺乏系统探索。因此本研究以Hjorland[4]的理论导向型浏览为基础,以高校图书馆用户为研究对象,探索其信息浏览规律,为研究用户信息行为做理论补充,同时为图书馆系统改进提供数据支持。
2 实验设计及数据编码
本研究以用户信息行为理论为基础结合已有图书馆用户信息行为[17]研究,参考高校图书馆用户真实日志数据,模拟了事实型、探索型和抽象型三类五个检索任务,具体如表1所示。在某大学随机征集30名[17]在校学生为被试,完成相应的检索操作并通过屏幕录制软件记录整个过程。
表 1 图书馆用户信息行为检索任务类型
进一步参考曹梅[18]网络信息浏览行为研究中对用户关键行为的定义,结合图书馆具体情境,将用户浏览行为分为结果列表浏览行为、结果页面浏览行为及相关判断三大类,并对各行为进行编码,具体定义如表2所示。
表 2 图书馆用户浏览行为编码
3 测试结果的数据统计
3.1 基本浏览行为特征
对被试的浏览行为进行编码,得到3655次浏览行为(见表3),平均每位被试在完成一个任务时会出现25次浏览动作。在用户浏览动作中,结果列表浏览行为出现频次最多,共1929次,占全部浏览行为的52.78%;其次是结果页面浏览行为1519次,占41.56%;相关判断浏览行为仅仅出现了207次,占全部浏览行为的5.66%。用户浏览行为特征体现了用户选择和判断的过程。运用SPSS统计分析软件对同一被试在不同检索任务下的浏览行为进行单因素方差分析,得出同一被试在完成不同检索任务时浏览行为不存在显著性差异,这表明用户在完成同一类型检索任务时其浏览行为有相似性和规律性。
在全部浏览行为中,出现最多的是结果集的鼠标操作,为1231次,约占全部浏览行为的三分之一。其次是结果页面的鼠标操作591次和返回到另外结果279次,分别占全部浏览行为的16.17%和7.63%。无论是结果集的鼠标操作还是结果页面的鼠标操作,均表明用户对检索结果的查看筛选过程。
(1)结果列表浏览。用户对结果列表的浏览行为,表明了用户对图书馆系统所反馈信息进行了初步的筛选。通过对用户结果列表浏览行为的分析,可复刻出用户的浏览行为轨迹。在结果列表浏览行为中,对结果集的鼠标操作动作是最多的,共出现了1231次,占全部结果列表浏览行为的63.82%。其中下滑动作出现频次最高共计779次,而上滑共出现了452次。其次是对结果集的浏览行为共出现了214次,占全部结果列表浏览行为的11.09%。对结果集的浏览行为分为点击上一页和点击下一页两个动作,其中用户点击下一页的动作共计180次,而点击上一页的动作出现了34次。在结果列表的浏览行为中,通过操作浏览器的浏览行为出现频次最少共计144次,占结果列表浏览行为的7.47%。
表 3 用户浏览行为频次及比例统计
(2)结果页面浏览。在结果页面浏览行为中,对结果页面的鼠标操作是出现最多的共591次,占结果页面浏览的38.91%。其中下滑动作为366次,上滑为225次。在结果页面的上下滑动行为表明了用户对于结果页面所呈现出的信息仔细阅读并进行筛选的过程。其次是返回到另外的结果共出现279次,占结果页面浏览行为的18.37% 。而出现频次最少的是对单一结果的浏览,仅为20次,占结果页面浏览行为的1.32%。这表明用户在使用图书馆网站查找资源时,在结果页面进行“上一页”“下一页”的跳转行为较少。
(3)相关判断浏览。在相关判断浏览行为中主要分为两类:一类是用户已经明确该检索结果是最符合用户检索需求的,因此会通过下载、标记等行为来显示检索完成。另外一类是用户对相似检索结果进行比较,通过不断比较来选择最合适结果。本研究中用户对于检索结果的最终判断行为出现频次最高,共计126次,占相关判断浏览行为的60.87%。其中下载行为出现了118次,而标记行为仅出现了8次。这表明用户更倾向于采用直接下载的方式来结束检索过程。用户的结果比较浏览行为共出现了81次,占相关判断浏览行为的39.13%。用户的结果比较行为表明了用户对于结果的判断过程,用户首先选择出比较符合需求的信息,再通过比较最终选择出符合需求的信息资源。
(4)结果点击行为。用户对结果进行点击表明对结果产生兴趣。通过对用户点击结果所处位置进行统计,不仅能了解用户的浏览习惯,也能对系统结果的呈现起指导作用。统计发现,约有28.32%的用户会选择图书馆系统反馈的第一个结果,而点击前五个结果的比例占到了全部结果点击的71.93%。点击结果位置排在20以后的仅有9.77%,这表明用户往往倾向于选择系统反馈排在前面的结果,因此系统反馈结果的排序会影响用户满意度。
(5)翻页滑动行为。用户浏览翻页行为不仅表明用户浏览习惯,同时也反映用户在信息浏览过程中与系统的交互心理。在本研究中共出现了525次翻页行为,对于每个检索任务而言,平均的翻页数为3.5页。在浏览信息资源时,有57.33%的用户只浏览了图书馆系统检索结果首页。约有30%的用户存在连续翻页行为,其中80%的用户翻页数量长度在1—3页之间,仅有20%的用户翻页数量超过了4页,用户最长翻页数量为10页。
浏览滑动行为代表了用户对于系统所呈现结果进行筛选的过程,在全部浏览行为中,滑动行为共出现了2217次,占比为60.66%,因此研究高校图书馆用户的浏览滑动行为对于探索用户浏览行为有至关重要的作用。对用户滑动行为进行统计,发现用户的滑动过程分为两种类型,一种是直线型,即当用户看到系统反馈的检索结果时,只会选择下滑,通过不断地浏览检索结果而做出判断。而另外一种是折线型,即用户先选择下滑,当浏览到某一个检索结果时停止下滑,再选择上滑的方式来重新判断已浏览过的结果。
3.2 浏览行为模式
由于高校图书馆用户的浏览行为各不相同,其浏览路径的深度和广度也存在明显差异性。用户的信息浏览行为具有演化性,在分析用户的不同浏览路径基础上,研究总结出了高校图书馆用户的三种浏览行为模式,分别是直线型浏览模式、回路型浏览模式以及混合型浏览模式。
直线型浏览模式包括缩减型浏览模式和平移型浏览模式两种。缩减型浏览模式是指用户在整个浏览过程中所浏览的信息内容一直处于缩减状态,同时浏览深度在不断增加。如被试21在检索图书《C语言程序设计》(谭浩强,清华大学出版社2014版)时,其过程为“WRD=(C语言程序设计)”→“WM=1”→“W=2,I=(C语言程序设计)”→“IRLW=(年份:2014)”→“IRLW=(作者:谭浩强)”,在这个过程中用户键入所有词“C语言程序设计”后对结果列表进行了下滑操作,然后点击列表中的第2个结果“C语言程序设计”进入结果页面,随后点击旁侧的相关搜索“年份:2014”“作者:谭浩强”进行限定,获取到所需结果。平移型浏览模式是指用户所浏览的信息内容属于同一个主题,信息之间有交叉,但不存在包含与被包含之间的关系,或者用户浏览信息是同一个主题的不同方面。如被试9在完成励志类相关题目时整个的过程为“WTI=(心灵鸡汤)”→“WM=1”→“WM=2”→“WM=1”→ “WM=2”→“WM=1”,用户在输入题名关键词“心灵鸡汤”后对系统所反馈的结果列表进行了下滑、上滑、下滑、上滑、下滑的操作后结束了浏览行为。
回路型浏览模式包括回溯型浏览模式和环路型浏览模式两种。回溯型浏览模式是指用户首先进行直线型浏览,当浏览到某一个结点后开始后退,最终返回到最初浏览页面。在整个浏览路径中,每个结点用户都浏览了两次。如被试23在完成励志类相关题目时整个的浏览过程为“QO=(励志小说)”→“WM=1”→“W=4,I=(把命运交给一枚硬币)”→“ISM=1”→“ISM=2”→“ISB=2”。在这一浏览过程中用户先输入检索词“励志 小说”,然后在网页列表页面中鼠标向下滑动,然后点击了系统所反馈列表中的第4个结果“把命运交给一枚硬币”,然后在单一结果页面中鼠标先下滑,后上滑,随后点击前面已经浏览的结果页面返回上一页,结束浏览。环路型浏览模式是指用户进行直线型浏览,但最终跳回到最初的浏览页面,在整个浏览路径中只有起始页面和结束页面相同,而其他浏览页面均不相同。如被试6在完成励志类相关题目时整个的过程为“WTI=(励志)”→“W=1,I=(佛陀传:12个疗愈身心的故事)”→“ISU=2”→“W=2,I=(龙永图白岩松:中国再启动:在大国励志中重建信仰)”→“ISU=2” →“WM=1”。在这一浏览过程中用户先输入题名关键词“励志”,然后点击了系统所反馈列表中的第1个结果“佛陀传:12个疗愈身心的故事”,在结果页面中选择后退,对结果列表中的第2个结果“龙永图白岩松:中国再启动:在大国励志中重建信仰”进行点击后又选择后退,返回到结果列表页面,进行了下滑浏览。
混合型浏览模式是指用户的整个浏览路径中包含有两种或两种以上的浏览模式,根据所包含的浏览模式不同,分为折线型浏览、铁环型浏览以及交叉型浏览三种浏览模式。折线型浏览模式是指用户浏览路径中包含了直线型浏览和回溯型浏览两种模式。如被试9在查找与雾霾相关的研究报告时浏览路径为“QO=(雾霾治理)”→“WM=1”→“WM=2” →“WM=1”→“W=1,I=(中英雾霾治理的条件对比研究)”→“IRLT=(在线查看)”→“ISB=2” →“ISB=2”→“WM=1”→“WM=2”。在这一浏览过程中用户先输入全部字段“雾霾治理”,通过鼠标的下滑、上滑、下滑,对系统反馈的结果列表有所了解,点击系统所反馈列表中的第1个结果“中英雾霾治理的条件对比研究”,然后在单一结果中点击了相关链接,随后选择返回上一页,返回到“中英雾霾治理的条件对比研究”的结果页面,然后继续选择返回上一页,回到结果列表页面,随后用户对结果列表页面反馈的结果进行了下滑和上滑的浏览。铁环型浏览模式是指用户浏览路径中包含了直线型与环路型两类,如被试16在查找与大数据相关的书籍时整个浏览路径为“QO=(大数据)”→“QC=(大数据时代)”→“ISU=2”→“W=1,I=(块数据 大数据时代真正到来的标志)”→“ISM=1”→“ISM=2” →“ISB=2”→“W=2,I=(DT时代从“互联网”到“大数据x”)”→“ISM=1”→“ISM=2”→“ISB=2” →“W=5,I=(大数据 小故事)”→“ISM=1”→“ISM=2”→“ISB=2”→“WM=1”→“W=10,I=(全面回忆 改变未来的个人大数据)”。在整个浏览过程中用户首先检索了“大数据”,然后调整了检索词“大数据时代”,随后又后退到“大数据”的结果列表中,点击了系统所反馈列表中的第1个结果“块数据 大数据时代真正到来的标志”,在结果页面通过鼠标下滑上滑之后选择后退,对结果列表中的第2个结果“DT时代 从‘互联网’到‘大数据x’”进行点击浏览后又选择后退,对结果列表中的第5个结果“大数据 小故事”进行点击浏览后又选择后退,对结果列表进行鼠标下滑,继续点击结果列表中的第10个结果“全面回忆 改变未来的个人大数据”结束了整个浏览过程。交叉型浏览模式是指用户浏览路径中包含了缩减型、平移型、回溯型和环路型四种浏览模式中三种及以上的模式。如被试1在完成励志类相关题目时整个浏览路径为“QO=(遇见未知的自己)”→“W=2,I=(遇见未知的自己:都市身心灵修行课)”→“ISM=1” →“ISM=2”→“ISB=2”→“WM=1”→“W=2,I=(遇见未知的自己:都市身心灵修行课)”→“ISB=2” →“QC=(当下的力量)”→“WM=1”→“W=4,I=(当下的力量:新版)”→“ISB=2”→“SC=3(木铎检索)”→“OO=(全部字段),QO=(遇见未知的自己)”→“WM=1”→“WM=2”→“WM=1” →“WS=1”→“IRLW=1(心理健康)”。在这一浏览过程中用户首先选择“所有词”为检索点,输入“遇见未知的自己”作为检索词,然后点击了系统所反馈列表中的第2个结果“遇见未知的自己:都市身心灵修行课”,然后在单一结果页面中鼠标先下滑后上滑,随后点击前面已经浏览的结果页面返回上一页,在结果列表鼠标进行下滑,然后继续点击了系统所反馈列表中的第2个结果“遇见未知的自己:都市身心灵修行课”,随后点击前面已经浏览的结果页面返回上一页,用户调整检索式,输入“当下的力量”,然后鼠标在网页列表页面进行下滑,点击系统所反馈列表中的第4个结果“当下的力量:新版”,随后点击前面已经浏览的结果页面返回上一页。用户重新调整了信息检索源,选择“木铎检索”作为新的检索源,用“全部字段”作为检索点输入检索词“遇见未知的自己”,然后鼠标对反馈结果列表进行了先下滑,后上滑,随后再下滑的滑动,并点击“下一页”对结果列表进行了翻页,最后点击结果列表旁侧的分栏“心理健康”结束了整个浏览。整个过程综合了先缩减、再环路、然后再平移三种模式。
用户浏览行为模式充分体现了贝茨的拾野莓模型。用户通过一系列的偏好选择,不断地调整认知思考方向和浏览策略,最终获取到所需信息。根据上述对用户浏览行为模式的总结得到表 4。
4 高校图书馆用户信息浏览行为数据分析
通过对高校图书馆用户浏览行为的统计分析和内容分析,本研究从基本浏览行为特征和浏览行为方式两个维度出发,对高校图书馆用户信息浏览行为进行分析与讨论如下。
(1)基本浏览行为特征。首先,在不同浏览行为类别上,用户对结果列表的浏览行为出现频次最高,其次是结果页面浏览和相关判断浏览。在结果列表浏览中,对结果列表的鼠标动作出现频次是最多的,尤其是下滑动作,这表明了用户在信息浏览过程中对于结果列表的筛选过程。在用户结果页面浏览行为中,鼠标滑动操作也是出现频次最多的,而在相关判断浏览中,用户对于最终结果的判断行为出现频次最多。其次,从整体关键行为出现频次出发,得到了用户高频信息浏览动作和低频信息浏览动作。高频信息浏览动作包括:结果列表的鼠标操作、结果页面的鼠标操作以及返回到另外结果的操作。而低频信息浏览动作包括单一结果的浏览操作、跟踪来源网站以及结果比较操作。根据信息觅食理论的阐述,在信息浏览过程中,如果用户对于信息线索敏感,则能更高效地完成信息浏览。而用户信息线索的敏感程度受到认知层面的影响,包括用户检索经验、检索主题以及相关性判断标准等。用户在浏览过程中会遇到大量系统所提供的信息,通过鼠标滑动操作来对相关信息进行筛选,高频信息浏览动作符合用户的信息觅食理论。
表 4 浏览行为模式的类型与说明
(2)浏览行为方式。高校图书馆用户倾向于点击排在结果页面前面的结果,约有72%的用户选择点击排序前五的结果,这与王若佳等人[19]的研究发现相类似。王若佳等人在研究用户信息检索行为特征时,发现约有60.17%的用户会点击排序在前三的结果。在翻页滑动行为中,约有60%的用户只浏览结果页面的首页,已有研究中也有类似的发现,如邓小昭[20]在研究互联网用户信息行为特征时,发现有70%的用户只浏览谷歌浏览器所提供的检索结果首页。Jansen等人[21]在研究用户使用Excite搜索引擎时也得到了58%的用户只看检索结果首页的结论。用户在信息浏览行为中点击排序靠前的结果以及浏览结果首页的行为符合Zipf[22]最小努力原则。本研究根据用户浏览路径的不同,将用户浏览行为总结为三种不同的浏览模式,分别为直线型浏览模式、回路型浏览模式以及混合型浏览模式。进一步细化得到直线型浏览模式包括缩检型浏览和平移型浏览两种。回路型浏览包括回溯型浏览和环路型浏览两种,而混合型浏览模式分为折线型浏览、铁环型浏览和交叉型浏览。
5 结语
上述研究结果丰富和完善了高校图书馆用户的浏览行为研究理论,同时对图书馆系统优化、用户信息培训等内容提供针对性的建议,具体包括:
(1)丰富用户浏览行为理论。通过对高校图书馆用户浏览行为的基本统计及浏览行为模式的归类和划分,为进一步探讨不同类型的浏览行为方式以及其形成原因奠定了理论基础。通过对用户基本浏览行为特征的统计分析,了解了用户信息浏览行为基本规律。通过对浏览行为方式的分析,提炼了高校图书馆用户信息浏览行为特征,同时根据浏览路径归纳了浏览行为的不同模式,为进一步探讨高校图书馆用户信息行为提供了理论基础。
(2)改进图书馆系统功能。①根据高校图书馆用户信息浏览行为的规律性,从结果点击、翻页行为、滑动行为方面构建完整的用户浏览行为路径,创建用户浏览行为模式识别规则,为系统自动识别用户浏览行为模式创造基础条件。同时系统借助意图推断[23]技术结合用户浏览内容,向用户进行个性化推荐。②增强动态导航功能,用户在浏览不同页面时,系统提供不同的动态导航信息。如当用户在结果列表页面进行浏览时,系统应提供涵盖范围较大、类别较粗的信息,而当用户在单一结果页面浏览时,系统应提供涵盖范围较小、类别较细的信息。
(3)完善信息素养培训内容。在高校图书馆用户信息素养培训中,加强用户对于图书馆网站的熟悉程度,减少其在浏览过程中由于对系统不熟悉所产生的认知负荷。通过游戏、嵌入式教学等方式来提高高校图书馆用户的学习能力,强化用户的信息敏感度。