基于眼动实验的网站个性化推荐系统信息偶遇特征的实证研究
2022-06-06刘春茂张学佳周悦
刘春茂 张学佳 周悦
摘 要:[目的/意义]本研究以具有代表性的在校大学生为实验对象,试图探索用户在不同逻辑的个性化信息推荐系统中信息偶遇的差异。[方法/过程]本研究将信息偶遇和心理学领域的眼动实验相结合,以及定量定性分析相结合,验证了所提出的研究假设。[结论/发现]得到了以下个性化认识:类“知网节”用户维度的推荐系统在网站中信息偶遇效果更明显;用户的信息偶遇行为是一个复杂性系统的黑箱过程,可以通过调试网站的信息构建来提供更好的偶遇机会;揭示出规范算法推荐,避免过度与无序推荐而造成的“信息焦虑与信息茧房”双向叠加“过滤泡”效应的必要性。
关键词:信息偶遇;信息推荐;眼动实验;信息构建;信息茧房
DOI:10.3969/j.issn.1008-0821.2022.05.003
〔中图分类号〕G252.0 〔文献标识码〕A 〔文章编号〕1008-0821(2022)05-0026-12
Abstract:[Objective/Meaning]The representative college students are taken as testees to explore the significant differences of information encounter among the users in different logics of personalized information recommendation systems.[Method/Process]Based on interdisciplinary research of encountering information and eye movement experiment,combined with quantitative and qualitative analysis,hypothesis was verified.[Conclusion/Discovery]The recommendation system derived from user behaviors like“CNKI Nodes”gets more web IE results;Although IE behaviour of users is a black box process of complex system,reasonable information architecture can increase the effectiveness of it;Is is essential to standard the algorithm recommendation to avert“the filter bubble”effect of superimposed“information anxiety and information cocoons”result in excessive disorder recommendations.
Key words:information encountering;information recommendation;eye movement experiment;information architecture;information cocoons
網站个性化推荐已成为网站信息服务的主流,其目的在于关联用户的认识,并连带地获得更多的信息及商品的选购。推荐系统的激励需求、扩大消费的目的所产生的效果如何?在信息不对称的前提下,用户端的“不期而遇”的偶遇效果怎样?尚缺乏用户端的“信息偶遇”视角的实证支持。特别是,2021年9月9日,在国家网信办《互联网信息服务算法推荐管理规定(意见稿)》已公开向社会征求意见的背景下,“去用户选择化”的个性化推荐的用户认知层面的偶遇效果研究就尤为必要了。
1 文献回顾
随着对“偶然发现有用或有趣信息的难忘经历”[1]的信息偶遇的研究不断深入,其研究的内涵与外延不断扩张。相关研究结果表明:“信息偶遇”的本质是“用户在低参与、低预期状态下的一种非线性、被动的信息行为,一般存在于物理环境、虚拟环境和日常生活信息搜索中”[2],而且具有“他目的或无目的、低期望、意外、不可预知等”的特征[3]。显然,造成上述本质与特征的信息偶遇的因素是多方面的,如:个人因素、信息因素、情境因素、环境因素[4-5]。在学者注重相关因素研究的同时,也对包含偶遇在内的用户信息行为进行交叉学科的研究,所得到的模型、环境因素及行为的量表提供了一些可借鉴的经验[6],如:通过心理实验的方法探讨社交媒体环境中的刺激物对偶遇行为的触发机制,旨在揭示刺激物特征与交互行为之间的关系[6]。这些研究对于进一步理解信息偶遇行为、改进信息偶遇研究方法具有重要意义[7-8]。
推荐系统的研究也是随着网站广泛应用后不断发展的持续性的研究,它是信息过滤系统的一种特殊形式,通过分析用户的历史兴趣和偏好信息,推荐系统可以确定用户在项目空间中当前和未来可能喜欢的项目,然后积极为用户提供相应的项目推荐服务[9-10]。目前,该领域的研究主要针对个性化推荐系统的诸多不足,众多学者从当前个性化推荐算法的弊端入手,进行深入的算法研究[11]。
总之,通过以上简洁的文献梳理,可以发现:在对信息偶遇概念及产生情境方面的研究相对成熟,而对信息偶遇的研究方法、工具与手段相对单一;信息偶遇体现了信息与用户关联的效果,是一种客观化的趋势,而研究微观信息组织旨在为信息偶遇找到客观基础的研究尚显不足;与此同时,对个性化信息推荐系统的研究多关注于基于算法及其优化的技术层面上,很少从推荐系统的用户偶遇效果的视角进行交叉学科的综合研究。特别是随着国家对基于算法推荐的网络信息治理的加强,从用户偶遇信息效果的视角进行探索就尤为必要了。2705A005-E220-4297-A60B-57E281FD5708
2 实验研究与设计
2.1 实验目的
本文主要的研究目的即在前期系统研究的基础上,利用眼动可视化(心理学实验中的可视化指标,如:热点图等)的手段对现有的推荐信息系统中的信息偶遇行为效果进行研究。该研究将有助于以实证研究的客观结果支持网络治理及避免盲目的算法推荐的误区,更好地提升用户偶遇信息的体验。
2.2 实验材料及仪器
由于本研究的研究对象为在校大学生群体,选择“知网(CNKI)”“当当网”为实验材料。本研究使用Tobii TX300屏幕式眼动仪。
2.3 实验对象的选择
选择40名被试,其中18~25岁的男、女学生各20名,均为右利手,具有正常的视力(或矫正视力),每位被试每周上网时间超过30小时,“知网”年龄3年以上。而且通过实验的前测,证明所选择被试信息素养的水平无显著差异。
2.4 实验设计及实施过程
2.4.1 实验设计
实验准备阶段:对实验过程及对被试的坐姿、眼部校准等进行说明、示范。
正式测试阶段:以PPT展示指导语,当被试报告他们已完成检索任务并能够回答结构化访谈问题时,眼动仪将结束记录(访谈提纲略)。
2.4.2 实验任务
任务1:假定要完成一个文献总结性的作业任务,要求首先检索西南大学潘曙光的论文《信息偶遇研究》,并随后检索与该论文有关的具有一定扩展性的相关文献。
任务2:假设给定300元现金要求在当当网上购买若干本书,要求首先购入《三体》一书,随后再按照自己的兴趣选择若干本书。
研究假设:不同维度(内容、用户)的推荐系统对用户的网站信息偶遇效果存在差异。
2.5 眼动数据的收集与分析
2.5.1 网站信息偶遇行为的实验数据的指标选择
本实验将规范的眼动实验数据与信息偶遇的行为特征相结合,选择了如下实验数据的指标:
1)注视次数(FC,Fixation Count)[单位:次]:注视次数越多,证明被试对兴趣区内的信息越感兴趣,信息越重要。
2)总注视时间(TFD,Total Fixation Duration)[单位:s]:一个兴趣区(或属于一个兴趣区组中的所有兴趣区)中所有注视点的持续时间之和。总注视时间反映了用户对信息的兴趣程度。
3)视线轨迹图:处于眼动实验过程中,通过眼动仪器完整地记录被试视线运动轨迹的快照,能充分解读被试的行为模式以助于探索用户的心理活动。
4)热点图:形象地通过颜色来反映被试对目标材料的关注程度,直观地观察到被试感兴趣的区域和不感兴趣的区域。红色越深,表示被试在该区域注视的时间越长,兴趣越大,属于热门区域;绿色越浅,则被试注视点个数越少,注视时间也越少,属于冷门区域。
2.5.2 眼动实验的结果与分析
1)基本状况统计:首先通过实验的前测,测试被试信息素养的水平(因篇幅省略);其次,利用眼动追踪技术研究被试分别在两个不同网站上的信息搜索过程;最后,在前续的基础上,采用实验后访谈法,探讨被试对信息偶遇的态度。对于被试偶遇程度的评分,标准如下:如被试仅注视时间超过平均注视时间则记为★;如被试注视时间与注视次数均超过平均数,则记为★★;如被试不仅注视时间与注视次数超过平均数,且在实验后访谈也认为自己发生了信息偶遇,则记为★★★,若不符合上述条件,则记为☆。研究假设(用户维度的推荐系统的信息偶遇效果更明显)通过实验数据得到证实,整理结果如表1所示。
从表2可以看出,实验一、实验二的20名被试中,表面化的组内数据表明两组均较好地体现了偶遇效果。然而,两个不同逻辑算法的同质性被试的内在比较结果如何?哪种推荐方式更利于引起被试的注意以及其显著性差异的因素有哪些?通过眼动实验仪所获得被试的基础数据后,利用SPSS 25.0对收集到的数据做出独立样本T检验。
2)SPSS分析:表3显示了所有被试的基础数据的独立样本T检验结果(只列出存在显著性差异的项目)。
其中,总注视时间和注视次数的F值未达到显著水平(Sig.>0.05),接受两总体方差相等的假设,选择“假设方差相等”的Sig.(双侧)值。此时,总注视时间和注视次数的Sig.(双侧)值均小于0.05,存在显著性差异。因此,本实验着重选择总注视时间和注视次数这两个指标进行研究。两组各20名被试的实验结果表明:从最大值上来看,知网注视时间(413.93秒)高于当当网的总体注视时间(219.5秒),且注视次数(1 503次)高于当当网(932次);从均值上来看,知网的注视时间(162.954秒)高于当当网的注视时间(100.574秒),并且注视次数(660.5次)明显比当当网的注视次数(427次)高。上述数据说明,在线用户对当当网的整体注视度低于对知网的整体平均水平。
总注视时间与注视次数反映了被试对内容的关注程度,也是后续挖掘偶遇效果的切入点。结果表明:被试用户在不同类型的网站上的信息偶遇行为存在差异。从总注视时间和注视次数来看,同质性被试的学术网站的注视度均超过电商网站的注视度。这说明不同的个性化推荐算法及逻辑对用户的信息关注度有不同的影响,基于“知网节”的信息组织方法有其内在优势。基于临近算法的电商类网站个性化推荐的相似信息的过度发散容易造成用户注意力的弱化。网络信息构建的形式及要素也会造成用户信息浏览行为及轨迹的变化。眼动追踪技术的方法有助于客观地描述用户信息浏览行为的过程,以进一步探索形成關注与偶遇结果的信息构建维度的因素。
3)轨迹图和热点图分析:
①轨迹图分析:
实验一的眼动轨迹图集成了4名具有代表性的被试的眼动轨迹路线。每种颜色分别代表1名被试。图1揭示了4名被试不同的行为模式:蓝色被试的视线首先集中于检索出来的文章上,视线很快转移到页面下方的、从中外文题录数据库中选取的与本文相关的参考文献部分(推荐系统),长时间的视线驻留说明进行了详细的阅读,但对于页面左侧的推荐系统只是一扫而过,并未给予充分的注视;紫色被试最开始大量的视线集中于所搜索文章的摘要部分,随后视线转移到页面左侧的知识网络推荐系统(该系统可提供与所检索的文章相似的文献以及该文章作者的其他文献),而该被试对于页面下方的推荐系统几乎没有关注,与蓝色被试刚好相反;黄色和绿色被试行为模式基本相同:这两名被试与前两名被试最重要的区别就是他们完全没有注意到该页面上的推荐系统,视线范围较狭窄,主要围绕着所检索文章的文字进行注视。纵观4名被试的视线轨迹图可以发现:总体呈现出“上下”“左右”“右左”交替的规律性扫视轨迹,推荐系统一定程度上发挥了作用,且值得注意的是:在所检索出的文章右侧的图片部分,4名被试均很少注视,这说明在学术类型的网站中,图片的出现并不能吸引用户的注意力,这是学术网站的性质以及用户的检索目的所导致的。2705A005-E220-4297-A60B-57E281FD5708
实验二的眼动轨迹图整合了4名具有代表性被试的眼动轨迹。每种颜色代表1个被试。总共有4个对象的眼动轨迹图(蓝色、紫色、红色和黄色)。可以看出4名被试的行为模式不同:蓝色被试视线
首先集中在页面顶部颜色鲜艳的大幅图片上,随后回归了检索任务,视线转移到了检索框上之后并注意到了页面左侧的推荐系统中科幻小说一栏,最后视线在页面中央的主编推荐部分来回快速地跳视。紫色被试与蓝色被试最大的区别是:没有一开始就直奔检索栏,而是注视了主编推荐的东野圭吾的一本小说良久,随后看到了右侧的精彩专题推荐部分,在简单地浏览主编推荐内容后,最后视线在左侧的分面分类栏中一扫而过却没有点击进入;红色被试是4名被试中信息偶遇效果最明显的一位,首先该被试是总注视时长最高的一位。其次,页面中所有的推荐系统该被试均注意到了并且停留了一段时间,这一行为正是网站设计者所希冀的,可以说该被试某种意义上来说是超级信息偶遇者。该被试除了完成检索任务之外最后还购买了20本书,在所有被试中的购买数量处于前列;黄色被试在4名被试中总浏览时间最短,视线范围较狭窄,主要集中于主编推荐部分的最后一行。通过结合后期访谈得知,该被试平时对散文抒情类书籍感兴趣,而实验网站主编推荐最后一行恰好是散文抒情类书籍,故驻留时间较长。除此之外,该被试对页面中的各部分推荐系统均未充分注视。
可以发现4名被试对网页中出现的图片或多或少均有关注。这说明,在电商网站中,图片的作用很重要,会吸引用户的注意力,刺激用户发生信息偶遇从而增加网站销量。同时,4名被试中只有1人注意到了左侧的分面分类导航系统,或许说明电商网站中的导航系统不是主流查询渠道。
两组实验的轨迹图整体上表明:①“知网”推荐系统的作用明显大于“当当网”的作用,电商网站的图片等视觉效果的元素更为有利;②用户注视网页的轨迹有其习惯性特征,对网站的导航系统等信息构建的布局有一定的指导意义。
②热点图分析
热点图主要以绿色、黄色、红色3种颜色为主,红色越深,表示被试在该区域注视的时间越长,兴趣越大,属于热门区域;黄色、绿色越浅,则被试注视点个数越少,注视时间也越少,属于冷门区域。
图3中实验一被试注视的区域从多到少依次分别是红色区域、黄色区域和绿色区域。从该热点图中可以看到:搜索页面的热点分布主要偏向于界面上部文章简介以及左侧知识网络中的相关作者、相关文章等推荐内容,页面底部的视线热点也属于系统推荐内容,只不过与所检索的文章没有关系,属于系统广告。搜索区间出现的热点区域较集中,该现象与任务主导的操作行为有关(被试由于任务会急于寻求目标而减少对界面其他区域的关注)。
图4中实验二被试注视的区域从多到少分别是红色区域、黄色区域和绿色区域。该被试的热点图与相关的视线轨迹图相互支撑。从该热点图中可以看到:该被试主要注视区域为页面中主编推荐部分的书籍,尤其是最后一行同时在新书上架推荐部分和最下面的超值推荐部分都有较长时间的关注。值得注意的是,由于右部多为文字,所以自然没有图片更能吸引用户注意力。
两组实验的典型性热点图表明:①任务驱动了关注热点,“知网”更利于激活用户的认识而发现新内容;②“当当网”基于内容关联的“过度拟合”的推荐容易对用户造成一定的“刻板印象”[12],不利于用户的偶遇。
4)实验结果的认识
①同质性的信息用户在不同类型的网站上的信息偶遇行为差异显著。从总注视时间和注视次数来看,“知网”的注视度均超过“当当网”的注视度;②推荐系统所处的位置在两种类型的网站中均会造成显著影响。位于电商网站上方位置的横幅图片比位于下方的横幅图片更容易吸引人,而位于学术网站左上方的推荐系统也更容易吸引检索用户的注意;③尽管“当当网”推荐系统及图示所占页面较多,但被试注视时长及次数未超过知网,基于过滤技术的推荐偶遇效果值得进一步思考,“知网节”的“用户+内容”的维度应引起重视。该实验结果也逆向表明了一味追求“过度拟合”的电商平台算法推荐结果的过度发散的现实。
为了进一步对上述实验数据进行验证并深度探究隐性的微观个体因素,本研究做了实验后访谈,旨在挖掘客观的眼动实验所未能体现的个体特征部分,以做到客观和主观相结合,从而使研究结果更有说服力。
3 被试实验中信息偶遇状况的深度访谈
每次实验结束后,在精心布置的访谈环境中,对每位被试者进行约10分钟的正式访谈,全程录音,后期整理。
3.1 用户信息偶遇行为的研究对象
本次访谈为眼动实验后访谈,访谈对象和实验对象是完全一致的,如表1、表2所示,既复验了被试的眼动数据,又可微观挖掘被试行为的个性因素。
3.2 用户信息偶遇行为访谈结果的整理与分析
平均每名受访者的访谈时间约為10分钟,获取录音音频共计230分钟,转换文字后最终形成38 785字的访谈资料。将整理好的文本资料按照访谈回答格式规范化处理后导入NVivo12软件中,并基于扎根理论的研究,对原始数据的文本进行编码和分析,编码结果如表4所示。
利用Nvivo12对访谈资料进行逐级编码与分析,提炼出个体认知、信息特征、信息构建。其对应的各子节点情况,如表4所示,((A-Y)表示“当当网”实验中访谈对象,(a-w)表示“知网”实验中访谈对象)。
3.3 访谈结果的认识
通过对40名实验对象的实验后访谈和数据的规范梳理,如表4所示,研究发现:信息偶遇行为受到个体认知、信息特征、信息构建3个核心范畴、6大类型、20余项相关因素的共同影响。而且上述因素在不同类型网站中表现出明显的差异,呈现出非线性复杂系统的特征。作为用户自适应的信息偶遇的行为受表现为复合的相关关系和因果关系的多维因素的约束。本研究的结果表明,不同逻辑的推荐方式及信息构建的形式对用户的偶遇效果具有差异性。这种显性因果关系的揭示表明:优化网站推荐系统及信息构建也是提升用户偶遇机会的合理选择。2705A005-E220-4297-A60B-57E281FD5708
4 研究结果与讨论
4.1 推荐系统系信息生态系统中的重要组成部分
信息生态强调“用户、内容、环境”的整体平衡,推荐系统的导航链接是将信息生态整合的显性形式。用户使用导航系统的视觉轨迹也是有章可循的。用户在浏览推荐系统显著的电商类网页时,注视时间递增至中上区域,出现明显的跳视现象,跳至中部区域,并滚动鼠标在中下区域浏览完信息主体,用递减的注视时间浏览完整个网页;在浏览学术型网页时,在中上区域出现屏幕热区,用户滚动鼠标,浏览完一部分信息后,跳视到中部区域,可能是从一篇论文跳到另一篇论文,在屏幕下方则出现扫视行为。
4.2 页面上部与页面中部为屏幕注视热区集中位置
通过前面的热点图和轨迹图以及屏幕注视数据可以看出,无论是当当网还是知网,被试的视线始终集中于网页中上部分。即使网页下部或中下部分存在推荐系统,也得不到有效的关注,这在知网中表现尤为显著。究其原因,它或许与心理学中的注意力限制理论有关。页面中上部的内容耗费了被试大部分的专注力,被试无暇顾及页面下部的内容,前面提到了在知网中这一点比当当网表现显著,这是因为知网专业性、学术性强,被试加工信息要耗费更多注意力。因此,网站构建者在设计推荐系统时,应把重要的内容放在页面上中部才能做到事半功倍。
4.3 用户的个性特征对信息偶遇影响显著
在被试年龄、教育程度、信息素养基本保持一致的情况下,被试的个性特征(如自身认知、自我需求、情感因素)等主观因素也非线性地影响着信息偶遇的发生。本实证研究也证明了对于同类用户,个性化信息推荐系统的效果在不同类型网站上存在显著差异。
4.4 综合性研究方法的必要性
就信息偶遇的研究方法而言,仅根据眼动实验判断是否发生信息偶遇是不完整的。包含质性研究方法的综合性研究在信息偶遇研究中十分重要,能保证既有客观数据又有主观认识的挖掘。
4.5 个性化推荐系统亟需偶遇的目标定位
目前网络平台的个性化推荐系统的现实逻辑强调基于用户的历史行为界定用户的个性特征,利用关联性的算法去整合推荐内容,强调了所推荐内容的收敛,给用户提供“未知的已知”。信息偶遇强调的是发展逻辑的异质关联,追求内容的发散性的“未知的未知”。在现有推荐系统的框架下,体现利于用户以创新为导向的异质性的思维及内容的发现,则需要个性化推荐系统以实现偶遇效果为其目标定位。
5 研究结论
1)知网的总注视时间、总注视次数、平均注视时间、平均注视次数均大于当当网。验证了所提出的研究假设,即:类“知网节”用户维度的推荐系统在网站中信息偶遇效果更明显。
2)用户的信息偶遇行为是一个复杂性系统的黑箱过程,可以通过调试网站的信息构建来提供更好的偶遇机会。对于学术型信息服务的网站应特别加强知识组织基础上的内容的供给。以异质信息关联为导向的服务对知识创新具有标本兼治之效。
3)受检索效率的约束,用户的信息利用遵循“适度满足法则”。信息提供方需要处理“复杂度”与“准确度”平衡的“信息瓶颈”,用户的信息利用要解决“信息焦虑”与“信息茧房”的“信息悖论”。在供给与需求不甚对称的条件下,本研究结果表明,似“知网节”内容与用户维度的兼顾的“社会语义”推荐理念是面向用户的优化策略。
4)本研究也揭示出优化算法推荐,打破因信息窄化而形成的“认知偏见”,避免过度同质信息获取而造成的“信息焦虑与信息茧房”双向叠加的“过滤泡”效应。
参考文献
[1]刘春茂,袁敬芸,杜雪.信息偶遇研究综述[J].情报学进展,2018,12:248-270.
[2]田梅.移动互联网信息偶遇过程及影响因素研究[D].南京:南京大学,2018.
[3]Erdelez S.Towards Understanding Information Encountering on the Web[C]//Proceedings of the ASIS Annual Meeting,2000,37:363-371.
[4]杨雨琪,刘双燕,尹静,等.在线信息偶遇影响因素模型构建及科学性分析[J].现代情报,2021,41(3):69-80.
[5]杜雪,刘春茂.网络信息偶遇影响因素个性特征的调查实验研究[J].图书情报工作,2015,59(11):119-126.
[6]Makri S,Blandford A,Woods M,et al.“Making My Own Luck”:Serendipity Strategies and How to Support Them in Digital Information Environments[J].Journal of the Association for Information Science and Technology,2014,65(11):2179-2194.
[7]Cole M J,Gwizdka J,Liu C,et al.Inferring User Knowledge Level from Eye Movement Patterns[J].Information Processing & Management,2013,49(5):1075-1091.
[8]刘春茂.网络情报学理论与实践(第1版)[M].北京:中国社会科学出版社,2018:207-247.
[9]Al-Samarraie H,Eldenfria A,Dawoud H.The Impact of Personality Traits on Users Information-seeking Behavior[J].Information Processing & Management,2017,53(1):237-247.
[10]赵鹏,耿焕同,王清毅,等.基于聚类和分类的个性化文章自动推荐系统的研究[J].南京大学学报:自然科学版,2006,(5):512-518.
[11]赵学健,张雨豪,陈昊,等.基于FCM用户聚类的协同过滤推荐算法[J].计算机技术与发展,2021,31(8):6-12.
[12](美)伊萊·帕里泽.过滤泡:互联网对我们的隐秘操纵(第1版)[M].方师师,杨媛,译.北京:中国人民大学出版社,2020:84-100.
(责任编辑:郭沫含)2705A005-E220-4297-A60B-57E281FD5708