以用户为中心的可视化数字图书馆评价框架研究
2017-08-10张剑
张剑
摘 要 论文从可视化数字图书馆的定义和资源类型出发,剖析“以用户为中心”的可视化数字图书馆评价的必要性,在总结前人研究的基础上,融入跨领域的人机交互、数字图书馆和用户界面等要素,归纳总结出一个以用户为中心的可视化数字图书馆评价框架,希望能为图书馆工作提供参考。
关键词 可视化 信息用户 数字图书馆
分类号 G250.76
DOI 10.16810/j.cnki.1672-514X.2017.07.014
Abstract This paper takes the definition of visualized digital library and the resource types as a starting point, analyzes the necessity of evaluating user-centered visualized digital library. Based on the view of predecessors' research, it combines the field of human-computer interaction, digital library and user interface elements etc, and sums up an evaluation framework of user-centered visualized digital library, hoping to provide some references for library work.Keywords Visualization. Information user. Digital library.
近些年,图书馆的馆藏资源,尤其是数字资源海量增加,图书馆用户如何有效地利用馆藏资源成为众多图书馆面临的难题。一方面,用户需要直观、生动、简洁的界面;另一方面,在有限的界面空间里需要充分展示庞大的数字资源的导航。这对图书馆工作提出了更高的要求。信息可视化为解决这些难题提供了良好的对策。信息可视化技术是一种非数值型资源的视觉呈现技术,它将数字资源以一种用户易接受的方式进行展示,为用户提供人工视野和空间感知,解释信息之间的关联,发现海量馆藏资源中的潜在隐性知识,在认知层面组织和管理信息,提高用户对信息的感知能力。目前,国内银多图书馆开始重视可视化技术,并对馆藏资源进行知识化、可视化建设,提供面向各类用户的知识服务,但是在可视化资源建设与服务水平上却无统一的评价标准和指标。对此,笔者提出“以用户为中心”的可视化数字图书馆评价框架,以期为图书馆工作提供一些参考。
1 可视化数字图书馆
数字图书馆联盟给出的数字图书馆定义是提供资源的组织,包括软硬件、网络与专业人员,以一致性、永久性的方式将数字化馆藏进行选择、组织、提供查询、解释、传播与完整保存,以便于这些数字馆藏可以迅速、经济地提供给特定社区和用户使用。数字图书馆研究领导小组人员使用5S(FS)框架来描述数字图书馆,分别是数据流(streams)、结构(structures)、空间(spaces)、情境(scenarios)和社区(societies)。因此,无论从那个角度来看,数字图书馆实质上都是“数字资源的集合”,目的在于为用户感兴趣的主题和领域提供信息访问。
数字图书馆允许用户通过界面对特定领域的信息进行多次循环交互,馆藏范围涵盖不同领域,包括(但不限于)教育、医学、护理、法律、音乐、娱乐、存档新闻、文化遗产等。具体到可视化数字图书馆来说,就是通过交互式检索系统,让用户能够访问和使用可视化数字信息(如图像和视频)。图像馆藏包括原生的或数字化的照片和其他数字图形或图像,这些图像可以是各种不同访问格式和尺寸(从缩略图到全尺寸高分辨率);视频馆藏是指可访问和播放的视频信息,包括完整的电影或节目、场景、基于聚合的片段和故事情节片段等。这两类可视化资源可以与任何数字图书馆进行连接,多次呈现在检索系统中。
2 数字图书馆可视化资源
笔者通过对国内外数字图书馆可视化项目进行调研,发现图书馆界可视化的数据源主要以全文数据库、OPAC资源、论文数据库为主,通常以矩形图、网络图、表格、树状图、饼图等可视化形式显示,可视化特征以大小、位置、面积、颜色等来表示,一般用于用户提问构建和检索结果展示居多。数字图书馆中可以应用的可视化技术资料类型主要有以下四种。
2.1 图书馆资源覆盖范围概览
图书馆馆藏资源覆盖范围、目录或结构,很难通过文字来进行描述,用户难以准确有效地进行提问。可视化以图形方式、颜色差异等对资源集合的构成成分进行概括性揭示,提高了用户感官上对资源的了解,帮助用户进行浏览。此外,丰富的交互功能让用户能够基于所展示的信息对资源进行进一步的探索性操作,可大大扩展用户的知识视野,并提升馆藏资源的利用率[1]。
2.2 用户提问的可视化
让用户更加清楚提问词范圍,更好地进行定位,帮助用户更恰当地进行选择,预览并优化提问。如Visual Thesaurus[2]可视化英语词典,以网状图的方式显示与提问词相关的其他词(同义或反义词),界面右方则有所选词汇的各种意思解释,并且提供发音功能。
2.3 检索结果的可视化
用户通过图形界面与网络信息检索系统进行交互,对检索结果进行多角度分析,优化提问或查询。可视化检索结果远比文字呈现的分类维度直观,能够有效地帮助用户鉴别其组成部分,理解资源之间的关联,探索并挖掘其自身的潜在信息需求。
2.4 用户与数字资源交互行为的可视化
用户与数字资源交互行为的可视化基于对用户在线行为数据的采集,包括用户对检索结果页面的每一次访问、点击、浏览及其他细粒度行为,用来评估数字资源的利用率及导航系统的效率,还可以对用户行为进行分析,从而提供更好的信息服务[3]。
3 可视化数字图书馆评价的必要性
可视化数字图书馆的评估是多层次的。从实践层面来说,比较典型的是TREC视频检索评估(TRECVid)和ImageCLEF图像检索。TRECVid评估尝试对真实世界场景或者这些场景中的重要组件任务进行建模,通过开放的、基于度量的评估,来提升针对数字视频的内容分析和检索技术,被誉为评估可视化信息处理和检索的新方法。ImageCLEF致力于为图片提供一个基准(检索、分类、标注等),它可为特定的任务(从图像处理到图像注释等)创建特定数据集和评价措施,在无人参与的情况下从注释图像列表自动选择图像分析和概念。从应用层面来说,可视化数字图书馆的评估主要是对数字馆藏和数字图书馆的应用进行评估,以及对系统性能的测试,包括响应时间和准确度、用户的交互、认知和图书馆满意度等。可扩展应用程序或人际交互评价指标主要是效率、效果和满意度。
这些评估标准和指标虽然领先其他领域,但是从近些年的技术发展和用户需求现状来看,以用户为中心的评价标准和模式是可视化数字图书馆研究与发展的下一阶段,主要目标是对所开发出的信息系统进行评估。然而这也将引发一系列的问题:开发人员或图书馆员在哪里及如何评估可视化数字图书馆?最初的评估策略是什么策略,又是基于什么?圖书馆员如何决定哪些标准对用户来说是重要的?
目前,以用户为中心的数字图书馆研究方法是具体到特定馆藏、数据化项目和用户组,但会反过来限制其他研究项目适用性,而可视化数字图书馆以用户为中心的研究尚无一般化的评估。
在用户寻找、发现、使用和与信息的交互中,可视化信息资源会产生巨大的变化。已证实用户在给定的情形下进行可视化信息检索时,会通过交互式会话高效地扫描大量代理。因此,除了数字图书馆其他类型(如文本)的评估之外,应该单独评估接口、功能和用户,因为他们属于不同类型的馆藏和视觉信息。
另外,知识环境下要求图书馆必须坚持以用户为中心的服务理念,评价可视化信息检索系统应通过标准化协议、便于实验使用的公共数据集、任务定义和以系统为中心的检索主题。
4 以用户为中心的可视化数字图书馆评估框架
由于可视化数字图书馆的评估缺乏综合性指标,故笔者在前人研究的基础上,融入跨领域的人机交互、数字图书馆和用户界面等要素,提出以用户为中心的可视化数字图书馆评价指标,用于指导相关工作。
4.1 目标及动机
以用户为中心的可视化数字图书馆评估框架设计目标主要有四点。一是形成一个基于单个项目需要,且适用于以用户为中心的可视化数字图书馆的评估框架。二是确定并提出重要的、有影响力的和潜在的交叉重叠实验因素,保证评估作为可视化数字图书馆评估框架的一部分。三是提供不同方法的具体实例,包括数据收集和分析,用于研究评价用户和可视化数字图书馆应用情况。四是为未来以用户为中心的数字图书馆研究提供指导。
实现上述目标将有助于研究人员更好地理解视觉数字馆及与用户的交互(如用户界面),以科学有效的标准形式来进行评估。
4.2 以用户为中心的评价框架
笔者从合成可视化数字图书馆研究中开发出了一个评估框架[4]。图1显示了框架的基本组成构件:用户、交互、系统、领域、主题,组成框架的具体策略和方法可见表1。框架中不同评价组件之间的重叠将会得到很好的解决。
4.2.1 用户
用户是可视化数字图书馆评估框架的一个至关重要的组件,详见表1。由于数字图书馆是交互式检索工具,因此有必要进行面向特定用户和以用户为中心的分析。可视化数字图书馆是由不同的交互系统组成的,因此,支持检索、浏览和可视化信息的评估是衡量用户专业知识和技术水平的一项重要内容。美国学者威尔金斯[5]在2009年指导36个用户凭经验进行检索,跨越多个位置来证明如何提高搜索和检索效率,结果发现在系统的高级检索中,新老用户差别很大。因此,可视化数字图书馆对用户的分析评估需要在特定的情境下进行。有关用户背景或前期经验的数据可以参照表1制定调查问卷进行收集。
②定量分析通常是指统计证据和对某些措施的观察,如用户交互、缩放比例和意见等;定性分析是指用户的某些想法、执行操作情况及原因等
4.2.2 交互
交互是可视化数字图书馆评估框架的重要组成部分,是数字图书馆与其他检索工具交互的基础。可视化数字图书馆的交互评估应该考虑系统和用户界面如何调整用户行为。用户交互评估可以由正在执行的操作进行,包括但不限于频率和类型的搜索、浏览和来自系统的其他请求。可视化数字图书馆评估涵盖各种交互技术手段,包括不同类型的文本检索,如字段检索或视频记录全文检索等,具体到操作而言,可以按颜色、形状、特性和纹理等来进行检索。
浏览是扫描数字可视化信息的一个重要交互技术,它是最常见的交互,在丰富的可视化(如缩略图或关键格)环境下,高效可视化浏览是非常重要的。可视化数字图书馆的用户,尤其是目的明确的用户,通过不同的可视化代理,可以浏览大量的馆藏资源并返回搜索结果列表。
此外,可视化数字图书馆的评估需要测定不同交互预期,包括搜索和浏览行为,以及其他如选择、保存、布局和现实配置和反馈等方法。
4.2.3 系统
系统是评估框架的另外一个主要组成部分。可视化数字图书馆应有高效的、令用户满意的、基于提问的检索结果。其包括检索特定可视化信息的功能,一般情况下,系统和检索效率可以通过多种方式来评价,如响应速度和精准度。使用调查问卷来收集有关可视化数字图书馆有效性方面的数据(见表1),可通过用户对系统的整体效率和检索性能来判断分析跨不同任务的、不同类型或类别的检索主题。
4.2.4 多成分的评估
(1)用户-交互。在评估框架组件中,用户与交互之间有明显的重叠。用户是与数字图书馆相互作用的,因此有关交互的评估离不开用户。在数字图书馆环境下用户的信息需求可能更为详细和精确,这些需求一般是基于特定领域知识和类似经验的集合,因此不同用户,其交互也不同。美国学者韦斯特曼调查不同领域专家的交互,将用户分为“专业人士”和“非专业人士”,发现大多数专业人士在搜索时更频繁地使用以视觉为导向的搜索功能,如颜色;而非专业人士则青睐于浏览和视觉扫描的集合。同时,非专业人士倾向于改变他们的交互方式与方向,专业人士则不断优化其查询[6]。
(2)用户-系统。用户与数字图书馆系统结合的评估见表1。这种评估不仅评价系统与用户结合的有效性,还包括以用户为中心的界面特性、设计和布局及一个数字图书馆的各方面组织。在这里,评估系统主要评价其为预期用户和数字图书馆开发出的适当的情境和域的有效性。更具体地说,可用性和可学习性评估成为框架组件评估的重点,可用性是数字图书馆最重要的属性,评估可视化数字图书馆的可用性包括效率、有效性和满意度。
(3)交互-系统 。交互-系统评价的程度依赖于与数字图书馆检索过程交互的有效性,即在恰当的时间恰当的步骤和情况下可获取的可视化信息或资源,简而言之是“可视化数字图书馆的数据获取效率”,通常通过系统事物处理或系统日志来评价其有效性,包括检索会话的持续时间、访问频率、用户浏览检索结果集合大小。
(4)用户、交互和系统。主要检查用户群组在完成检索主题和一个信息任务时,如何与给定的可视化数字图书馆进行交互。用户对图像需求熟悉程度与检索策略和任务等都是相互关联的。视频也成为类似评估的情境,用户的知识会影响交互(包括可视化检索使用),将产生更高层次的主题检索。
4.2.5 领域和主题
领域和主题组成了评价框架的基本组件。很多时候,这些因素并不是相互排斥的,可视化需求与检索主题应与数字图书馆的领域或情境相吻合。
用户、交互和系统都对检索主题的结构和构成有直接或间接的影响。可视化主题可以组成各种各样的需求,包括基于内容的需求、文本需求、语义视觉需求、抽象视觉需求(如恐惧和愤怒)等。基于现实和多样化信息需求来评价可视化数字图书馆是有价值的,它可以影响到数字图书馆的其他评价。
评价可视化数字图书馆不同类别的检索主题,主要基于以下要素:步骤或请求的数量(即单个和多个);语义和抽象;不同的特征,如视觉、文本或混合需求;不同组合的需求(例如分步语义可视需求)。通常任务越具体,用户查全率越高。
此外,不同用户交互检索结果可能横跨不同主题类型,如查询模型和转换。因此,评价可视化数字图书馆要考虑不同类型的可视化资源是否可以实现跨范围的检索,这对系统检索主题设计将提出更高要求[7]。
领域的不同会影响检索主题或信息需求。有些领域(如艺术,艺术史、新闻摄影等)的专家或专业人士的工作非常依赖视觉资源类型,艺术史领域的数字资源及系统充分展示出了可视化检索评价的潜力。然而,这些特殊性并不代表可视化评价方式适应于其他领域,或是所有其他可视化数字图书馆。例如一个未经删减的视频是可视化馆藏,但其所包含的信息(如一个人的头部特写)可能无法保证对具有相同特点的艺术历史去进行评价;对关于口述历史的视频馆藏,很可能重点放在讲述这个故事上。另外,许多数字图书馆的研究指出了通过快速高效的方式浏览可视化馆藏的重要性,如利用缩略图进行浏览。有学者指出“单点的一个小时长的单人说话视频”和“单点的情节串联图板没有任何导航价值”,即评价一个可视化数字图书馆需要根据领域、任务和馆藏性质来进行。
5 结语
可视化技术引进数字图书馆已经成为一种必然,大多数用户已经适应并专注于用可视化方式浏览和检索数字图书馆的资源,因此如何对可视化数字图书馆进行评价将成为业内关注的焦点,笔者所提出的可视化数字图书馆评价框架能促使研究人员和开发人员从用户的角度来研发可视化资源,从而保证用户使用所熟悉的可视化内容搜索、浏览和优化查询,提高资源的利用率和用户满意度,为國内图书馆提供一些参考。