APP下载

基于用户画像的图书馆智慧阅读服务研究

2022-04-24蒋兰君

图书馆界 2022年1期
关键词:画像标签图书馆

蒋兰君

(1.中国地震局地震大地测量重点实验室;2.湖北省地震局文献档案室,湖北 武汉 430071)

1 引 言

随着大数据、物联网、人工智能等新兴信息技术在各行业的广泛应用,图书馆作为信息密集型行业,也正在发生着颠覆性的变化,图书馆智慧化是图书馆发展的必然趋势,智慧图书馆的核心是智慧服务。阅读服务作为图书馆服务的基石,也正朝着智慧化方向发展,智慧阅读服务是新兴信息技术在图书馆阅读服务中的应用,是信息化阅读服务发展的新阶段。与此同时,图书馆用户大数据逐渐引起业内人士关注,尤其是构建的数据密集型图书馆用户画像,成为了实现个性化、精准化、泛在化智慧阅读服务的良好工具。但现有的相关成果多是从图书馆某类业务或细分主题的视角开展研究的,缺乏系统的理论构建,也忽略了图书馆服务智慧化的特征。因此,本文将用户画像嵌入图书馆智慧阅读服务体系,构建基于用户画像的图书馆智慧阅读服务框架,以实现阅读服务智慧化。

2 图书馆领域的用户画像

用户画像又称用户角色(User Persona),这一概念最早由交互设计之父Alan Cooper提出,是建立在一系列真实数据之上的目标用户模型,即用户信息的标签化。目前,国内外图书馆领域对用户画像的研究可分为理论与应用研究两大方面,国内较关注用户行为画像模型构建、将用户画像嵌入图书馆服务模型构建等理论研究,国外则在图书馆用户画像应用研究方面较为成熟。

国内图书馆用户画像研究现处于萌芽阶段,在不断探索应用新技术与新算法的进程中前行,研究主题集中于用户画像构建、精准与个性化服务开发、智慧服务研究等方面。在用户画像构建方面,薛欢雪从学科服务角度阐述研究与数据准备、用户标签体系建设、个人或团队用户画像框架设计、优先级别确立、为用户打标签等流程,勾勒出特定情境下的学科服务用户画像。陈添源通过实证研究构建高校移动图书馆用户画像,对不同类型的用户画像特征进行分析,开展差异化服务。在精准与个性化服务开发方面,张钧构建基于用户画像的图书馆知识发现服务模型,以此满足基础表达和传递知识服务需求,更深层次地挖掘数据资源价值,为图书馆用户提供精准化、个性化知识发现服务。刘海鸥等围绕用户基本信息、内容偏好数据、互动数据、会话数据、情境数据五个维度构建图书馆用户画像,实验证明画像模型能够提高图书馆对用户的书目推荐精度,提升图书馆个性化服务水平。在智慧服务研究方面,赵岩认为根据用户画像智能分析结果,能够精准定向地向用户推送阅读资源,改善用户阅读体验,实现智慧阅读推荐。王顺箐将基于用户画像构建图书馆智慧型推荐系统运用到阅读推广中,打破无差别化推广现状,提高阅读推广的精准度。

国外图书馆对用户画像最早的应用个案为英国国家书目和Blaise-line,该个案是通过电话采访和面对面访谈调查用户的使用信息来进行服务优化。目前,国外图书馆对用户画像的研究主题主要集中于信息推荐、算法技术、服务设计等方面。在信息推荐方面,Jomsri基于用户历史借阅信息,运用关联规则构建数字图书馆推荐系统,并通过实验证实该系统在图书推荐方面的适用性。Mao等认为应构建用户标签网络提高用户画像的精确度,以实现更精准的个性化信息推荐。在算法技术方面,Chen等通过分析数字图书馆用户的历史行为构建用户画像,提出一种基于用户行为序列和类型、文献元数据的识别用户兴趣的算法。Liu等认为在用户画像构建过程中,用户特征可以由基于向量空间模型(VSM)的本体表示,结合分类和聚类算法对特征进行选择标签化。在服务设计方面,Koltay等通过对教师、研究生、本科生等群体进行分组访谈搜集数据以构建用户画像,将其应用于图书馆网站设计及World Cat Local和Lib Guides项目的启动实施中。Zaugg等从本科生、研究生、教师的角度构建10个典型的群体用户画像,图书馆馆员可以据此向用户提供个性化推荐服务,注重用户画像与图书馆的发展趋势和模式相匹配,有助于图书馆未来的开发与设计。

综上所述,国内外学者对图书馆用户画像进行了一定的研究,无论是研究理论模型的构建还是研究图书馆服务设计的应用,基于用户画像的图书馆服务研究都是学界的重要课题之一。用户画像作为利用大数据精准定位用户的一种重要方式,符合图书馆个性化、精准化、泛在化的智慧服务理念,被运用到图书馆阅读推荐、阅读推广、知识发现等方面,但现有的研究多是基于图书馆现有业务的流程改进,忽略了新智能技术的应用与图书馆服务智慧化的趋势,尤其是作为图书馆服务重中之重的阅读服务,其智慧化服务缺乏系统性的理论研究。因此,本文将用户画像引入图书馆阅读服务智慧化过程中,构建基于用户画像的图书馆智慧阅读服务框架,以实现图书馆智慧阅读服务。

3 图书馆智慧阅读服务

在数字阅读服务、移动阅读服务等概念之后,智慧阅读服务正成为总括信息技术与阅读服务融合的新概念。目前,国内外对智慧阅读服务研究较少,更多的是关注智慧图书馆、图书馆智慧服务体系整体建设。茆意宏等将智慧阅读服务定义为:基于拥有类人智慧的机器信息技术开展的阅读服务,其内涵是在新兴信息技术的支持下,机器系统能够实时“查看”“倾听”“理解”“交谈”和“分析”读物和各类阅读服务信息,作出准确的判断与决策,并与人交互、融合,实现快速、精准、个性化的阅读服务,满足不同用户的需要,提升阅读服务效果。图书馆阅读服务智慧化主要体现在以下三个方面。

3.1 用户阅读需求的个性化

随着移动互联网络、大数据、人工智能等信息技术不断被应用到智慧图书馆及其智慧服务建设中,用户个性化阅读需求特征也愈发明显。首先,不同兴趣爱好、学历层次、职业、知识结构、行为方式等的用户具有明显不同的阅读偏好,个体阅读行为的差异体现在阅读内容的差异上。其次,不同用户的阅读习惯存在差异,且受到政治、经济、科技、教育、社会风尚等多种因素的影响,不受时间、空间影响的移动阅读已经成为许多用户重要的阅读方式之一。再次,用户移动阅读时所处的情境因素易变,用户阅读需求的个性化还应与当下阅读情境适配,以便用户接收阅读内容,进行深层次阅读,提高阅读效果。

3.2 阅读服务空间的智能化

智慧图书馆的重要一环就是建设一个全面的感知系统,在现代智能技术和智能设备的推动下自动感知数据并对其进行分析处理。基于此,图书馆阅读空间也逐渐向高感知度空间发展,图书馆门禁系统、空间无线定位技术、空间环境感知器、监控设备等可以实时感知用户的阅读行为、阅读环境等。在智能图书馆空间中,阅读资源、设备与用户相互联系,用户可以准确、便捷地定位自己所需的资源以满足自己的阅读、学习需求,无须他人帮助。此外,图书馆智能设备和机器人的使用,如智能图书盘点设备、智能化问答机器人等,极大地提高了图书馆智慧阅读服务的智能化水平,提升阅读服务效能,开创“无人值守”的图书馆阅读空间。

3.3 阅读服务模式的智慧化

图书馆智慧服务即智慧图书馆的智慧服务模式,其目的是实现知识管理与信息增值。智慧馆员是智慧服务的核心,在智慧图书馆建设过程中,一批具有学科背景并经过图书情报专业培训的馆员充分发挥其在图书馆智慧阅读服务中的作用,他们结合内在知识结构与图书馆阅读资源,为用户提供个性化、专业化、集约化的知识服务,培养用户的智慧阅读能力,提升了图书馆的知识服务水平。图书馆阅读服务模式的智慧化更体现在以用户为中心,通过图书馆信息管理系统和各种智能设备实时监测用户的阅读行为需求数据、记录用户阅读倾向,基于用户的智慧阅读服务内容与策略能够随着用户需求的变化动态调整。

4 基于用户画像的图书馆智慧阅读服务

4.1 智慧环境下图书馆用户画像模型构建

用户画像模型从早期仅基于设计师主观假设的虚拟视角构建到大数据时代的数据驱动用户画像构建,其内涵和外延都发生了变化,更注重用户数据的采集以支撑画像结果。智慧环境下,图书馆用户画像构建的特征体现在数据采集的全面感知和智能搜集,RFID、人脸识别、传感器、GPS等智能技术和设备相互协同配合,源源不断地为构建全面、完整的图书馆用户画像提供数据支撑。用户画像构建是一个长期逐步完善的过程,通过分析用户行为为每个用户打上标签,最终勾勒出一个完整的画像,其流程包括数据采集、数据预处理、建立用户标签体系、构建用户画像四个步骤(见图1)。

图1 智慧环境下图书馆用户画像模型

4.1.1 数据采集与预处理。广泛的数据来源是还原用户信息的必要条件,图书馆用户画像的基础数据主要涉及两个方面。一是用户属性数据,包括用户性别、年龄、学历、职业等基本信息,这些数据可以从图书馆系统中的用户注册信息中获取;二是用户行为数据,包括浏览、借阅、下载、座位预约、出入馆时间、参加图书馆活动等动态信息,这些数据涉及多个系统平台的数据统计,还可能涉及线下数据统计,数量大且复杂。对于存储在多个系统平台的用户数据,大部分系统之间是没有关联的,因此,在数据采集阶段,首先要实现各服务系统间的数据整合,这也是图书馆服务智慧化需要解决的基本问题之一。对用户线下数据的统计,应委派专门人员做好此类统计工作,并定期进行检查更新,为更精准、完整的用户画像提供数据支撑。

图书馆用户画像数据来源广泛,包括结构化、半结构化和非结构化的数据,需要对采集到的数据进行预处理。用户属性数据属于结构化数据,一般图书馆管理系统都有读者注册信息模块,因此这类数据较规范、容易处理。用户行为数据中有一部分也属于结构化数据,如登录、借阅、日志等数据。这些数据虽然根据利用需求存储于不同的系统模块中,但存储要求基本统一,存储格式较规范,也比较容易处理。大部分的用户行为数据属于半结构化和非结构化数据,如书目检索系统中的检索数据、门户网站的浏览数据、图书馆微信中的会话数据等。这些数据产生形式、存储方式、格式规范等各不相同,获取与处理相对复杂,因此需要对图书馆的资源及系统平台进行整合,将这些数据分门别类、有序存储到用户原始数据库中,对其进行统一管理,以方便各类数据的集成、清洗等预处理操作。

4.1.2 建立用户标签体系。在数据预处理的基础上,进一步对用户的行为数据进行聚类、关联分析,并为用户打上标签,标签信息可以反映用户的阅读倾向、阅读习惯等。基于用户画像数据类型划分,图书馆用户标签可分为用户属性标签、用户兴趣偏好标签、用户互动数据标签、用户会话数据标签和情境属性标签。用户属性标签来源于用户属性数据,其他标签来源于用户行为数据。用户属性标签主要用于描述用户的基本情况,如用户的姓名、性别、年龄、学历、身份、联系方式等,能够识别用户身份;用户兴趣偏好标签,主要描述用户的页面内容浏览、关键词检索、座位预约、图书借阅、续借等操作行为,能够反映用户在使用图书馆资源与服务时的兴趣偏好;用户互动数据标签,主要描述用户在各类图书馆系统中进行的对图书馆资源与服务的点赞、收藏、评论、分享等活动内容,能够了解用户的使用态度;用户会话数据标签包括用户登录时间、访问次数、资源收藏与下载量等,能够反映用户某些潜在特征;情境属性标签,主要是用户在使用图书馆资源与服务时的时空情境属性,包括时间、地理位置、气候、温度、噪音等客观信息,通过整合时间信息标签,可以反映时间属性对用户兴趣偏好的影响,位置信息可以反映用户对某个图书馆或图书馆某项服务的兴趣偏好,气候、温度等信息可以反映外界环境对用户使用行为的影响。

4.1.3 构建用户画像。经过上述步骤,用户画像构建已经完成了一部分,再利用本体建模的方法构建用户画像模型,即将用户作为本体,其特征作为属性,初步完成标签建模,建立用户个体画像,再应用数据挖掘算法对用户进行关联分析、聚类分析等,完善标签模型,构建群体用户画像模型。个体用户画像是尽可能用全面而详尽的数据去标签一个用户,主要用于图书馆用户个性化服务方面,但是个体用户往往存在数据不完整的情况,无法准确描述用户特征,因此难以实现个性化或精准推荐等服务。由于群体用户之间存在相同偏好,通过构建群体用户画像,将具有相似特征的用户聚类,形成若干个用户群体或用户簇,在提供推荐与定制服务时,能够减轻系统计算与图书馆工作人员压力,提高图书馆服务效率。

4.2 图书馆智慧阅读服务框架

基于图书馆智慧阅读特征分析与图书馆用户画像模型构建,将用户画像嵌入智慧阅读服务体系中,设计基于用户画像的图书馆智慧阅读服务框架(见图2)。该框架以用户为中心,围绕用户建立智慧阅读服务的四大模块,各模块之间互联互通、协同合作,共同实现图书馆阅读服务的智慧化。

图2 基于用户画像的图书馆智慧阅读服务框架

4.2.1 智慧阅读资源模块。图书馆智慧阅读首先要实现阅读资源的智慧化,图书馆馆藏作为图书馆为用户提供阅读服务的物质基础,其智慧化建设应从理念和技术层面开展。首先,智慧馆藏建设应摒弃传统图书馆重“藏”的观念,摆脱人工干预,将重心转移到“用”上。对馆藏纸质图书和非纸质资源进行数据化管理与存储,建立资源丰富、关联性强、检索便捷的图书馆资源系统,再围绕用户群体属性画像进行动态资源配置,通过智能设备与技术实现多元、精准、高效、持续发展的智慧馆藏建设。其次,用户阅读流程中的个性化智慧检索也是图书馆阅读资源智慧化的重要组成部分,图书馆应该根据用户需求提供按条件检索、按时间检索、检索数据、继续精简范围检索、知识元检索等智能检索功能,并根据用户个体属性画像中的属性标签、会话数据标签等进行用户识别,为用户呈现最相关的搜索结果。在用户检索过程中,还可以根据用户对结果的评价和反馈自动校正搜索策略、提供检索建议,最终实现图书馆用户的个性化智慧检索。再次,在面对巨大的阅读资源库时,用户选择难度大,难以实现资源的有效利用。通过将用户画像嵌入图书馆资源推荐系统,根据用户个体属性画像预测用户需求,将用户感兴趣、有价值的阅读资源进行精准推荐,还可以根据用户群体属性画像主动向其推荐群体画像数据库中其他相似用户感兴趣的阅读资源,挖掘用户的潜在资源需求。最后,在信息爆炸式增长的时代,用户阅读需求已经由文献层面开始向细粒度知识层面转化,知识性的智慧阅读服务势不可挡,通过对图书馆海量的信息资源进行统计、分析与挖掘,再根据用户画像定位不同用户的需求,直接为用户提供个性化完整知识产品阅读服务,使用户能够真正享受问题解决式的智慧阅读服务。

4.2.2 智慧阅读空间模块。实体智慧图书馆是一个全面感知的系统,通过视频监控、传感器、移动阅读终端、可穿戴设备等智能设备感知馆内的一切物理情况,采集室内阅读人数、阅读环境,用户阅读内容、阅读方式、阅读情绪等数据,实时调整室内阅读环境,如温度、湿度、照明灯亮度等,为用户创造舒适的阅读空间,增强用户阅读体验,提高用户阅读收益。对于单个用户,进入图书馆时即可对其进行人脸识别,迅速完成用户画像数据库的匹配,准确预测用户未来行为路径、位置变化、阅读需求与模式,并通过室内导航系统引导用户找到路径,实现用户与阅读资源、阅读空间的互联。在智慧阅读空间中,智能机器逐渐取代馆员的工作,最大限度地实现自由化阅读与无人化服务,智能设备可以与用户“交流”以获取用户具体需求,并向用户提供可行阅读方式与路径,用户也能利用便捷的智能技术(如RFID技术、GPS技术)自行获取自己需要的阅读资源,无须馆员干涉。智慧空间也更注重群体智慧,将海量的用户个体画像关联分析,建立起群体属性画像,向具有代表性的阅读用户群体提供智慧化的阅读交流空间,促进个体阅读自组织群体化,激发个体用户隐性知识向群体显性知识转化。此外,围绕用户需求和体验开展的虚拟智慧阅读(如VR阅读、直播阅读)使图书馆阅读空间开始泛在化,为用户创造一个沉浸式的虚拟阅读环境,相比传统阅读可以调动用户的多重感官,同时获取多维度用户使用数据,对个体画像模型进行修正,建立专属个体的智慧阅读用户最佳体验模型,动态建立个体画像之间的关联,完善图书馆群体用户关系图谱,反向指导图书馆智慧阅读空间建设与智慧阅读服务的开展。

4.2.3 智慧阅读平台模块。在阅读平台的搭建过程中,大多数图书馆都自成一派,缺乏建设策略、标准、规模的协同规划,各图书馆阅读平台相互联系较少,并存在严重同质化问题,大大降低了用户阅读效率和阅读体验。因此,智慧阅读平台的建设首先要规范统一的数字化建设标准、应用制订模式,并且在建设过程中始终以用户需求为导向,基于图书馆用户画像数据库分析规划阅读平台的开发建设,各类型、区域图书馆有所侧重,连接成一个阅读平台网络,实现资源共享、优势互补。此外,用户画像模型中的情景属性标签也会影响用户的阅读需求和偏好,如科研用户在平台阅读文献信息时希望能够实现对文本进行划线、注释、翻译等功能,一些女性用户喜欢阅读小说、购物、宠物等内容,并且希望文字内容尽可能简单、图片信息尽可能多,因此,阅读平台应注意平台展示的多样化设计,以便实现后续个性化功能应用。基于用户画像模型的智慧阅读平台应该体现用户的主导地位,用户访问图书馆阅读平台时,系统会自动将用户个体属性画像与阅读资源进行匹配,主动为用户呈现与之关联的资源内容,并根据其点击、浏览、收藏等使用数据自动更新内容,除此以外,还应为用户随机推送资源内容,避免用户陷入选择性感知信息陷阱,最终实现以人为本的智慧化阅读新体验。智慧阅读平台也是用户的阅读交流分享平台,能够实现线上线下阅读活动的交互,推动用户互相分享观点与知识,促进用户个体及群体之间的交叉互联,帮助构建完整精准的个人及群体用户画像,将个人智慧发展为群体乃至社会智慧,有利于提高社会大众阅读的过程精准和目标明确,这也是智慧阅读的终端体现。

4.2.4 智慧阅读推广模块。当前大多数图书馆并未考虑用户的年龄、性别、专业、兴趣偏好等因素,直接面向所有用户开展统一的阅读推广,推广效果和推广范围十分有限。图书馆阅读推广面临的读者需求多样化和无差别推荐的矛盾,开展智慧阅读推广是实现阅读服务智慧化的必然要求和现实选择。由于现实中人力、物力、财力的限制,图书馆智慧阅读推广应该是以个人与群体推荐相结合的模式。个人推荐应是基于个体属性画像尽可能详尽地涵盖和对应单个用户的全部需求,可以通过相关的关联算法建立阅读推广互动系统,进行一对一服务。群体推荐应是基于群体属性画像挖掘群体用户的观点、偏好等属性,根据群体关联性找寻推广目标与推广群体,科学开展阅读推广活动。无论是个人还是群体阅读推广,都应该重视线上阅读推广系统与线下阅读推广活动的互通互融,在阅读推广过程中,用户与馆员、用户与用户之间的阅读交往逐渐密切,构建起密集、广泛互联的以用户为中心的阅读网络,融入用户画像模型,使其成为一个智能推广网络,让阅读无处不在、无时不在,真正实现智慧阅读推广。基于用户画像的智慧阅读推广的另一个优势是通过图书馆智慧空间的全面感知与智能识别,能够实时自动跟踪、监控用户阅读的详细过程,如通过室内定位技术记录用户阅读行为轨迹、通过监控设备捕捉用户阅读时的表情等,以用户的动态反馈不断完善用户画像的完整性和精确性,基于此,图书馆能够自动设定阅读推广的目标和方法,向用户传递与之相匹配的阅读资源,更好地向用户提供个性化的阅读推广服务。

5 结 语

本文基于图书馆用户数据建立用户画像,并将其嵌入图书馆智慧服务体系,构建包含智慧阅读资源、智慧阅读空间、智慧阅读平台、智慧阅读推广四大模块的图书馆智慧阅读服务框架,对各模块的智慧阅读服务支撑工作进行探讨,对应用用户画像提升图书馆智慧阅读服务水平具有一定的借鉴意义。值得注意的是,本文注意到个体属性画像与群体属性画像在图书馆智慧阅读服务过程中的适用性和差异性,但并未详细展开讨论辨析。图书馆用户作为动态个体与群体的用户画像更新问题,也是开展实时智慧阅读服务应该注意的问题。下一步的研究重点在于用户画像在图书馆智慧阅读服务中的具体利用,需加强实证(数据、实验、访谈等)研究,进一步验证模型的有效性与实用性。

猜你喜欢

画像标签图书馆
图书馆
画像
画像
让衣柜摆脱“杂乱无章”的标签
科学家的标签
科学家的标签
莫尼卡的画像
画像背后藏着活人
去图书馆
标签新闻