APP下载

国内图书馆用户画像研究综述

2020-05-13王东亮罗雨舟杨友清杨勇陈玉平

新世纪图书馆 2020年2期
关键词:精准服务用户画像实践应用

王东亮?罗雨舟?杨友清?杨勇?陈玉平

摘 要 大数据时代推动了图书馆服务的变革,将用户画像引入图书馆领域,可实现精准服务与推荐。本文以CNKI为文献统计来源,对国内关于图书馆用户画像的学术论文进行统计分析与现状分析,从图书馆用户画像构建过程、精准服务、精准推荐、实践应用等4个方面进行详细阐述,并提出几点国内图书馆用户画像研究发展趋势及建议。

关键词 用户画像 图书馆 精准服务 精准推荐 实践应用

分类号 G250

DOI 10.16810/j.cnki.1672-514X.2020.02.015

A Review on the User Profile of Library at Home

Wang Dongliang, Luo Yuzhou, Yang Youqing, Yang Yong,Chen Yuping

Abstract The era of big data has promoted the transformation of library services, user profile is a good tool to realize precision service and recommendation for libraries. The article statistical analyzes the scientific literature about user profile in domestic library field through the data from CNKI, and discusses the research status. The research status includes user profile construction process, precision service, precision recommendation and practical application in library field. Finally, the article proposes some research trends and suggestions of the application of user profile in domestic libraries.

Keywords User profile. Library. Precision service. Precision recommendation. Practical application.

1999年,Alan Cooper首次提出“用戶画像”(Persona)的概念,即用户画像是现实生活中真实用户的虚拟代表[1]。2010年,国内学者正式使用“用户画像”一词[2]。目前,用户画像技术已广泛应用于计算机领域和电子商务领域,但直至2014年国内图书馆领域才首次出现对“用户画像”的应用研究[3]。大数据时代引发了图书馆的变革,用户画像的引入可以为图书馆实现精准服务提供思路和方向。基于此,本文采用文献计量法对国内关于图书馆用户画像的研究情况进行统计分析,进一步了解图书馆用户画像的发展现状,希望能为图书馆用户画像的研究与发展提供参考和借鉴意义。

1 文献统计分析

本文利用CNKI中国知网学术资源库,以“用户画像”作为关键词进行主题检索,检索领域限定为图书情报与数字图书馆领域,共检索出110篇文献,根据内容筛选,共有37篇文献符合主题。

1.1 年度分布

科学文献的数量变化是衡量科学知识量的重要尺度之一。国内图书馆用户画像研究领域发文数量如表1所示,用户画像在图书馆领域的应用始于2014年在《图书馆学刊》上发表的《基于大数据的图书馆信息营销策略》[3],文章认为大数据时代下,图书馆可以借助用户画像技术实现馆藏资源与用户信息需求的精确匹配,提升营销效率。由科学文献的年度分布情况可见,国内用户画像在图书馆领域的研究文献才刚起步不久,用户画像技术在图书馆的应用处于踊跃探索期。

1.2 期刊分布

对文献信息的来源期刊进行统计,结果显示论文共来自于21种期刊,其中有2篇及以上论文的期刊共8种,分别是《图书馆学研究》 《现代情报》《情报理论与实践》 《图书馆情报工作》《图书馆学刊》《图书馆论坛》 《图书馆理论与实践》《数字图书馆论坛》,其中刊文量最多的期刊为《图书馆学研究》,其次是《现代情报》 《情报理论与实践》。

1.3 机构分布

对文献信息的作者机构(第一单位) 进行统计,结果显示文献作者共来自35个机构,其中南京大学有3篇文献,其他机构均只有1篇文献。按发文机构的性质进行统计,高等院校为图书馆用户画像领域的研究主力,其次是各研究院(所) 和公共图书馆,最后为省委党校图书馆。

1.4 关键词分布

统计文献信息中的关键词,共有包含关键词106个,关键词频数为1至27不等,其中频数大于或等于2的关键词共15个,频数为2及以上的关键词频数及其中心度统计结果如表2所示。

本文以文献关键词为节点,以共现次数为边权重,构建关键词共现网络,结果如图1所示,节点大小显示其中心度,连线的粗细反映了共现频次的大小。在频数为2及以上的关键词中,除关键词“用户画像”“图书馆”具有强自我指向性外,具有明显中心度的关键词还包括“大数据”“精准服务”“用户需求”“数据挖掘”“个性化服务”等,这些关键词反映了图书馆用户画像应用研究的3个重点方向,即用户需求推荐、图书馆精准服务、图书馆个性化服务。“高校图书馆”“智慧图书馆”“数字图书馆”等描述了用户画像在图书馆的实践应用领域。“大数据”“用户行为分析”“数据挖掘”“知识发现”等揭示了图书馆用户画像的主要技术手段或途径。

1.5 主题分布

根据对国内37篇文献的内容进行梳理、分析和总结,发现相关文献研究主题比较集中,如表3所示,研究主题主要集中于用户画像构建方法、精准/个性化服务、精准/个性化推荐、实践应用、研究综述等,分别为20篇、9篇、8篇、9篇、5篇。其中,5篇研究综述分别为《国内外用户画像研究综述》 《国外图书馆领域用户画像的研究现状及启示》 《基于数据密集型的用户画像研究进展》 《图书馆精准服务研究现状及发展策略》 《我国用户画像研究的知识网络与热点领域分析》,虽对图书馆领域用户画像有所涉及,但是主要侧重于对用户画像的综述,尚无将国内用户画像研究与图书馆直接紧密联系的综述性文献。

对相关文献中用户画像的主要应用领域进行统计,结果如表3所示,其中23篇文献将用户画像应用于广义上的图书馆,应用于高校图书馆、数字图书馆、知识社区、智慧图书馆、移动图书馆的文献分别为6篇、4篇、4篇、2篇、1篇。随着大数据和人工智能的发展,图书馆的服务和功能得到延伸与拓展,用户画像在图书馆的应用逐渐从传统图书馆拓展到数字化、智慧化、移动化图书馆。

2 国内研究主题分析

通过对相关文献的梳理与总结,可以看出我国图书馆用户画像的研究主要集中在构建过程、精准服务、精准推荐和实践应用4个方面。

2.1 对图书馆用户画像构建过程的研究

对相关文献中的图书馆用户画像构建过程进行内容梳理,得到结果如表4所示,综合可见,图书馆用户画像的一般构建过程为:数据来源→数据采集→数据分析与处理→用户标签体系构建→用户画像模型构建。此外,薛欢雪[4]提出在创建学科服务用户画像之前,首先要确定被画像的用户类型、设计切实可行的研究方案和调研纲要;崔超和罗欧[5]、杨燕[6]提出在建立图书馆用户画像时,首先要明确图书馆用户画像的战略意义。除此以外,韦良珍[7]、曾建勋[11]、朱白[12]、程金[14]、尹相权[15]、张均[16]、吴智勤[17]、陈源源[19]、何娟[22]等学者也针对用户画像创建流程提出了自己的建设。

2.1.1 数据来源

国内学者主要将图书馆用户画像数据来源分为静态数据和动态数据[6-13]。静态数据,即用户属性数据,包括性别、年龄、学历、职业、职称(职务)、住址、身份证号、工作单位等。动态数据,即用户行为数据,主要通过网站系统、数字资源平台及移动终端产生,包括注册、登录、访问、点击、跳转、评价、搜索、浏览、咨询、阅读、下载、订阅、收藏、预约、续借、互动等。

也有学者对用户数据进行了细分,如崔超等[5]将用户数据细分为基础数据(即自然属性数据)、社交行为数据、兴趣偏好数据、能力特长数据;程全[14]将用户数据细分为用户基本信息、用户内容偏好数据、用户互动数据、用户会话数据、用户其他数据五大类;尹相权等[15]则将用户数据划分为用户预约数据、用户违规数据、用户基础数据和用户绩效数据;张钧[16]将用户行为数据细分为网络行为数据、服务行为数据、用户内容偏好数据。

此外,吴智勤等[17]认为宏观上用户画像数据应涵盖用户属性/行为数据、社交网络大数据和互联网知识库等;裘惠麟等[18]则从数据类型角度将用户画像数据分为结构化数据(如纸质、光盘资源)、半结构化和非结构化数据(如用户浏览借阅记录、视频音频数据流)。

2.1.2 数据采集

确定数据来源后,则开始进行数据采集工作。用户画像数据包含了结构化、半结构化和非结构化的数据,对不同类型数据的采集需采取不同的技术手段。对于静态的用户属性数据,如性别、年龄等,通常根据图书馆管理系统中的注册信息获取。对于动态的用户行为数据,可以利用网络爬虫、文本挖掘、网站日志获取等技术从网站系统、数字资源平台或移动终端进行采集,如尹相权等[15]利用北师大图书馆研究间系统预约日志数据来构建和分析用户画像。此外,动态数据也可通过设置问卷进行调研,如薛欢雪[4]从用户的基本属性、行为特征、反馈与评价、历史数据4个维度设计问卷调研提纲以采集用户画像数据;陈添源[19]在通过问卷调查方式获取用户画像数据时构建了涵盖人口统计属性、使用行为属性、用户心理偏好标签等方面的29个调查变量。

2.1.3 数据分析与处理

一方面,获取的原始数据通常不全是结构化数据,且存在一些噪声信息、重复信息、缺失值、不一致数据等,不能直接应用于用户画像构建,因而需要对其进行数据清洗、数据集成、数据规约、数据变换等数据预处理操作,以保证数据质量。

另一方面,获取的原始数据通常包含与用户特征无关的冗余信息,因此有必要采用数据挖掘技术进行信息过濾、分类、聚类、关联、序列等分析与处理工作,从而提取出有效数据,确保用户画像与用户之间的有效性和真实性。

2.1.4 用户标签体系构建

用户标签是用户属性特征和用户行为特征的高度精炼,用户标签的综合即“用户画像”[20]。构建用户标签体系的一般做法是,利用自然语言处理、文本挖掘、K-means聚类、关联规则、机器学习等技术提取出用户基本特征标签和用户行为特征标签,然后对标签进行相似度计算、归类、聚类、关联等,逐步构建分类标签、多级标签,从而形成用户标签体系,将模糊的用户类型立体化、形象化。

用户标签类型的设置通常根据业务需要,且对应于用户画像数据源,如曾建勋[11]将用户标签分为用户基础属性标签、角色属性标签和行为属性标签等;潘宇光[8]、胡媛等[10]则从读者基本信息、用户兴趣爱好、用户活跃度等多角度构建用户标签模型,胡媛在此基础上进一步确定读者属性、近期需求、流失概率三类预测标签。

针对不同领域的不同类型用户标签对主体的行为影响强度不同,薛欢雪[4]提出要对用户标签确定优先排序或赋予不同的权重值,陈添源[19]采取统计各个心理偏好变量在每个分群的均值作为标签权重,人口统计和使用行为两个维度采用属性值的频率排序,以此共同定义用户画像的3类标签权值。

猜你喜欢

精准服务用户画像实践应用
“精准服务”破解养老难题
把声音的魅力发挥到极致
精准发力人才培养服务县域跨境电商
移动用户画像构建研究
谈文化馆“精准服务”在推进全民艺术普及中的作用
基于微博的大数据用户画像与精准营销
游戏在小学英语教学中的应用
税务筹划在财务管理中的实践应用探究
微课在高中英语语法教学新模式中的应用
图书馆精准服务