基于用户画像的高校图书馆阅读推广模式构建
2019-08-22东北农业大学图书馆
刘 漫(东北农业大学图书馆)
对于大学生而言,阅读是获取知识的重要途径。在倡导全民阅读的大环境下,各高校图书馆积极探索阅读推广模式,以期提高大学生的阅读兴趣,培养其阅读习惯,先后提出“经典阅读”“立体阅读”“游学阅读”“众筹阅读”[1-4]等多种推广举措。但是以往的阅读推广多以单向推荐为主体,双向互动往往受限于用户参与。
2008年,Nature刊发Big Data:The Future of Biocuration,[5]标志着大数据时代的到来,使得高校图书馆的阅读推广从单向推荐服务模式向基于用户阅读体验的“云计算+大数据”的互动式服务迈进。在虚拟网络空间里,高校读者留下的阅读行为数据、位置数据等信息成为用户研究的基础。通过对用户数据的分析,可以牢牢黏住老读者、吸引新读者、读懂用户兴趣偏好,从而提供更加精准的阅读服务。文章结合用户画像理论对高校图书馆用户进行定性画像分析,以期总结出当前高校图书馆用户行为特征,建立精准阅读推广模式,提升高校图书馆用户服务质量。
1 相关理论基础
1.1 行为理论
行为是心理学中的重要概念,是有机体适应环境的方式,支撑行为的内在因素是人的心理活动。任何行为在发生之前都会受到一定的意图驱使。[6]动机是诱发个体行为的驱使力,这种驱使力通过一种紧张状态产生,这种状态是需要未被满足的结果。个体会通过行为有意识或者下意识地去缓解这种紧张状态,期望这些行为能够满足他们的需要,从而缓解紧张状态或减轻他们所感受的压力。[7]读者之所以产生阅读行为是因为受到阅读动机的驱使(见图1)。高校图书馆开展阅读推广服务时,应全面了解大学生的阅读需求,促使大学生意识到自己潜在的阅读需要并产生紧张状态,从而形成阅读动机,通过学习态度的习得倾向培养引发大学生相应的阅读行为。阅读推广的前提就应该对被推广人进行解析,这是阅读推广成功的关键因素之一。
图1 高校大学生阅读行为形成过程模型
1.2 用户画像相关研究
“用户画像”最早由交互设计之父Alan Cooper于1998年在 The Inmates Are Running the Asulum 一书中提出,书中强调用户画像(Persona)是“基于用户真实数据的虚拟代表”。[8]用户画像与用户角色非常相近,是用来勾画用户特征、联系用户需求、描述用户兴趣的重要方法,从而尽可能全面细致地抽出用户的信息全貌。用户画像最初应用于计算机与电子商务领域,着眼于精准营销、推荐系统等个性化服务,并且已经广泛应用于其他领域,如Amazon、Netflix以及淘宝的“猜你喜欢”与“产品推荐”,均应用了“用户画像”技术。近年来,用户画像广泛应用于国内外高校图书馆,相关研究日益增多,成为图书情报领域新的研究热点。
用户画像在国外图书馆领域的研究集中在用户体验改善[9]且应用逐步趋向成熟,内容涵盖定义与组成、算法与技术、模型构建、实践应用以及问题与策略[10]等多视角的研究。Holt Zaugg等将用户画像应用于高校图书馆,识别出基于图书馆服务的美国杨伯翰大学图书馆10个用户角色,并完善现有服务、创新服务类型以满足读者需求。[11]Al-Shboul M K 等利用用户画像分析人文学者的信息需求,刻画网络环境对其信息搜寻行为的影响,构建出人文学者的信息搜寻行为模式。[12,13]Spenser Thompson指出“Watching the Movie”是改善图书馆市场营销的重要途径,包括三个方面:一是通过观察和直觉建立用户画像;二是找到图书馆在用户画像叙事中的地位;三是将用户画像与“营销周期”中的各个阶段关联起来。[14]Holt Zaugg等通过将美国杨伯翰大学图书馆的用户画像模式移植到犹他大学图书馆发现,用户画像是普遍存在的,但它们之间的相互作用取决于特定的图书馆设施。[15]
国内图书馆领域对用户画像的研究起步较晚。2010年末,郑宝鑫等在“广东通信2010青年论坛”会议上首次使用“用户画像”一词。[16]但是,我国的用户画像研究直至2016年才引起相关学者广泛关注,于2017年中后期达到研究高潮。吴加琪通过分析我国用户画像研究的知识网络与热点领域发现,图书情报与数字图书馆是用户研究的重要领域。[17]陈慧香等探讨了国外图书馆领域的用户画像研究现状,为我国图书馆应用用户画像指明思路。[18]薛欢雪将学科服务用户进行精准标签化,创建高校图书馆学科服务用户画像。[19]陈添源利用VALS 2用户细分量表、因子分析、聚类分析、判别分析等方法,构建高校移动图书馆用户画像,提升高校移动图书馆精准用户定位。[9]吴智勤等基于社交网络分析方法构建高校图书馆用户画像,提高图书馆用户行为分析效率与个性化推荐水平。[20]何娟利用图书馆读者借阅行为特征,构建读者个人与群体用户画像,实现图书个性化推荐。[21]韩梅花等将用户画像的阅读疗法模式应用于“抑郁症”治疗。[22]
综上所述,用户画像即从用户出发将用户进行精准标签化,高度契合高校图书馆的个性化用户服务与营销实践。但是,我国图书馆领域对用户画像的研究仍处于起步阶段,偏重概念分析与方法借鉴,缺乏用户细分化以及相关模型构建。因此,文章尝试以高校图书馆大学生用户为研究对象,采用本体方法建立基于知识的用户定性画像,利用行为理论与关联推荐算法构建高校图书馆阅读推广新模式,从而提高高校图书馆资源利用率与阅读推广服务精准度。
2 高校图书馆用户画像的构建
2.1 用户画像分析
用户画像源自用户数据,画像精确度与数据全面性正相关。在用户画像的建模过程中需要重点考虑数据的颗粒度,颗粒度越小,用户画像越细化,用户刻画越精细,但对用户数据要求越精细,则会导致建模成本增高,用户画像适用性降低。因此,笔者首先采取问卷调查方法了解高校图书馆大学生用户的阅读场景、阅读内容等,在此基础上,设计用户画像,确定用户画像颗粒度。高校图书馆在充分保障用户隐私的前提下,捕捉用户数据,获得定量用户画像。
高校图书馆服务的主体是大学生读者,构建用户画像需要从图书馆联机公共查询目录(Online Public Access Catalogue,OPAC)系统中采集用户特征属性、用户阅读行为、用户兴趣偏好等数据,这些数据涵盖了数据的所有表现形式,即结构化、半结构化和非结构化。用户特征数据属于结构化数据,用户阅读行为数据中登录数据、借阅数据等,以及用户兴趣数据中的图书借阅时长、阅读类别等均属于结构化数据;其它部分均属于半结构化和非结构化数据。图书馆大数据的采集具有数据海量、来源广泛的特点,半结构化与非结构化数据占大数据总量的85%以上。[23]因此,仅依靠用户定量画像不能全面且精准地刻画用户,定量的用户画像无法解释半结构化与非结构化数据,如用户兴趣模型等无法由算术法则来分析,但兴趣偏好等恰恰与用户阅读行为正相关。因此,本研究引入本体方法,将定性用户画像与定量用户画像相结合,对高校图书馆大学生用户画像建模。
2.2 用户画像标签构建
标签化是用户定性画像的核心,标签化的用户画像既方便理解,又便于计算分析。本研究引入本体对用户画像中的标签进行表示、验证、推理与解释,成为用户定性画像建模的关键。采集高校图书馆大学生读者的数据,构建多维度用户标签体系,形成高校图书馆用户画像可视化描述(见图2)。高校图书馆大学生用户画像由用户维度和图书维度共同组成,其中,用户维度由定量用户画像的读者属性特征、用户行为特征和用户兴趣特征构成。
图2 高校图书馆大学生用户画像结构
2.2.1 用户维度
(1)用户特征标签。高校图书馆用户特征,即读者属性数据,[24]用于描述用户基本信息。根据图书馆系统注册信息获取,包括大学生的校园卡号、姓名、性别、年龄、专业、年级等基本信息。
(2)用户行为标签。高校图书馆用户行为数据即大学生登录图书馆OPAC系统的日常记录,包括书目检索次数、浏览次数、借阅次数以及续借、数字资源阅读、下载等行为数据;图书馆远程访问系统、移动图书馆及微信平台在使用过程中产生的行为数据等。
(3)用户兴趣标签。用户兴趣特征偏好反映用户的潜在兴趣,通过跟踪高校图书馆大学生用户的浏览与借阅行为、检索与下载行为,对用户阅读时间、阅读时长、阅读内容、阅读类别等相关信息进行推理,得到用户兴趣偏好信息。
2.2.2 图书维度
图书维度数据是对图书属性的描述,反映图书的基本信息,包括图书的题名、类别、责任者、主题词、出版社等数据。图书维度也与用户兴趣偏好正相关。
2.3 用户定性画像构建
本研究采用本体方法构建大学生用户画像的概念模型,利用本体描述语言OWL DL和本体构建工具Prot佴g佴进行本体的构建。[25]使用标准术语构建大学生用户画像标签的领域词汇表。对于高校图书馆大学生用户领域来说,类词汇包括人、用户等;属性词汇包括校园卡ID、姓名、性别、年龄、专业、年级等。而对于图书领域来说,类词汇表一般包括电子图书、纸版图书、责任者、主题、分类、语种、情节等。下表列出了用户画像领域类的部分词汇,笔者利用Pro t佴g佴构建用户画像本体分类的结构(见图3),构建出高校图书馆大学生用户画像概念模型(见图4)。
表 用户画像领域类词汇表(部分)
3 基于用户画像的阅读推广模式
高校图书馆构建大学生用户画像,能够快速了解用户需求,开展用户服务,并应用于阅读推广服务设计中。但是在具体开展阅读推广服务时,由于不同大学生的用户画像可能存在相互冲突的需求和动机,服务设计不可能针对所有的用户画像进行。因此,需要实施用户画像管理。通过聚类分析,将大学生用户画像分为若干类别,尽量缩小类别内部差异性,扩大类别之间的差异性。阅读推广服务首先考虑满足首要用户画像群的需求;在阅读需求和动机不冲突的情况下,尽量满足次要用户画像群的需求,通过建立用户画像和图书的物品画像,对用户的选择行为作出预测,完成特定用户的“Top N”推荐。
图3 用户画像本体分类的结构(部分)
图4 高校图书馆大学生用户画像概念模型
3.1 聚类算法与关联算法
3.1.1 聚类算法
用户画像聚类的形式描述如下[26]
令P={P1,P2,P3,……,Pm}表示用户画像集合,其中pi表示第i个用户画像。表示聚类后的第i个分类,其中pij表示Ci分类中的第j个元素。聚类结束后,各分类应该满足的条件为:不同的算法有不同的应用场景,现有的聚类算法有组间聚类法、正二进制法、K均值算法、GDILC算法、SGC算法等;其中,K均值算法在用户画像领域应用比较广泛。
3.1.2 协同过滤推荐算法
协调过滤即依据用户或者物品间的相似性来推荐用户感兴趣的信息,如:和你兴趣相似的朋友喜欢的图书,你也可能喜欢;你喜欢一本图书X,另一本书Y与X相似,你也可能喜欢Y。高校图书馆可以根据本馆实际情况选择基于记忆的协同过滤方法、基于模型的协同过滤方法等对用户阅读行为进行预测。
3.2 基于用户画像的阅读推广模式构建
由于人力、物力、财力的限制,高校图书馆的阅读推广模式应该是以个人与群体推荐相结合的模式。个人推荐就是通过关联算法建立阅读推广互动系统进行一对一的用户服务,群体推荐就是通过对用户画像进行聚类,挖掘群体用户画像、分析群体用户习惯、发现用户关联性,从而根据这种关联性指导线下阅读推广活动(见图5)。
图5 基于用户画像的高校图书馆阅读推广服务机理构建
3.2.1 个体阅读推广
近年来,“精准阅读推广”成为高校图书馆用户服务的重点。用户画像使得精准服务成为可能。阅读推荐是阅读推广工作中的一项重要内容,准确性、多样性、新颖性、惊喜性等指标共同受到用户关注。[27]除了大学生显性阅读需求外还要挖掘其隐性阅读需求,激发他们的阅读动机,促进其阅读行为的产生。
个体阅读推广是针对大学生个人的阅读指导,以线上活动为主,线下活动为辅。高校图书馆通过用户画像构建大学生阅读需求关系数据库,深层挖掘大学生阅读需求,利用协同过滤推荐算法为用户提供“Top N”推荐。高校图书馆可以构建特色阅读推荐平台或利用微信等移动平台推广阅读,使得阅读推荐功能更加精准、及时、有效。此外,对于大学生的个体阅读推广可以融入游戏、娱乐、旅行等流行元素,如,东北农业大学图书馆的“书行计划”,鼓励学生带着图书去旅行,更容易调动学生的参与热情,激发其阅读兴趣。
3.2.2 群体阅读推广
阅读是一种社会行为,具有个别性和社会性双重属性。[28]移动互联技术、微信、阅读App等促使大学生的阅读行为更多表现为社会性。仅仅依靠个体用户画像难以实现社会性阅读推广,因此高校图书馆开展精准阅读推广服务的另一重点是社会化阅读推广。高校图书馆的群体阅读推广应以线下阅读推广服务为主,线上服务为辅。以群体用户画像为依据,通过聚类算法勾勒出高校图书馆大学生群体动态画像,分析出大学生群体间的关系图谱,使得群体阅读推广活动更有针对性。
高校图书馆利用群体用户画像,应该针对每个大学生用户群的阅读需求开展推广服务,如:每个学期可按照月份进行阅读推广,9月可以针对新生群体;10月针对时事热点;11月针对考研学生群体等。阅读推广模式也可以更多元化,线下可举办阅读交流会、真人阅读等,线上通过多媒体阅读、移动阅读、微课堂、微电台、微视频、微社区等共同打造立体化新媒体阅读推广模式。此外,大学生是高校图书馆阅读推广社会群体最具代表性的阅读推广人,挖掘校园内“大V”读者,与大学校园社团合作,更能贴近学生群体,调动他们的积极参与性,发挥其阅读影响力。如,东北农业大学图书馆与学校团委OEA口语协会、艺术学院学生会共同打造的阅读推广品牌活动“ER enjoy英文经典著作导读”,引领大学生品读经典,获得了大学生群体一致好评。
需要注意的是,教师对于大学生的阅读具有最直接的影响力,图书馆只是起辅助阅读的作用。[29]J.Anthony等的相关研究提出“彼得效应”,即教师与学生在阅读态度与阅读习惯上具有相关性,教师本人不爱阅读,这种阅读热情的缺乏会直接影响他的学生。[30,31]因此,高校图书馆的群体阅读推广还应该针对教师群体开展辅助活动,帮助教师意识到向学生推荐阅读的重要性,除了本身对阅读的热爱,还应该积极寻找培养学生养成良好阅读习惯的方法,与学生分享阅读经验与阅读感悟等。
4 结语
阅读是大学生获取知识,提高自身素养的重要途径之一。阅读推广是高校图书馆服务工作的重中之重,高校图书馆不仅要推广阅读,更要培养大学生良好的阅读习惯,使之终身受益。随着新媒体的发展,大学生的阅读行为呈现多元化趋势,拓宽了高校图书馆阅读推广渠道与阅读推广模式,但现实状况是高校图书馆的阅读推广经常面临与用户需求不匹配的困境,推广效果与推广范围有限。
作为大数据时代的产物,用户画像为高校图书馆拓展了服务维度。高校图书馆拥有海量的用户数据,通过对大学生数据的挖掘分析,用户画像尽可能全面细致地将大学生读者的信息全貌可视化地展示出来,帮助高校图书馆将存储的数据转化为具有潜在的价值知识,为大学生提供精准阅读推广服务,促进大学生阅读行为更广泛更深入的发展。
需要指出的是,由于信息搜集成本与用户隐私等限制,当前高校图书馆针对大学生用户的画像与大学生本人还未实现完全匹配。但是,随着用户画像研究与应用的不断深入,必将推进高校图书馆大学生用户画像向着精确与动态方向继续迈进,为高校图书馆的阅读推广精准服务提供理论与数据支撑。培养大学生阅读习惯、引导大学生阅读行为、构建健康的高校阅读生态圈,是高校图书馆阅读推广工作的最终目标。