数据驱动的数字图书馆阅读推广研究
2020-08-12陈智奇
陈智奇
(云南大学历史与档案学院,云南 昆明 650091)
1 引 言
随着互联网的功能日益强大和国民生活水平的日益提高,国民对网络的使用更加普遍和频繁,产生了大量的用户数据。这些用户数据能代表用户特征,刻画用户行为,因此越来越成为推动各行各业的服务创新转型的强大驱动力。早在20世纪初,先进计算领域的S.C.William[1]就关注到了数据的价值,认为数据的价值之高应该成为一门独立学科。对于新时代的数字图书馆而言,数据驱动在简单的数据计算思维之上,更关注用户、服务和管理,契合图书馆精神,是数字图书馆管理理念更新和服务体系创新转型的新路径。另外,数字图书馆本身就是一个庞大的数据库,丰富多元的知识数据、运行数据、交互数据集成关联,造就了数字图书馆各项服务的大数据环境,数字图书馆应该利用好自身优势,及时转变思维,主动适应外部环境的改变,提高主观能动性,进行知识服务供给侧的结构性改革[2]。阅读推广作为图书馆服务的重要组成部分,是把馆藏知识资源和读者联系起来的重要环节,是服务创新转型的重点,图书馆可以通过数据主动了解用户、熟悉用户、优化服务,提高用户满意度、忠诚度和阅读推广有效性。具体而言,通过数据驱动机制对读者数据的抓取和解释,数字图书馆能准确把握读者特征,精准匹配读者需求与阅读资源,成为阅读推广服务优化的突破点[2]。
2 数据驱动与图书馆阅读推广服务
2.1 数据驱动的概念
什么是数据驱动,目前尚未形成一个统一的结论。作者使用文献调研法对研究数据驱动的文献进行分析发现,各个领域的研究都不约而同地将其定义为一种以决策为目的的数据流机制。有研究认为数据驱动是在数据分析的客观基础上作出决策,而不是仅仅依靠直觉进行决策的实践[3];还有研究者认为数据驱动是一种以相关数据分析所得到的信息和证据为依据而制定决策的一种形式[4]。在数据驱动的应用方面,耶鲁大学学者S.Tudesco[5]认为图书馆数据驱动的是图书馆员的思维活动和工作过程,是基于对客观数据的挖掘和分析,而不是个人经验和主观假设。通过对以上研究的归纳,我们可以把数据驱动定义为一种强调决策的有效性并以客观数据为基础,通过分析所获取的信息和知识来弥补决策者的思维短板,以提升决策各过程有效性的机制。
数据驱动是一个不断赋予数据价值的递进过程[7],这个过程可以具化为:数据—信息—知识。在这个过程中,根据问题有针对性地对相关数据进行采集,然后筛选、梳理、整合这些采集来的数据,剔除干扰和无效项,使数据有序排列;对数据进行特征和趋势分析,数据就被赋值成为信息;最后对信息进行深化挖掘和专业嵌入,得到具有专业属性的知识。基于这一价值转化过程,数据驱动的运行机制可概括为“指标规划—数据采集—信息挖掘—报告产出—智慧决策”的过程。
数据驱动的价值主要有以下几种实现途径:1)“以史鉴今”,以历史数据规划先行方案,提高长效和持续性绩效;2)以客观数据为基础,以科学的自动化程序为智能,提高决策的科学和准确性绩效;3)以实际运行程序检测决策,提高决策的实践性绩效;4)以可视化指标评价决策,促进决策不断优化和思维的迭代更新。
2.2 数据驱动的阅读推广服务可行性与必要性分析
随着“全民阅读”进程不断深化,促进全民阅读成为国家的在文化方面重要的战略部署。党的十八大以后,政府工作报告和发展规划纲要多次对“全民阅读”的推进提出明确要求。2017年,国务院发布《关于〈全民阅读促进条例(征求意见稿)〉公开征求意见的通知》,向社会各界征求意见,标志着阅读立法已经提上日程。随着国家对阅读越来越重视,阅读推广作为“全民阅读”实现的主要途径和图书馆服务的核心工作之一,在全国各地图书馆蓬勃发展。
但是,根据有关部门对国民阅读现状的调查显示[8],我国2018年成年国民的综合阅读率为80.8%,其中数字化阅读方式的接触率为76.2%。在成年网民网上活动行为调查中,我国成年国民上网以阅读新闻、社交和观看视频为主,娱乐化和碎片化特征明显,深度图书阅读行为占比偏低。事实上,短时、碎片化的阅读很少能形成真正的有效阅读,更不用谈能从中领会书本的要义或得到有益的启示,从而化为影响自己观念或指导自己行为的知识力量了。大部分人都沉浸于一种浪费时间的“无效阅读”中。要改变这种无效,图书馆作为阅读推广的第一线,亟须转变原有的阅读推广策略,以读者为本,实现阅读推广服务的有效性优化。
数据驱动在数字图书馆的具有良好的运行环境[9]。纵向来看,数字图书馆在日常运行中积累了大量的读者行为数据、交互数据、数字阅读数据,有良好的数据基础;从横向来看,全国各图书馆间已经形成数字平台联盟,联盟间有多项协同服务,比如共享数字资源,跨馆一键式检索、跨馆参考咨询、馆际互借、文献传递等[10]。稳定的数据来源渠道和丰富多元的数据基础,是数字图书馆的天然数据优势。鉴于此,利用数据深刻理解用户需求、实时洞察用户偏好,实现阅读推广服务创新转型和绩效提升,是可行的,也是必要的。
3 阅读推广服务的数据驱动机制
根据数据驱动的运行机制,结合阅读推广服务的实际情况,阅读推广的数据驱动机制如下图1所示。
图1 阅读推广的数据驱动机制
3.1 数据采集
数字图书馆的数据采集程序首先是多角度、全方位的数据指标规划,然后抓取图书馆数据和图书馆间联盟平台数据,保障数据的数量基础,刻画读者群体的用户画像[11],最后对数据进行整理,包括格式的标准化与规范化和剔除干扰数据。具体运行时,要抓取的数据包括数字平台的统计数据,如用户增长统计、用户登录频率统计、用户停留时长、单次活动参与用户量等基础数据;还要包括用户基本信息数据,就是用户在平台注册时主动上报的个人信息,如性别、受教育程度、感兴趣的标签、爱好特长等。这个维度中的数据是用户自定义数据,要注意数据格式化,适配分析系统的数据格式,为中期分析打下基础;读者来源数据也非常重要,可以准确反映热点渠道,刻画渠道与阅读推广有效性之间的相关关系,为后续选择有效的资源投放渠道提供参考。最后是对分析数据的采集,分析数据是经过提炼和加工的高价值信息,比如在下文中提到的漏斗转化模型中的用户转化率。
3.2 数据分析
数据分析是一个数据抽象的过程。阅读推广的实现过程是连续的、复杂的、互相影响的,而数据抽象的过程,就是将这些复杂多变的现实情况简化为数字,搭建数据模型,计算相关因子,推断事件归因。
3.2.1 多维度下钻分析。多维度下钻分析顾名思义就是对各个维度数据的深度分析,基于用户数据的趋势描绘,用细粒度的分析方法精准定位阅读推广服务的短板,指导服务调整优化。运用多维度下钻分析可以保证数据分析的系统性和全面性。
3.2.2 漏斗转化模型分析。漏斗转化分析是一个非常重要的数据分析方法,简单来说就是以人数为统计口径,分析关键路径从第一步到最终的转换结果和每一步之间的转化率,转化率事实上是对阅读推广服务绩效的刻画。
数字图书馆的阅读推广有三个要素:阅读资源匹配、阅读资源推广过程、读者阅读体验反馈,读者参与图书馆阅读推广大概分为三个步骤:寻找目标阅读资源、阅读、反馈,漏斗分析模型如图2所示。
图2 数字图书馆阅读推广的漏斗模型
第一步是从查找阅读资源到开始阅读行为的转化,第二步是从阅读到产生阅读体验的转化。数字图书馆在一个完整的阅读推广过程中获得转化率1和转化率2,这两个转化率体现每一步之间的读者转化率和流失情况,体现过程中每一步有效性,可为图书馆提供一个评价阅读推广绩效的指标,推动阅读推广服务改进优化。
3.2.3 落实服务。图书馆需要根据分析层产生的读者数据,根据读者的不同特征,实施差异化阅读推广:开发与读者特征匹配的阅读资源,精准投放至读者常用的数字化阅读渠道,提供个性化的线上阅读指导。
4 数据驱动下的数字图书馆阅读推广服务绩效优化
据上文分析可知,飞速发展的信息技术对数字图书馆的阅读推广服务提出了更高要求。建立数据驱动的高效阅读推广服务机制,只实现阅读资源与用户的有效联结还远远不够,还要立足于用户的个性化需求,积极探索绩效优化方法,为促进全民阅读作出应有的贡献。
4.1 实施精准化阅读推广
用户画像构建是实现精准化阅读推广服务的有效方法。用户画像构建[11]是在一系列真实数据的基础之上,通过描述用户特征、需求和偏好,构建的目标用户模型,是用户信息面貌的虚拟刻画,其目标是实现精准服务。
用户画像构建的数据基础是那些能全面的描述用户特点的数据,如受教育程度、爱好特长、阅读偏好等。其构建过程有四个阶段:数据格式标准化、数据反映趋势、用户特征刻画、用户画像描绘。数据格式标准化就是要对用户输入的自定义数据完成适配分析系统的格式标准化改正;描绘趋势化就是要立足于读者行为的动态变化分析读者的阅读特征;用户特征刻画就是根据用户数据反映的趋势标记用户特征;最后基于用户标签,完成用户画像描绘。在阅读推广服务中应用用户画像有利于阅读推广服务宣传精确触及用户;有利于数字阅读资源匹配用户阅读兴趣,可以提高阅读推广服务的精准化程度。
4.2 巩固用户基础,拓宽阅读推广覆盖范围
阅读推广是“以人为本”的服务,用户是一切服务设计的出发点和落脚点。巩固既有读者、拓展潜在读者、吸收新读者,扩大读者群体,是阅读推广追求的目标,也是其可持续发展的基础。
根据用户生命周期理论[12],用户生命周期管理可分为六个阶段:潜在用户阶段、新手阶段、有效活跃阶段、活跃下降阶段、即将流失阶段。在不同的用户生命周期,图书馆需要进行差异化阅读推广策略,才能巩固、扩大阅读推广的用户群体。
针对不同阶段特征制定不同的用户拓展策略。面向处于考察、形成阶段的用户使用拉新策略。具体实施路径是提取现有优质读者的历史数据,以此为蓝本,寻找阅读推广过程中高转化率的位置,设计对应的拉新模型;其次,关注新进入用户,引导他们熟悉数字阅读推广服务,可以有效地留住新读者,如面向新读者发布新书阅读任务。根据用户画像反映的阅读能力,设计不同的阅读任务难度,根据用户的阅读兴趣,配置相应的阅读资源。读者可以在完成任务的过程中加深对阅读推广服务的理解和适应,数字图书馆也可以与读者建立交互联系,增强读者黏性,扩大读者基数。
面向稳定阶段的用户,要刺激用户活性。好的阅读内容和精准的触及都可以吸引读者参与阅读活动。数字图书馆可以通过对读者画像进行刻画,刺激读者需求,保持用户的活跃度。例如,在数字阅读平台中加入社交模块,让读者可以在模块中与微信好友分享交流阅读心得,刷新阅读量排名,与好友比比阅读量,进而保持用户活跃度。
在用户退化阶段,要建立流失预警机制,实施用户挽回策略。用户的行为数据整合可以反映用户流失趋势,如用户登录数字图书馆的频率呈下降趋势,就在一定程度上反映出用户的兴趣发生转移,处于流失阶段。在定位到这部分用户后,数字图书馆就要使用一些挽回策略,如赠予用户免费使用收费阅读资源的定期权限;还要及时分析用户的兴趣转移方向,寻找新的服务绩效增长点。现在有声读物在国民阅读的读物选择中市场占有率增长很快,图书馆可以设计开展朗诵比赛活动、开发有声阅读资源,吸引读者回流。对于回流读者也要实施关怀,更重要的是定位用户流失于阅读推广服务过程中的具体位置并优化改进相应位置的服务。
4.3 促进深度阅读
阅读推广服务的有效性体现在广度的扩大,更体现在阅读效果的深化。在数据驱动机制下,数字图书馆在阅读推广服务实施前要根据目标有效实施做好顶层设计,做好推广目标用户和阅读资源的筛选和精准匹配,不仅要立足于一次活动,更要从数字阅读资源开发、读者阅读效果强化、阅读习惯培养各个方面做好系统性规划,打造自己的服务品牌。例如,根据用户画像,以读者兴趣为导向开发特色阅读资源和周期性阅读推广模式,提高读者的主观能动性,帮助读者养成主动阅读、主动思考的习惯,让读者爱上阅读。
4.4 建立推广效果评价机制
一个客观准确的效果评价机制可以让图书馆对服务的有效性有一个清晰的认知,促进自查与优化,提高阅读推广效果。利用好数据驱动机制中数据分析层的漏斗转化模型和下钻分析模型,可以为图书馆建立服务效果评价机制提供多维度指标参考和模型数据。
5 结 语
我们正在步入一个“让数据说话”的年代[10],环境发生了变化,思维也要跟着变化[13],利用好数据驱动力实现数字图书馆的阅读推广服务优化是挑战更是机遇,是数字图书馆的职责更是使命。图书馆要以人为本,熟悉读者,研究读者,满足读者的需求,与读者一起共建图书馆;还要研究并适应数据环境,发挥数据的优势,加速阅读推广服务的创新转型,从而真正承担起国民教育的责任,为建设学习型社会作出应有的贡献。