区域高校图书馆联盟文献传递服务的用户细分研究*
2020-09-03陈添源
陈添源
0 引言
实现资源共建共享是区域图书馆联盟成立的主要目的,而非返还式电子文献传递服务则是实现联盟资源共享的主要服务方式之一。历经多年来的资源集群化和服务整合,该服务已经迈入创新发展阶段。对成员馆共建共享的参与程度和用户获取稀缺文献的行为特征等进行分析,进而有针对性地提高区域图书馆联盟资源整合效益,已成为推动联盟迈向精细化服务的重要途径。本研究以福建省高校数字图书馆(以下简称FULink)文献传递服务为实证对象,依托全联盟翔实的文献传递数据,通过爬取技术获得更加精准的用户行为数据集,采用用户细分理论和聚类分析方法展开实证研究,从而为区域高校图书馆联盟创新服务提供借鉴。
1 相关理论研究
1.1 区域高校图书馆联盟研究
对区域高校图书馆联盟的研究,国内集中在联盟内涵、业务定位和功能、运营模式构建、实现机制和绩效评价等方面。张红芹等[1]调研8个区域图书馆联盟的建设目标、运维情况和发展规划,发现存在成员馆参与度低、资源优势未能互补等困境。罗钧等[2]分析JALIS联盟的馆际互借和文献传递服务网,发现在服务推广、用户体验、效益质量等方面需加强。与此同时,对联盟成员馆及其用户的文献传递行为分析研究陆续展开。张玉霞[3]分析区域性数字图书馆联盟的文献传递服务,但仅对各馆的申请量、申请文献类型和回复情况等进行统计和归纳,尚未就成员馆的资源获取特征和文献传递规律深入研究。秦霞[4]基于用户行为还原法构建文献传递用户评价与行为关系的模型,总结影响文献传递效率的因素,提出保证获取率、提高服务效率、整合资源和简化流程等建议。陆尧等[5]以BALIS文献传递服务为对象,通过平台获取用户行为数据探讨图书馆联盟文献传递用户的信息行为,提出及时响应用户需求、减少用户流失和优化资源结构等对策。
国外关于图书馆联盟文献传递服务的研究中,Bangani等[6]通过对南非西北大学文献传递统计数据分析,提出加强宣传、提升用户对馆际互借与文献传递认识、通过技术革新确保用户无缝获取信息资源,从而在有限的资源采购预算中保持资源保障服务。Mwaurah 等[7]对肯尼亚图书馆和信息服务联盟112 个成员馆采用抽样调查,证实受访者对数据库熟悉和使用较少,需要加强基础设施更新、产品服务创新和提升宣传力度,扩展联盟数字资源的可用性和自动化服务能力。Grevatt[8]为研究馆际互借率下降趋势的原因,从OCLCA 的tlas馆际互借系统接口获取Web报告,借助数据分析工具,通过观察使用模式、用户注册特征和取消语言因素等阐述提升博伊西州立大学艾伯森图书馆的馆际互借策略和方法。Ahmadi 等[9]通过建立带有季节变化的数学模型预测文献传递服务的需求,提出对需求的准确评估可以提升图书馆辅助用户科研的能力。MacDonald[10]通过对美国大型综合性公立大学 2012~2015 年 11,981 个文献传递申请记录的统计分析发现,用户对文献传递服务的易得性、实时性和便捷性等充满迫切需求,应减少中介化和提升交付效益。
1.2 图书馆用户细分研究
用户细分是指营销管理者通过市场调研,根据用户需求和欲望、使用行为和购买习惯等方面的差异把某一产品或服务的市场整体划分为若干用户群的分类过程。它是温德尔·史密斯于1956年提出的市场营销理论[11],目的在于满足用户的差异化需求,挖掘潜在的用户市场,促进资源配置优化,最终提高企业经济效益。用户细分研究范式在国内外得到广泛的应用。在图书馆领域,用户细分应用于立法决策服务营销[12]、移动图书馆感知差异性[13]、社交网络群体结构[14]、碎片化阅读行为[15]、情报服务[16]等方面的探索,为图书馆的精准化服务提供参考。
1.3 区域高校图书馆联盟用户细分的意义
区域高校图书馆联盟的文献传递服务作为一种平台型服务,用户细分理论对其具有极强的适用性,在文献传递服务的发展之初,联盟关注的是用户拉新和提高用户知晓程度,以同质化需求为主导;步入成长期后,用户对联盟的某些功能已形成了持续使用行为,平台依赖性开始显化,用户需求不再趋同,如能对成员馆进行细分,明晰成员馆的需求结构,就能精准化识别成熟用户群、潜在用户群和目标用户群,不断挖掘潜在需求,既维系老成员馆也有利于开拓新的成员馆加盟。当前研究主要是针对文献传递服务的行为数据开展定量分析,而围绕联盟的资源保障能力、成员馆文献申请特征、成员馆之间的资源互补关系等领域的研究,囿于数据的采集困难,目前鲜有文献涉及。本研究从文献传递的行为日志出发,基于数据统计特征解析FULink 联盟及其成员馆之间的文献传递互补效益,从数据挖掘、聚类分析和群体画像可视化等方面阐述联盟成员馆之间的资源互补关系,为区域高校图书馆联盟提供可借鉴的文献传递行为实证分析方法,为高校图书馆联盟的持续发展和服务创新提供参考建议。
2 研究设计
2.1 研究背景和数据来源
FULink成立于2010年,目前有53家高校图书馆加盟,其构建的文献检索与传递平台以一站式检索框的形式直接嵌入成员馆网站首页,成为加盟馆用户获取文献资源的重要入口。其业务运行机制为:用户通过成员馆主页或联盟门户网站检索文献,本馆已购数字资源的可直接查看馆藏信息或下载全文,缺藏数字资源的则需要提交文献传递申请,FULink中心门户调度有馆藏的成员馆服务器自动响应,联盟内均缺藏的文献将通过全国参考咨询联盟响应传递。本研究通过Web开发者工具分析FULink 后台日志页面,对每条传递行为数据进行HTML代码解析和相应数据库字段设计,共设计存储字段17个。爬取的字段分为3类:第一类是申请信息,包含申请ID、申请用户名、申请成员馆、申请IP、申请时间、申请标题、申请内容、传递邮箱和申请文献类型;第二类是响应信息,包含响应状态、响应题名、响应内容、响应成员馆、响应时间、响应处理人员、响应文献类型、响应附件类型;第三类为文献传递服务的评价和满意度值,由于实际获取的此类数据值较少,本文只对前两类字段采集分析。
2.2 变量选取理论依据和设计
用户细分实证研究主要分为事前细分和事后细分[17]两大类。事前细分以用户行为的定性分析为依据,事后细分则采集用户使用行为的分类变量和关键性描述信息,依赖多元统计分析技术来识别。其主流研究工具有AIO(activity,interest,opinion)细分 和 VALS(value and lifestyles)细分,其中VALS又被修正为仅与用户行为有关的VALS2 细分。该范式认为,细分市场基于两个因素:消费者的资源和自我导向[18]。消费者的资源包括收入、教育、自信、健康、购买愿望、智力和能力水平;自我导向被解释为用户行为、价值观念和激励因素等,用户类型据此被对应划分为以原则为导向、以地位为导向和面向行为3类。
将区域高校图书馆联盟的成员馆视为一个单体用户,将前述采集的可获取字段与VALS2细分范式的两个因素一一对应重构,成员馆基本属性对应于“消费者的资源”、文献申请和传递情况对应于“自我导向”的用户行为及激励因素等3类行为特征变量,以此组成成员馆用户细分的描述体系。具体细分如下:成员馆基本属性:学校层次,院校类型,用户数,研究生数,教师数,加盟时间,馆藏图书,馆藏期刊。文献申请行为:文献申请数,申请IP数,申请邮箱个数,图书申请数,期刊申请数,学位论文申请数,专利申请数,报纸申请数,标准申请数,会议论文申请数。文献传递行为:文献传递数,文献保障时效,图书传递数,期刊传递数,学位论文传递数,专利传递数,报纸传递数,标准传递数,会议论文传递数。其中,成员馆基本属性采集自其所在学校官方网站简介、网络调研和FULink 工作委员会提供的数据。文献保障时效用于衡量成员馆的资源保障效益,选取文献申请与传递的时差值在8小时以内的记录数,计算和汇总成员馆文献传递的时差值,然后按照7级权重赋值,累加统计得出最终值。
2.3 研究框架
确立用户细分指标体系后,提出图1所示的实证研究框架。在遵循数据合理使用、用户隐私保护和数据规范控制等前提下,以此为主体研究路线,选取R语言平台的网页爬取工具从FULink后台获取、清洗和存储文献传递服务的日志数据,利用Tableau大数据可视化平台的数据汇聚和透视功能形成联盟文献传递行为数据集,一方面从文献类型、文献保障时效和文献流向等角度分析FULink 的稀缺资源保障效益;另一方面按照用户细分指标体系抽取、计算和存储对应指标值,依据数据分布特征选型适宜的聚类模型算法,对所有成员馆的行为数据展开基于聚类的成员馆用户细分,对比分析、可视化展示不同聚类的文献获取与传递行为特征,最后根据细分结果提出相应的文献传递差异化服务策略。
图1 区域高校图书馆联盟文献传递服务的用户细分实证框架
3 实证分析
3.1 FULink平台的资源保障特征分析
(1)文献申请总量和文献类型分布。截至2018 年 12 月 31 日,FULink 所有成员馆申请传递的文献量共计 2,929,789 条,分 7 种文献类型,分类汇聚情况如表1所示。其中,期刊、学位论文和图书的申请量居前三位,远超其他类型。文献申请总量在2014 年和2016 年达到峰值,2017年后下降趋势明显。
表1 FULink联盟文献传递申请类型统计(2012.09-2018.12) (单位:条)
(2)文献传递时效。选取文献申请和响应时间两个字段计算差值,大部分介于0~6小时,见图2。1小时之内响应的占16.81%,4小时以内的达到31.21%,1 天之内的文献响应高达98.92%。以2018年为例,平均文献响应时间为7.7 小时。通过文献调研[19]和咨询同类型联盟,相比国内其他文献传递平台,FULink文献传递的时效最高,文献响应快速有效,较好地保障了成员馆缺藏文献的获取需求。
图2 FULink中心平台文献传递响应时效分布图 (单位:小时)
(3)文献整合效益。为可视化展示FULink的文献供给保障能力,采用和弦图呈现FULink与各成员馆的文献传递流向和数量关系。和弦图常被用于表示两者间的数据关系和流量,不同颜色的每个圆环表示一个节点,弧长及标尺表示数据量大小。环内侧不同颜色的连接带表示数据流向、数量级和位置信息。在R语言平台上通过RODBC函数包连接存储数据库,按自然年汇聚FULink平台与各成员馆的文献传递数值邻接矩阵,绘制结果见图3。成员馆FZU(以字符简写代表成员馆,下同)、FJNU 和FAFU申请的文献量最多,其他馆的申请量从圆环节点下方自右向左依次递减。分析(图3下方每个圆环节点表示的)成员馆历年文献申请数量,条状带呈现逐年递减趋势。从和弦图上半区域7个表示FULink 平台每年传递量的圆环节点观察,平台响应的文献申请总量除2012 年刚起步数量较少外,其他历年基本持平,2016年后稳中有降。
3.2 FULink成员馆的用户细分
(1)数据特征分析与算法选择 。根据上述确立的成员馆用户细分指标,对现有数据集按设计字段抽取相应数据汇聚到Tableau上,数据导入并连接R语言平台展开聚类前的描述性统计分析,如表2所示。标准方差和均值较大,各个字段经过正态分布检验,大多数字段属于偏态分布。
基于表2数据的分布特征和聚类分析的模型特点,个别成员馆在文献传递数、文献申请数取值较大时,聚类分析时在其他特征字段上的取值也会较大。为取消量纲不一致的影响,采用scale 函数对所有待聚类数据标准化处理,实现特征缩放达到聚类结果权重一致。然后通过get_clust_tendency函数评估数据集是否具备聚类的可能性。运算获取的hopkins_stat值为0.134(<0.5),表明数据高度可聚合。结合plot子字段汇聚图来看,存在高度可聚类。
图3 FULink中心门户传递至各成员馆的历年文献量统计(2012~2018)
表2 FULink资源特征聚类变量描述性统计(2012.09-2018.12) (单位:条)
因为聚类分析属于无监督学习的算法,对于某一类样本应归属于哪一个聚类并无任何先验知识,加之实证数据集中存在较多极端值,易对聚类分析产生离群点干扰。故此,参照相关聚类分析实证,采用Kmeans算法对数据集聚类,为确保聚类质量,一般多次使用随机种子确定待选的簇数,再使用轮廓系数评估聚类结果的优劣。本文采用肘方法(elbow)确立最佳簇数。肘方法原理为:在给定的k>0情况下,计算族内方差和var(k),每增加簇数都有助于降低内方差之和。而当曲线出现第一个拐点,即为最佳的簇数。故此,采用R语言的sjPlot包sjc.elbow函数预估聚类数,初始设定为15个,如图4(上)的折线图所示。可以看出,最佳聚类数为3个或者4个。据此分别调用kmeans函数聚类,两次聚类结果的可视化如图4(中、下)所示。factoextra的fviz_nbclust 函数确定最佳的聚类数,方法设置为组内平方差(WSS)方法。从图4的聚类分布看出,聚类个数为3、4时,FZU数据点因各项字段值偏高离群而产生被剥离的情况。从聚类结果的分布图观察,95%的数据分布在右侧空间内,而剩下的5%的数据分布在其余的大空间内(限于篇幅本文不展示后续聚类结果)。当聚类个数不断增加时,Kmeans模型继续对剩余95%空间内的数据往下细分,因为差异只能在这些数据之间继续下探和剥离。结合FULink 的业务发展路径、实际的数据分布和图4(上)肘拐点曲线变化趋势,本文实证倾向于将图4(中、下)3 个离群点聚为一类,而对剩余的数据点再次分类。
(2)聚类分析。经过多个已有的聚类算法筛选[20]和数据集的多次测试,本文采用RForML深度学习的聚类模型包flexclust,其kcca函数内置的神经气体(Neural Gas)算法符合本次实证需要的聚类选择,该方法的主要思想是通过评估在先前的适应步骤期间收集的局部统计测量值,将新单元连续地添加到最初的小型网络中。它引入竞争神经网络机制,最接近数据点的神经元竞争获胜并被激活,朝向数据点移动从而形成聚类[21]。据此,通过set.seed函数设置随机种子以复现本次聚类,遵循类内相似和类间分类的聚类原则,基于前述分析的限制条件等先验知识,调用kcca函数运算获取的最终聚类结果为4 个。将聚类结果数据导入barchart函数,在R语言平台上可视化展示的聚类段剖图如图5所示。运用R语言的MASS包将上述用户细分聚类结果展开显著性检验。在α=0.05的水平上,除院校类型外,在学校层次、加入联盟时间、用户数、研究生数、教师数、馆藏图书和馆藏期刊等均存在显著差异。这说明FULink成员馆在文献传递服务上的申请和传递行为与上述几个因素紧密相关,区域高校图书馆联盟服务于每个细分市场的差异营销可据此展开讨论。
图4 聚类结果为4个的可视化展示
图5 FULink成员馆文献传递服务的聚类段剖图
(3)用户细分结果及可视化展示。根据图5各字段均值分布和柱状图长短情况,参照用户细分中对于用户生命周期“初生期、成长期、稳定期、成熟期、衰退期和流失期”的定义和命名方式[22],结合文献传递服务的特征,以用户行为状态和类型的划分逻辑将4个用户细分市场做如下命名:聚类1除了少数几个指标外,各项指标均超过(红点)均值且是所有聚类最高的,可命名为成熟期成员馆;聚类2 各项指标均未达到均值,此聚类成员大部分是刚加入FULink 的新成员馆,可命名为初生期成员馆;聚类3同聚类2相比,传递效益和各种文献类型传递数等字段的均值相对较高,文献申请量和传递量近几年都处于持续增长态势,可命名为成长期成员馆;聚类4 除加盟时长字段外,各种文献类型申请传递数均处于均值附近,申请IP、申请邮箱数、文献申请量等指标基本稳定持平,可命名为稳定期成员馆。据此,采用雷达图将聚类结果以画像集中展示,在R语言平台上调用ggradar函数,用户细分的4个聚类在各个字段的指标值表现见图6。
(4)成员馆细分市场之间的申请与传递关系分析。经过上述基于聚类分析的用户细分,通过Tableau 平台将成员馆汇聚到每个细分市场,抽取相应字段计算得出文献申请与传递关系表(表3)。从数量关系来看,成熟期成员馆的文献申请和传递量最高,稳定期和成长期成员馆的文献申请和传递比基本持平,初生期成员馆的文献申请和传递比最高。
图6 FULink各成员馆聚类结果画像展示雷达图
表3 FULink成员馆细分市场之间的文献申请与传递关系表(2012.09~2018.12) (单位:条)
3.3 FULink联盟文献传递细分市场特征分析
(1)中心门户资源保障特征。从实证分析获取的结果来看,FULink 文献传递服务具备了“快传”的核心特质,契合了用户获取缺藏文献的时效性需求,让成员馆用户体验到了资源整合获取的便捷性和易用性,已然成为FULink 联盟的核心服务。虽然中心门户与各成员馆的和弦图关系展示结果再次印证了图书馆联盟文献传递量日益下降且不可逆转的事实[23],但这不排除与学术文献开放获取加速、互联网学术文献商业性提供蓬勃发展等因素拓展了其他获取文献渠道紧密相关[24-25]。而总体来说,本次实证从定量分析上清晰展现了以FULink 为代表的区域高校图书馆联盟带给成员馆高效的文献传递服务保障。
(2)成员馆用户细分市场1:成熟期成员馆特征(6%)。该聚类包含FZU、FJNU和FAFU3个成员馆,文献传递申请总量占FULink 平台的67.5%。从3馆的自身条件来看,其均为FULink的发起馆,馆藏资源总量最大,服务的用户数最多。从图6可以看出,该聚类成员馆期刊、学位论文和会议论文等文献类型的传递保障率最好,虽然其他文献类型传递数有短板,但总的文献传递效益最高。该聚类成员馆用户的资源获取行为特征:申请文献传递的邮箱数(71.71%)和IP 数(88.23%)占比最高,结合邮箱个数、用户数、教师数等指标分析,该聚类用户申请邮箱个数均值超过1 个,而且文献申请类型覆盖面广,还出现了同一位用户在FULink 的不同成员馆申请文献的行为特征。对申请时段的数据下探抽取分析发现,请求时间分布于每日的9~24点,1~7点也有一定的申请量。FULink平台已成为该聚类成员馆用户资源检索的主要入口和稀缺文献获取的首要途径,平台用户粘性较强,使用率高。
(3)成员馆用户细分市场2:稳定期成员馆特征(19%)。该聚类涵盖FJMU、FJTCM、FJUT和FJJXU等10个成员馆,以FULink联盟的发起馆居多。其馆藏资源、用户数、教师数和研究生数处于FULink 联盟的平均值,文献传递申请量占比达到了15.97%。各项行为指标数值均处于平均值附近,文献传递效益略显乏力且不及成长期成员馆。该聚类成员馆用户的资源获取行为特征为:申请文献传递的邮箱数(17.85%)和IP 数(0.06%)高于成长期成员馆,文献申请数量持续平稳,覆盖了各种文献类型,请求时间集中于9~11 点、15~16 点、20~22 点3 个时段,根据网络采样调研,其他时段请求较少的原因是受到VPN体验不佳、网络环境不稳定和校园网临时关闭等因素限制。这些都充分说明该细分市场的成员馆在平台的使用率高,对FULink 稀缺文献的保障力认知程度较高,但从该聚类用户邮箱的文献传递数来看,用户流失较高,文献申请量下降较快,近两年申请总量均低于成长期成员馆。
(4)成员馆用户细分市场3:成长期成员馆特征(13%)。该聚类包含XMU、HQU和JMU等7个成员馆。其馆藏资源、用户数、教师数和研究生数仅次于成熟期成员馆,尽管加入联盟时间较短,但文献申请量占据了12.17%,最为显著的特征为文献传递效益较好,尤其是图书、标准、报纸、专利等类型的传递供给,在图6中与成熟期聚类形成资源互补,有效丰富了FULink 平台的稀缺文献传递类型。该聚类成员馆用户的资源获取行为特征为:申请文献传递的邮箱数(8.99%)和IP 数(0.05%)占比低于平均值,除期刊外,其他类型的文献申请量接近平均值且较均衡,文献申请时间多集中于10~11点、20~22点和15~17点3个时段,该聚类成员馆的用户使用时段和频率尚处于上升期,对于FULink 在稀缺文献保障上的认知程度不够。
(5)成员馆用户细分市场4:初生期成员馆特征(62%)。该聚类包含上述聚类之外的本科、专科和高职院校等类型的33个成员馆。以新加入FULink的成员馆居多,文献传递申请量也仅占比4.36%。从图6可以看出,各项行为指标值尚处于起步阶段。该聚类成员馆用户的资源获取行为特征为:申请文献传递的邮箱数(1.45%)占比低,IP数(11.66%)因该细分市场的成员馆多而占比高,文献请求时间集中于10~11点、15~16点两个时段,其申请总量年均维持2000 条左右。该聚类的成员馆用户还处于FULink 的认知和使用初期,正在逐步与FULink 平台进行磨合和馆藏资源需求调适。因该聚类成员馆的馆藏资源规模相对比较小,从表3 得出的申请传递比来看,FULink能极大程度保障该聚类的缺藏文献需求。
4 区域高校图书馆联盟文献传递服务的用户细分策略
要深入推进区域高校图书馆联盟文献传递服务,需要加强中心门户和成员馆的馆藏资源对接与嵌入,提高整合后各种文献类型的可见性和易获取性,尤其在会议论文、专利、标准和报纸等文献类型。在传递时效方面,要提高文献传递任务调度过程中自动匹配馆藏和快速调度的效率,调整和优化文献申请队列的负载均衡策略,实现联盟数字资源的优化配置和高效响应。在文献传递服务的覆盖范围方面,要协调各成员馆优化平台资源访问的网络环境,保障用户使用时段的连续性,积极探索采用机构关联账号或者对接校园统一身份认证等便利的访问机制,从而提升文献传递服务的易获得性和可用性。
对成熟期成员馆,要积极推进成员馆不断完善自有馆藏资源与联盟资源的整合揭示,发挥其在联盟中的资源供给优势和传递效益,更好地支撑联盟稀缺文献的保障能力。用户服务方面,定期收集文献传递的用户反馈和质量评价,加强文献传递服务的各项功能优化和用户体验提升,减少用户流失,激活沉睡用户,实现用户在联盟中的更新迭代。不断累积成熟期成员馆的营销效应,带动联盟其他聚类的成员馆发展和用户增长。
对稳定期成员馆,联盟要深化其资源共建共享的共识,引导其进一步提高与联盟平台之间的资源互补和整合程度,利用联盟的一站式资源揭示和文献获取功能,拉动该聚类在联盟平台上的资源贡献率。在用户服务方面,分析、调研和对比稳定期中处在流失、蒸馏和稳定等3个阶段用户的资源诉求,发掘其资源需求痛点,寻求更大的契合点和用户粘性,减少平台使用的网络限制,优化网络环境,触发用户使用联盟平台的意愿,提高他们在联盟平台的文献传递申请数量。从而激发更多的用户稀缺文献需求,实现该聚类用户的快速增长,逐步向成熟期成员馆的阶段转化。
对成长期成员馆,联盟要积极引导其发挥自身馆藏数字资源对联盟中心门户的传递保障能力,在网络安全等级保护的框架下,理顺、优化和保障文献传递代理服务器与联盟平台的顺畅连接。在用户服务与宣传推广方面,可借鉴成熟期成员馆的优秀经验,加强联盟文献传递服务的宣传推广以提高用户对联盟的认知,减少网络限制以提高使用频率和时段范围,借助新媒体开展专题推广活动以扩大用户覆盖面,实现用户快速增长。联盟也要积极与其融合与对接数字资源馆藏,寻求更好的资源共享和揭示模式,推进该聚类成员馆向成熟期阶段转化。
对初生期成员馆,联盟要积极引导其借鉴其他馆平台对接、服务宣传和用户推广等方面的成功经验,广泛调研和掌握用户对于稀缺文献资源的需求共同点,打造核心用户群,广泛推广联盟的文献资源保障功能。缩短初生期用户的认知培育时间,加速向稳定期和成熟期成长转化。
5 结语
本研究从传递总量、文献类型、传递效益和传递流向等不同视角呈现和展示了区域高校图书馆联盟文献传递服务强大的资源保障效益,详细描述了各个成员馆在联盟文献传递的共建共享行为,对处于成熟期、成长期、稳定期和初生期等不同用户细分市场的成员馆给出了相适宜的精准服务发展策略。本研究的局限性:(1)由于缺乏FULink 移动APP 的传递行为数据,未能全面揭示全终端的稀缺文献获取行为特征。虽然通过肘方法验证了聚类结果的普适性,但有条件时仍需进一步采集和汇聚用户在移动APP的行为数据,从而增强用户细分理论在支撑精准营销服务上的可用性。(2)获取的成员馆细分结果,还需借助后续文献传递行为数据跟踪、模型迭代修正和叠加增量数据等方式进一步验证此种聚类的合理性和有效性。尤其需要借助文本分析工具挖掘成员馆之间传递文献的学科属性、研究领域和文献类型,从而精确地辅助每个成员馆确立未来馆藏数字资源建设的方向。未来考虑横向与纵向相结合的研究方法不断丰富和完善区域高校图书馆联盟用户细分的理论体系和实践研究,为联盟发展提供更为精准化的数据支撑和决策建议。