基于图书馆座位管理系统的用户行为分析*
2019-12-12尹相权
尹相权
基于图书馆座位管理系统的用户行为分析*
尹相权
(北京师范大学图书馆,北京 100875)
移动服务的兴起使得高校图书馆空间服务从单一方式演变为多方式,通过不同服务方式的用户行为对比分析,对高校图书馆空间服务改进具有重要意义。采用图书馆营销的理念,提出一个结合用户细分模型和方式细分模型的用户行为分析模型,以用户黏度、用户活跃度和用户产出作为用户行为指标,在用户细分和方式细分的基础上,通过描述性数据分析方法、聚类、多因素方差分析法,对北京师范大学图书馆座位管理系统为期2.5年的用户行为数据进行分析,并根据分析结果提出图书馆座位管理系统应进一步加强移动方式宣传、利用座位聚类结果开展个性化推荐等改进策略。
图书馆座位管理系统;图书馆营销;用户行为分析;用户黏度;移动服务
随着信息共享空间等概念的兴起,图书馆以用户为中心的设计和管理,尤其是学习空间的管理日益得到关注。如今的读者大量利用现代技术和数字化信息,图书馆需要了解新一代读者利用图书馆的习惯,进而有针对性地为其提供学习及阅读空间,如信息空间、学习空间等[1]。其中,座位空间预约服务由于服务范围广(可面向全部读者)、可解决图书馆普遍存在的占座问题、工程实现难度低等原因,已在多数高校图书馆普及。得益于宽带无线接入技术和移动终端技术的飞速发展,高校图书馆的座位空间服务逐渐从单一服务方式转变为多元化服务方式,部分图书馆已经提供万维网服务平台、移动服务APP、微信公众号平台以及图书馆服务终端等多种座位预约方式[2-4]。那么,投入使用这些服务方式后,用户对图书馆座位的利用率是否有所提高?如何从经济学的角度来衡量座位的利用率?在诸多服务方式中,用户会更倾向于选择哪种服务方式?不同预约方式用户的行为习惯有哪些异同?通过分析这些问题,各高校图书馆可借助技术手段培养用户利用图书馆空间资源的良好习惯,为高校图书馆选择何种方式提供预约、如何改善预约服务提供数据支持,从而提高高校图书馆空间资源的利用率,最终形成用户使用方便、图书馆管理科学的双赢局面。
已有研究采用网络调研方式确立读者行为分析的变量,并通过座位管理后台获取实证研究和跟踪分析,确定服务改进策略[5]。另外,图书馆座位管理系统在用户实际使用过程中产生大量历史数据,这些海量历史数据中隐含了用户的行为习惯信息,为开展深入的用户行为分析提供了研究基础。因此,也有研究基于座位管理系统日志数据开展用户行为分析。储文静等[6]基于江西师范大学图书馆座位管理系统数据,使用数理统计方法从自习位置选择偏好、选座行为偏好等方面分析读者自习行为,将读者分为研究生和本科生,统计了刷卡选座、预约选座和重新选座的频次,未进一步开展基于用户细分模型和选座方式的深度分析。为此,笔者调研了图书情报领域利用数据挖掘方法开展深度用户行为分析工作,按照工作方法可分为两类。①描述性以及推断性分析方法。安徽省图书馆基于Web日志进行图书馆用户行为的描述性以及推断性的分析,找出了安徽省图书馆用户行为存在的问题[7]。②基于机器学习的方法,其中又包括基于聚类和基于关联规则两类研究。基于聚类的研究中,黄兰等[8]以图书馆读者借阅量为实例,利用统计分析系统(SAS)的聚类技术对图书馆读者社群进行数据挖掘;重庆理工大学图书馆利用数据挖掘聚类方法中的系统聚类算法设计了相应的体系构架,结合重庆理工大学图书馆读者借阅业务需求,建立了图书馆读者细分模型[9];邱均平等[10]采用聚类方法,从基于检索字段的书目数据聚类、基于用户分类的书目数据聚类、基于用户资源利用行为数据统计分析的聚类完善OPAC资源揭示及书目推送服务;谢发徽[5]基于K-means聚类对网络调研数据开展分析。基于关联规则的研究中,关联规则挖掘的目标是发现大量数据项集之间的关联或相关联系,如果两项或多项属性之间存在关联,那么其中一项的属性就可以依据其他属性值进行预测[11-12]。已有研究中,陈淑英等[13]利用多维属性间关联规则数据挖掘技术,对不同专业用户群体4年图书借阅数据进行分析;艾金勇[14]采用基于Fp-树的频繁方式增长算法找出隐藏在读者借阅行为中的关联规则;李欣[15]应用强关联规则算法在图书借阅和信息查询数据的分析中,减少图书频繁项集的产生,避免冗余规则的挖掘和生成。
纵观已有研究,深度用户行为分析方法大多基于读者借阅数据并应用于数字图书馆电子资源推送以及借阅数据推送等方面,尚没有基于座位管理系统实际使用数据的、探究用户预约方式对用户行为影响的深度用户行为分析模型。图书馆营销(library marketing)从20世纪90年代进入飞速发展阶段,其中一个很重要的理念是用产品概念来设计图书馆服务[16]。将图书馆座位管理系统视为产品,则营销网站的评价体系适用于座位管理系统的用户行为分析。因此,本研究提出一个结合用户细分模型和方式细分模型的用户行为分析模型,以用户黏度、用户活跃度和用户产出为用户行为指标,在用户细分和方式细分的基础上,通过描述性统计分析方法、聚类、多因素方差分析法,按照用户行为指标开展数据挖掘,为确定服务改进策略提供数据支持。
1 基于用户细分和途径细分的用户行为分析模型
参考大多数网站的用户行为分析[17],在座位管理系统的用户行为分析的用户行为指标中,主要关注读者的黏度、活跃度和产出。其中,读者黏度主要关注读者在一段时间内持续访问和使用座位管理系统的情况,更强调一种持续的状态,这里将访问频率、访问时长指标归到黏度的分类。活跃度更多地针对读者具体的座位使用情况,考察座位使用随时间变化的规律以及座位使用与用户的关联,前者按时间的特性(周一到周日)以及预约时间长度特性,统计平均日预约频次和长/短时预约频次;后者把读者细分为读者类型以及年级,考察不同读者类型在不同预约方式的预约活跃度。产出代表业务衡量,考虑到图书馆的非营利性质,选择座位的总体使用量、座位选择倾向代表座位管理系统的产出。
基于用户细分和方式细分的用户行为分析研究路线如图1所示,获取座位管理系统数据后,根据用户维度和预约方式维度进行数据分割,并进一步开展用户行为分析。将用户行为分析的指标设定为用户黏度、用户活跃度和用户产出,使用描述性统计分析方法、聚类方法和多因素方差分析方法开展分析,并将分析结果应用于改进系统运行策略。用户细分的维度包括用户类型和年级,方式分为触屏机、网页、APP和微信,其中,由于网页、APP和微信的移动特性,在本研究中合称为移动方式。用户行为分析中的聚类分析主要用于基于用户产出(即座位的使用频次以及使用时长)产生座位的分类信息,并以此分类信息考察不同方式用户偏好之间的共性以及差异;多因素方差分析主要用于挖掘座位偏好与座位特性之间的关联。
2 用户行为分析
选取北京师范大学图书馆2016年9月5日—2019年1月19日中文阅览室的座位管理系统日志数据作为研究对象。由于北京师范大学图书馆的移动APP和微信正式上线时间在2018年9月,故4个方式的对比分析仅使用2018学年秋季学期的数据。
2.1 用户黏度分析
用户黏度分析的目标为考察使用不同方式进行预约的用户对座位管理系统的访问频率和访问时长情况。表1对比了2016年、2017年和2018年秋季学期的使用率,对比发现,预约平均时长呈递增趋势,与2017年秋季学期相比,2018年秋季学期预约平均时长提高5.85%;2018年秋季学期移动用户数量有显著增长,与2017年秋季学期相比,增加46.31%,且有效提高了用户平均使用时长(41.65%),充分说明新的预约方式给图书馆座位管理系统带来了更高的用户黏度。另外,同时使用触屏机和移动方式的用户也呈现增加趋势,从23.91%逐渐增加到26.35%、35.38%,说明越来越多的用户使用多种预约方式。
图2进一步对比了移动方式与触屏机方式在2016年9月—2018年7月每月预约统计对比情况。如图2所示,触屏机预约模式为主流预约模式,两种方式的趋势相近,当触屏机方式预约量下降时,移动方式预约量也会下降,反之亦然,相对而言,触屏机方式预约量波动较大;在4个学期中,有3个学期的期末,移动相对于触屏机的使用均有一定程度下降,以上信息说明用户在座位相对紧张的时间,大部分还是倾向于选择使用触屏机方式,移动方式还有一定的服务提升空间。
笔者进一步提取了2018年9月—2019年1月的移动模式数据,进行了触屏机、网页、APP和微信4种预约方式的行为模式对比研究。如图3所示,APP预约和微信预约的比例呈持续增长态势。这进一步说明了用户使用移动方式的增长趋势。
2.2 用户活跃度分析
用户活跃度更多地针对读者具体的座位使用情况,考察座位使用随时间变化的规律以及座位使用与不同类型用户的关联。考虑长时间段预约和短时间段预约的比例是影响空间利用率的重要因素,有必要按照不同时间段对不同方式的预约行为进行考察,为此,笔者把使用时间分为6个时间段:上午(7:00—12:00)、下午(12:00—18:00)、晚上(18:00—22:00)、上午—下午、上午—晚上、下午—晚上,例如“上午—晚上”,代表预约开始时间属于上午,预约结束时间属于下午,统计了不同时间段的预约行为,结果如表2(a)所示。两种预约方式的下午时段和上午—下午时段预约数相对较少,上午—晚上时段预约数相对较多,用户更倾向于使用较长时间段,且在较长时间段的预约行为中,移动方式的使用比例有所提高,说明移动方式预约长时间段具有一定优势或者更为便利。不同方式日平均预约频次对比如表2(b)所示,用户更倾向于在周一—周四使用自习空间,且在周五、周六和周日使用移动方式预约的比例会有一定提高。
表3展示了图书馆用户移动方式预约总计与触屏机方式预约总计比率的分用户类型的对比分析结果。其中,本科生使用移动方式的比例明显高于硕士生和博士生,留学生使用移动方式的比例最低,高年级学生(本科四年级、硕士生三年级、博士生三年级)会更倾向于使用移动方式。另外,在本科阶段和博士阶段,新生相对二年级学生使用移动服务的比率更高,说明新生阶段为习惯养成阶段,学生对不同预约方式接受度较高;而硕士生阶段该变化不明显,推测原因为部分硕士生中一年级新生为本校本科生,真正意义上的新生比例偏低。留学生较少使用移动频道,说明移动频道在多语言推广工作方面仍需加强。
2.3 用户产出分析
参考网站将用户选择的订单作为用户产出,研究将用户选择的座位作为座位管理系统产出的内容,将特定学习空间、特定时间范围、分行为方式的座位偏好作为用户产出开展分析。收集2.5年内实验记录共计3 890 077条。
从图4的座位使用时长分布可以看出,几乎所有座位的有效使用时长均超过20个月,少数座位甚至超过30个月,使用率较高,但仍有一定的提升空间。
关于预约方式的产出情况,本文分别统计了触屏机、网页、APP和微信的使用时长,并按照使用率从高到低的顺序对座位进行排序,取前60位进行对比分析,探讨不同方式的座位偏好。仅通过座位编号来表征座位会忽略不同座位的共性信息,为提取座位的共性信息,尽可能忽略座位编号本身带来的差异,根据座位的使用频次和使用时长,使用K-means聚类方法,对座位进行聚类分析。使用组内误差平方和法,选取最佳聚类个数4,聚类结果如图5所示。座位时长与座位使用频率正相关,按使用率从低到高排序,依次为簇4、簇3、簇1和簇2。
图6展示了不同预约方式的选座偏好,不同形状的点分别代表座位的不同类别。其中,不同预约方式的选座偏好具有一定差异,触屏机模式和微信预约模式受欢迎的座位编号分布较为分散,网页方式对编号为1~20的座位更为青睐,APP方式对座位的偏好可明显分为0~50以及150~180两大区间。统计各个方式之间的交集发现,网页方式与APP方式,网页方式与微信方式,APP方式与微信方式分别有36个,20个和18个共同座位;触屏机方式与网页方式、APP方式和微信方式分别有6个、2个和8个共同座位,说明网页方式、APP方式和微信方式的行为规律具有一定共性。从座位类别分布来看,4种方式最受欢迎的座位为类别1、类别3、类别4,分别对应图5中的簇1、簇2和簇3。其中,触屏机和APP的座位类别分布比较相似,而微信方式与其他方式的类别分布差异较大,类别分布更为随机。
为更具体地看各个影响因素的不同水平与观测变量的相关性,使用线形回归算法对最邻近图书分类(CD/D/F/GF/HG/MID)、是否靠墙(WALL)、方位(N/S)、是否临近洗手间(WC)、是否有挡板(BAFF)5个因素进行回归分析,结果见公式1。
最邻近图书分类CD、靠墙、邻近洗手间以及具有挡板与受欢迎程度正相关,其余水平与受欢迎程度负相关或不相关。
3 用户行为相关问题分析
以图书馆营销相关用户行为指标(用户黏度、用户活跃度和用户产出)为视角,对北京师范大学图书馆座位预约管理系统数据的深度用户行为分析,发现图书馆座位管理系统用户行为具有明显的规律,且不同方式的用户行为具有明显差异。
用户黏度分析表明,座位使用率有递增趋势,预约平均时长显著增加,这从侧面说明了图书馆的座位管理系统在提高座位管理系统服务方面取得了一定成效。考虑到2016年以来图书馆在服务改进方面最突出的工作是新预约方式的引进,推测座位使用率的提高与新预约方式的引进使得座位预约更为便利有关。同时,座位使用率仍有一定的提升空间。在所有的预约方式中,用户行为存在以下规律:连续两个学年中,每年11月和12月都是用户访问量最高的月份,推测与临近期末考试或考研考试相关;周一到周四的预约量明显高于周五、周六、周日;长时段预约量明显高于短时段预约量;触屏机的预约量明显高于移动预约量,期末时间尤其明显。每到学期的最后一个月,图书馆座位的整体预约率会显著下降,同时触屏机方式的使用比率会有一定上升,说明在座位使用率不饱和的时间,用户到馆直接使用触屏机方式预约的人数会有所增加。以上分析结果表明,为进一步提升座位使用率,图书馆应该更加关注“休闲时间”的图书馆座位使用率提升问题。
用户黏度和用户活跃度分析表明,移动方式服务用户黏度和用户活跃度具有递增趋势。与触屏机方式相比,移动方式的服务量虽然较低,但已显现出其独特的优势。例如,在周五、周六和周日相对休闲的时间,移动预约比率有明显增长,且随着学生年级的增长,移动预约比率也有明显增长。随着APP和微信服务方式的开启以及推广应用,移动方式与触屏机方式的用户量差距在逐渐缩小。另外,留学生使用移动方式的比例偏低,具有很大的增长空间。移动方式在“休闲时间”的优势以及巨大的服务提升空间,为进一步提高图书馆座位服务找到了实施点,即图书馆应进一步提高移动方式在新用户(尤其是留学生)中的宣传力度,并根据用户使用情况,增加休闲时段座位推送信息,吸引用户到图书馆开展学习和研究。
用户产出分析表明,不同预约方式的座位偏好具有一定差异。各方式最受欢迎的前60个座位中,不同移动方式(包括网页方式、APP方式和微信方式),用户的座位偏好具有一定共性,而触屏机方式和移动方式的交集较小。移动方式中,微信方式的偏好座位更为随机,可能与微信方式无法查看座位分布图有关。基于类别的分析发现,4种方式最受欢迎的座位集中在其中的3个类别,触屏机方式和APP方式的最受欢迎座位类别具有较高的共性,而微信方式的类别分布与其他座位类别分布差异较大。另外,在座位本身的特性中,最邻近图书分类、是否靠墙、方位、是否临近洗手间、是否有挡板、最邻近图书分类与是否靠墙的交互因素对座位的受欢迎程度影响较大。从整体来看,用户更倾向于最邻近图书分类C-D、靠墙、邻近洗手间以及具有挡板的座位。座位偏好分析结果表明,图书馆用户对隐私性和便利性均有一定要求,可以考虑在图书馆适当位置增加挡板,并在座位推送时,结合读者的专业来满足其对便利性的需求。
4 总结与建议
以图书馆营销为视角,对北京师范大学图书馆座位预约管理系统数据开展的用户行为分析结果表明:用户黏度有递增趋势,座位使用率有递增趋势,预约的平均时长显著增加;移动方式服务用户黏度和用户活跃度递增趋势明显,尤其体现在“休闲时间”以及长时间段预约;座位偏好与座位的隐私性以及便利性相关性较高。
以上基于用户黏度、用户活跃度以及用户行为进行分析得到的结论为进一步改进图书馆座位管理系统服务提供了严谨的数据论证和有益的启发。首先,建议图书馆将下一步的工作重点聚焦到“休闲时间”的图书馆座位使用率提升问题。在非工作日时间以及距离考试较远的时间,及时观测座位使用率变化并做出响应。进而,重点研究如何提升移动方式服务问题,进一步提高移动方式在新用户中的宣传力度。加强针对新生的移动座位预约宣传、培训工作,考虑到留学生使用移动服务的比例偏低,还应改进英文版本的移动座位预约指南,帮助留学生尽快学会使用移动预约方式,在提高移动方式使用率的同时,达到提高长时预约比例,进而提高座位利用率。最后,有必要根据用户使用情况,增加休闲时段座位推送信息,吸引用户到图书馆开展学习和研究。在座位推送时,应该同时考虑到座位的隐私性以及便利性,以进一步提高用户的满意度。此外,图书馆应排查频次低、时间短的座位产生原因,进一步提高该类座位的隐私性和便利性,如通过增加座位挡板提高该类座位对学生的吸引力等。
根据本文提出的模型实现图书馆座位个性化推荐是进一步研究的重要方向。根据用户的使用习惯,统计每位用户喜欢的座位分类,构建基于用户历史记录、座位使用特性以及座位本身特性的区分用户预约方式的多元化推荐模型。其中,用户历史记录提供用户更倾向于使用的预约方式以及历史座位。座位使用特性即基于座位的历史预约频率以及预约使用时长给座位打的分类标签;座位本身特性即指座位本身的硬件属性,包括是否邻近洗手间以及是否有挡板等。当用户选择某一种预约方式时,如微信预约时,系统自动根据用户历史记录中统计出的座位类别以及座位本身特性,从微信预约方式的座位产出列表中筛选候选座位,以进一步提高用户选座效率,进而提升图书馆座位的产出。
[1] 肖小勃,乔亚铭. 图书馆空间:布局及利用[J]. 大学图书馆学报,2014,32(4):103-107.
[2] 陈武,钱青,赵熊,等. 清华大学智能座位管理系统的设计与实现[J]. 现代图书情报技术,2013,29(10):90-95.
[3] 周瑶,刘畅,李建东. 图书馆微信座位预约应用开发——以西北民族大学为例[J]. 现代图书情报技术,2015,31(7):155-159.
[4] 顾朝兵. 高校图书馆多平台座位管理系统设计[J]. 电脑知识与技术,2014(24):5667-5670.
[5] 谢发徽. 高校图书馆座位管理系统的读者行为分析[J]. 图书馆论坛,2018(3):108-116.
[6] 储文静,储昭辉,许晓云. 基于座位管理系统数据的图书馆读者自习行为探究[J]. 图书馆研究,2017(5):107-112.
[7] 李祝启,陆和建,毛丹. 基于Web日志统计分析的公共图书馆用户行为研究[J]. 图书馆杂志,2014,33(7):39-46.
[8] 黄兰,郭志敏,习万球. 利用聚类技术对图书馆读者社群的研究分析[J]. 计算机工程与设计,2007,28(22):5552-5555.
[9] 聂珍. 一种基于系统聚类的图书馆读者细分模型[J]. 现代情报,2009,29(9):158-161.
[10] 邱均平,周毅. 聚类视角下图书馆OPAC资源揭示与推送服务探析[J]. 图书馆建设,2014(2):17-20.
[11] 熊拥军,陈春颖. 基于关联挖掘技术的数字图书馆个性化推送服务[J]. 图书情报工作,2010,54(1):125-129.
[12] 高俊峰,王淑梅. 基于概念格的数字图书馆信息推送服务方法研究[J]. 图书情报工作,2012,56(17):66,122-125.
[13] 陈淑英,徐剑英,刘玉魏,等. 关联规则应用下的高校图书馆图书推荐服务[J]. 图书馆论坛,2018(2):97-102.
[14] 艾金勇. 图书馆读者借阅行为的关联规则挖掘研究[J]. 情报探索,2017(1):40-43.
[15] 李欣. 强关联规则挖掘在智慧图书馆个性化推送服务中的应用研究[J]. 情报科学,2018,36(4):95-99.
[16] 张明霞,龚剑. 国内外图书馆营销研究述评[J]. 图书馆学研究(应用版),2010(3):7-10.
[17] 尤婷. 社交网站用户行为特征及其内在机制研究——以“人人网”为例[D]. 北京:北京邮电大学,2012.
An Analysis of Multiple-Way User Behaviors of Academic Library Seat Reservation System
YIN XiangQuan
( Beijing Normal University Library, Beijing 100875, China )
With the breakdown of mobile techniques, mobile ways of space services in academic libraries have been developed in recent years. It is important to understand the differences of user behaviors among different service ways for better services. Based on the library marketing theory, a user behavior model which is user specific and service way specific is rendered. The model takes user viscosity, user activity and user output as indicators, divides users and ways to different classes, and uses descriptive analysis, clustering and multivariate analysis of variance methods. The model is applied in the 2.5-year-long records of seat reservation system collected by Beijing Normal University Library, and strategies including an improvement of mobile service advertisement and a personalized recommendation based on the seat clustering results are suggested.
Library Seat Reservation System; Library Marketing; User Behavior Analysis; User Viscosity; Mobile Service
*本研究得到教育部人文社会科学研究规划基金项目“数据驱动的图书馆精细化服务模式与保障机制研究”(编号:17YJA870011)资助。
G250
10.3772/j.issn.1673-2286.2019.10.006
尹相权,男,1982年生,硕士,馆员,研究方向:图书情报领域数据挖掘,E-mail:yinxq@lib.bnu.edu.cn。
(2019-10-08)