数据包络分析视角下高校图书馆微博运营效率研究*
2015-12-23张敏尹帅君霍朝光刘玉佩
张敏,尹帅君,霍朝光,刘玉佩
数据包络分析视角下高校图书馆微博运营效率研究*
张敏,尹帅君,霍朝光,刘玉佩
文章选取高校图书馆微博内容、结构、影响力等为指标,构建基于投入产出分析的效率评价体系,借助Frontier Analyst对样本的运营效率展开定量分析。结果表明:大部分高校图书馆微博账号运营有效,微博关注需要剔除冗余保证质量,适时更新博文内容、关注博文质量是稳定关注的关键因素,加强粉丝数量和质量的管理对于全面提升运营效率意义重大。
图书馆微博 评价体系 运营效率 DEA
0 引言
微博作为互联网应用,吸引了近2.5亿用户,步入发展成熟期[1]。近年我国高校图书馆(以下简称“高校馆”)顺应新技术发展潮流和受众阅读习惯,纷纷设立图书馆微博。2009年重庆大学图书馆率先开通新浪微博账号,目前经过认证的高校馆微博近300个[2]。在此背景下,图书馆微博成为学界研究热点。本文以高校馆微博为对象,从投入产出视角,运用数据包络分析(Data Envelopment Analysis,DEA),研究图书馆微博运营效率:构建运营效率评价指标体系,收集“985工程”高校馆微博数据,选取相应的数据包络分析模型——基于BCC模型的含有不可控输入指标的改进模型,借助数据包络分析软件Frontier Analyst,对样本高校馆微博运营效率进行分析。根据DEA有效账号的指标贡献值情况和非DEA有效指标的改进值情况,对微博运营提出改进建议。
1 文献综述及研究方法
1.1 文献综述
为从宏观视角梳理图书馆微博发展整体状况,笔者以“主题=图书馆and主题=微博(精确匹配)”为检索条件,于2015年2月8日在中国知网中分别限定所有期刊和CSSCI期刊,得到关于图书馆微博研究的期刊论文年度分布(见图1)。图书馆微博研究从2009年兴起,目前进入相对稳定的时期。
图1 图书馆微博研究期刊论文年度分布
CSSCI源刊收录的172篇关于图书馆微博的研究文献共产生335个关键词,其中“微博”“图书馆”提及次数远超其他关键词,“高校图书馆”“信息服务”“公共图书馆”紧随其后。从CSSCI收录文献看,该领域研究按照图书馆类型的不同,主要可分为公共馆和高校馆,其中高校馆研究较多,主要有个案研究、整体分析、用户特征分析等。刘汝建以清华大学图书馆微博为个案,为高校馆微博发展提出建议[3];对整个高校馆微博应用的现状的调查和分析;高校馆用户认证及关注情况等特征的分析。在公共馆研究方面,主要有案例研究;整体分析,如张敏和刘凤[4]对省市级公共馆微博的交流对话特征的描述和分析;微博用户特征,及其与高校的对比研究等。按照研究层面不同,主要可分为图书馆微博信息传播研究和图书馆微博信息服务功能研究。微博信息传播研究又分为对单条微博影响力和微博账户影响力的研究,前者有考虑用户群体特征和微博内容特征的双层模型[5],后者有综合考虑传播深度和广度的能区别个体影响力差异的模型[6]。在信息服务功能研究上,有对辅助读者服务的探讨[7];有对微博信息服务质量的对比[8]。
从上述文献分析不难看出,鲜有涉及运营效率的定量研究。对特定类型的微博账号,由于其具有特定的服务人群和独特的微博内容,不能单纯以影响力来判断其运营好坏,而应从投入产出角度,考虑其运营效率,正如对非政府组织微博,应考虑其组织资源特征、注册状态特征和社会声望特征等对粉丝数产生的影响[9]。
1.2 研究方法
作为典型的评价决策单元相对有效性的非参数方法,数据包络分析被广泛应用于评价具有相同投入和产出指标体系的同类型组织,如学校、医院、银行、超市的生产绩效的优劣。其原理是保持决策单元的输入数据或输出数据不变,借助线性规划的方法确定DEA有效的生产前沿面,通过比较决策单元偏离DEA生产前沿面的程度来评价其相对有效性[10]。
自Charnes等人1978年提出数据包络分析最初的CCR模型[11]之后,研究者根据不同的应用需求和假设,提出不同的模型,如满足规模收益可变BCC模型。基础的DEA模型总是假设一种理想状态,即所有输入输出指标变量都是能够控制的,可以自由变化,然而现实生活中总是存在某些指标变量受限制的情况。为解决该问题,1989年Banker和Morey在BCC模型的基础上提出能处理含有不可控输入或输出指标变量的DEA模型[12]。
研究所用的数据分析软件Frontier Analyst是一款操作简单、功能强大的DEA分析软件,可应用在多个领域,如用于零售商、银行、医疗诊所的效率评价问题[13]。Frontier Analyst软件允许使用者根据数据情况,选择规模收益不变的CCR模型,或者规模收益可变的BCC模型。
2 高校馆微博运营效率评价指标体系构建
采用DEA定量分析方法来研究高校馆微博运营效率,首先要建立科学的输入、输出评价指标体系。Cha等研究推特用户的粉丝数、评论数和转发数,构建影响力模型[14];陈明亮等将微博视为传播媒介,提出基于接触、认知、说服和二次传播四个过程的影响力评价指标体系,并进一步通过层次分析法确定各指标权重,其中接触环节的微博使用时间,认知环节的原创微博数和原创微博率,说服环节的微博博主是否通过实名认证和微博博主业内知名度,以及二次传播环节的粉丝质量指数、粉丝互动率和粉丝转发次数被纳入最终的指标体系[15];赵阿敏和曹桂全以政务微博为研究对象,构建原始评价体系,并通过主成分分析方法将政务微博影响力指标因子分为公开-互动因子(粉丝数、微博数、原创数、@数、被@数、话题数)和获取-反馈因子(关注数、评论数、转发数和网络链接数)[16]。
上述以影响力为输出指标的研究对丰富图书馆微博的研究体系具有积极作用,但也存在一些问题,如未仔细区分博主自身的投入因素和产出因素,在实践中应该予以区分。总结前人研究发现,用作输入指标的微博运营特征主要有账户开设天数、微博数、日均微博数、原创数、原创率、微博内容丰富程度、关注数、认证情况、话题数、@数、网络链接数;用作输出指标的主要有粉丝数、被@数、评论数、转发数、活跃粉丝占比。
为保证评价体系的简约性,本文从时间性投入、内容性投入、结构性投入三个层面选取代表性输入指标变量,从粉丝数量和粉丝互动两方面选取代表性输出指标变量。在时间性投入方面,选取微博开设天数作为不能改变的指标变量;在内容性投入上,选取反映微博原创情况的微博原创率和反映微博更新频率的日均微博数作为指标变量;在结构性投入上,选择反映某一微博与其它微博账号关联程度的微博关注数作为指标变量。在输出指标选取中,选择微博粉丝数和互动率作为衡量微博运营输出的指标变量。
过去的研究往往以微博粉丝数及粉丝互动来评价运营质量的好坏,对目标人群大小不同的高校馆微博来说,这种评价不够科学。高校馆微博有特定的服务对象,即在校大学生。在校学生人数多的高校馆会有更多的微博粉丝,互动往往较为活跃。因此,需要将在校大学生的人数纳入评价体系。考虑到在校大学生人数往往不能轻易操控和改变,本研究将高校在校大学生数目作为不能改变的指标变量纳入输入指标中。最终的高校馆微博运营效率指标评价体系如表1所示。
表1 高校馆微博运营效率指标评价体系
3 高校馆微博运营效率评价
3.1 样本选取
本文以“985工程”涵盖的39所高校馆微博为研究对象。在新浪微博中搜索相应高校的官方图书馆微博,发现中南大学等9所高校的图书馆未开设新浪微博;在收集全日制在校学生数目时,没有找到四川大学等3所高校详细的在校生数据,因此,最终确定选取样本27个,分别是北京大学、北京航空航天大学、北京理工大学、北京师范大学、东北大学、东南大学、复旦大学、哈尔滨工业大学、湖南大学、华东师范大学、华南理工大学、兰州大学、南京大学、南开大学、清华大学、厦门大学、山东大学、上海交通大学、同济大学、武汉大学、西安交通大学、西北工业大学、西北农林科技大学、浙江大学、中国人民大学、中山大学、中央民族大学等高校的图书馆。
3.2 数据收集
本文通过微博风云平台(www.tfengyun. com)收集原创率、日均微博和互动率数据。关注数、开设天数和粉丝数通过各高校馆微博主页查找获得。学生数通过查找各高校门户网站的公开数据获得。
3.3 分析结果
(1)总体效率分析。利用Frontier Analyst软件,选择规模收益可变的BCC模型,设定开设天数和学生数目为不能控制的输入项,对27个高校馆微博决策单元进行分析,总体效率评价情况如表2所示。其中,有18个高校馆微博达到DEA有效水平,其余9个为非DEA有效。
表2 高校馆微博运营总体效率评价
(2)指标贡献值分析。综合DEA有效的18个高校馆微博的输入/输出指标贡献值数据,得到各个指标贡献值的均值、最大值和最小值,如表3所示。
表3 DEA有效单元输入/输出指标的贡献值
在输入指标中,平均贡献值最大的是关注数,日均微博和原创率的平均贡献值相差不大,不可控项学生数目和开设天数的平均贡献值几乎为0,符合其作为不可控指标的设定。图书馆微博具有社交网络的特征,节点之间的关系对于节点非常重要。关注数在效率评价体系中的贡献值正是对这一观点的佐证。关注数最大值和最小值之差小于日均微博和原创率的相关差值,说明该指标分布稳定性更高,即贡献大而稳定。相较而言,日均微博和原创率的贡献值分布稳定性较差,说明决策单元在这两个方面的表现参差不齐。虽然这些决策单元是相对有效的,但仍有可提升的空间。
在输出指标中,表征质量的互动率比表征数量的粉丝数的平均贡献值稍高,表明粉丝质量的重要性。因此,不能单纯考虑粉丝数量,也要关注粉丝质量。总的来说,两者相差不大,只有综合考虑了粉丝数量和粉丝质量,才能较好地了解微博的影响力。
(3)指标改进值分析。对非DEA有效的高校馆微博样本,利用Frontier Analyst投影分析功能,进行改进分析。综合非DEA有效的9个高校馆微博的输入/输出改进值数据,得到各个指标改进值,以及整体改进值的平均值、最大值和最小值(见表4)。
表4 非DEA有效单元输入/输出指标的改进值
在可控输入指标中,平均改进值最大的是关注数(可减少51.8%),接下来依次是日均微博(可减少44.5%)和原创率(可减少23.6%)。就非DEA有效的高校馆微博而言,在保证产出数据不变的前提下,可改变的输入项均存在不同程度的冗余,其中最为严重的是关注冗余,日均微博和原创率的冗余属于内容冗余,图书馆微博的内容应该是恰当的,对相关性不大的微博内容,可考虑不予发表。Frontier Analyst软件还会显示不可控指标的潜在改进量,因为这样的信息依然有用,表明更高的产出是可以实现的[17]。不可控输入指标学生数目和开设天数理论上的平均可减少值分别为6.2%和23.8%。高校馆微博的开设天数改进值说明其吸引的粉丝数和粉丝互动率远远没有达到应有的水平,值得反思。
在输出指标中,表征质量的互动率和表征数量的粉丝数的平均改进值均为0,符合在保持输出不变的情况下,最小化输入指标的分析思路。然而一般情况下,人们并不想保持目前的产出不变,而是希望尽量获得更高的产出。如何改善输入指标的质量而不仅仅是其数量,显得十分重要。
4 结论及建议
借助多投入多产出的生产效率分析方法DEA,本文提供了分析高校馆微博运营状况的新角度。数据分析结果显示,大部分的样本高校馆微博运营效率达到DEA有效的标准;各指标贡献值大小不同,应区别对待;对非DEA有效者,需酌情改善投入,提升效率。
在输入指标中,可控指标的平均贡献值有所不同。作为结构性投入的微博关注数贡献值最大,作为内容性投入的日均微博和原创率的平均贡献值则相对较小。高校馆微博需要注意自身的关注数量和质量,在保证质量的情况下避免冗余产生。要认真选择关注账号,选取质量较高,相关性较大的账号,比如其他高校馆微博、校内其他组织的官方微博、学术资源相关的微博,避免根据运营者个人爱好选择微博。在投入内容上,既要关注内容的数量,也要注重内容的质量,避免产生内容投入冗余现象,导致运营效率变差。控制每天的微博数量,避免刷屏引起关注者的不适。对微博内容质量进行把关,尽量少发与图书馆无关的、同质性较高的内容,尽量少转发意义较小的二手信息。
在输出指标中,粉丝数和互动率两者的平均贡献值较为接近,粉丝的数量和质量都是非常重要的评价指标。高校馆微博不仅要注意内容的吸引力,以带来粉丝数量的增加,更要注意与粉丝间的互动,以提升粉丝的活跃度。为此,高校馆微博要充分利用微博的互动功能,比如@功能,话题功能;策划互动交流的活动,如投票、评选;要定时登陆微博,及时解决粉丝疑问。
本文的研究对高校馆微博的管理者具有借鉴作用,在后续研究中将会联合高校馆官方数字平台,将网站与微博整合起来构建跨平台的指标评价体系,并整合层次分析法AHP和数据包络分析法DEA展开融合定性与定量的研究。
[1]中国互联网络中心.第35次中国互联网络发展状况统计报告[EB/OL].[2015-01-22].http://www.cnnic.net. cn/hlwfzyj/hlwxzbg/201502/P02015020355180205 4676.pdf.
[2]龚雪竹.公共图书馆和高校图书馆微博的比较分析[J].大学图书馆学报,2014(6):78-82.
[3]刘汝建.大学图书馆微博个案研究与启示——以清华大学图书馆微博为例[J].高校图书馆工作,2013,33(4):24-26.
[4]张敏,刘凤.我国公共图书馆微博平台的对话特征分析[J].图书馆学研究,2014(11):12-17.
[5]赵红,王璨,胡锋,等.基于多层结构的微博影响力决定因素研究[J].管理学报,2014,11(7):1062-1068.
[6]林琛.微博个体信息传播影响力评价模型研究[J].现代图书情报技术,2014,30(2):79-85.
[7]刘莹.高校图书馆利用微博拓展读者服务初探[J].图书馆工作与研究,2012(6):121-124.
[8]刘凤,张敏.中国公共图书馆微博信息服务质量的对比分析[J].图书馆学研究,2014(16):63-68.
[9]黄荣贵,桂勇.非政府组织的微博影响力及其影响因素——以环保非政府组织为例[J].学习与探索,2014(7):38-44.
[10]王亚东,安立仁.中国31个省市房地产业经营效率——基于DEA的实证研究[J].西安石油大学学报(社会科学版),2009,18(2):34-43.
[11]Charnes A,Cooper W W,Rhodes E.Measuring the efficiencyofdecision makingunits[J].European journalof operationalresearch,1978,2(6):429-444.
[12]Banker R D,Morey R C.Efficiency analysis for exogenously fixed inputs and outputs[J].Operations Research,1986,34(4):513-521
[13]Banxia Software Ltd.Banxia Frontier Analyst Data Envelopment Analysis for Professionals[EB/OL].[2015-01-22].http://www.banxia.com/frontier/.
[14]Cha M,Haddadi H,Benevenuto F,et al.Measuring UserInfluencein Twitter:TheMillion Follower Fallacy [J].ICWSM,2010,10-17.
[15]陈明亮,邱婷婷,谢莹.微博主影响力评价指标体系的科学构建[J].浙江大学学报(人文社会科学版),2014(2):53-63.
[16]赵阿敏,曹桂全.政务微博影响力评价与比较实证研究——基于因子分析和聚类分析[J].情报杂志,2014,33(3):107-112.
[17]BanxiaSoftware Ltd.An introduction to Frontier Analyst 4[EB/OL].[2015-01-25].http://www.banxia.com/ pdf/fa/Frontier4Brochure.pdf.
Operation Efficiency Evaluation of Academic Library Microblogs from the View of Data Envelopment Analysis
ZHANGMin,YINShuai-jun,HUOChao-guang,LIUYu-pei
This study selects university library microblogs as research objects,and designs efficiency evaluation index system based on input/output analysis,which including content,structure,influence and so forth.Frontier Analyst is applied to quantitatively analyze operation efficiency of these samples.The results show that most microblogs operate effectively.Microblogs following redundancy should be deleted to ensure their quality and quantity.The updating frequency and quality of microblog content are significant.Strengthening the management of followers’quality and quantity plays a great role in the process of operation efficiency promotion.
library microblog;evaluation system;operation efficiency;DEA
格式 张敏,尹帅君,霍朝光,等.数据包络分析视角下高校图书馆微博运营效率研究[J].图书馆论坛,2015(8):126-131.
张敏,女,博士,武汉大学信息资源研究中心副教授;尹帅君,霍朝光,刘玉佩,武汉大学信息资源研究中心硕士研究生。
2015-03-05
*本文系国家自然科学基金项目“Web2.0环境下基于社会化网络瓶颈限制的信息扩散最大化研究”(项目编号:71203166)研究成果之一