APP下载

基于信息熵和数据包络模型的公共图书馆绩效分析评价研究*
——以江苏省为例

2018-05-07南京工业大学信息服务部江苏南京211800

山东图书馆学刊 2018年2期
关键词:信息熵阅览室权重

吕 远(南京工业大学信息服务部,江苏南京 211800)

1 引言

一直以来,图书馆作为民众查阅文献信息的重要知识机构发挥着重要作用。特别是近几年,伴随着信息化、知识化时代的到来,图书馆作为知识的蕴藏地,在传播知识以及培养人才方面更是发挥着举足轻重的作用。在此背景下,各大高校的图书馆的建设经费也得到了大幅提高;相应的,图书馆在各种硬件设施、馆藏资源以及人力资源的数量和质量方面也有明显改善。

然而在如今数字化时代里,每年数字信息量都是呈指数级增长,图书、期刊等信息资源也是层出不穷,高校图书馆目前有限的投入资源在互联网一代的用户无限的知识需求面前就显得力不从心。如何对图书馆的投入产出绩效做出一个科学合理的评价,以及如何利用图书馆有限的投入资源并将其发挥出最大效用,增加图书馆的使用效率,促使其最终形成一个可持续性的长期发展模式就成为当下一个亟待解决的课题。

关于图书馆的评价研究的工作,国外相关学者起步较早。1973年,美国学者R.H.ORR发表的文章[1]《Measuring the Goodness of Library Services》中第一次对图书馆的定量评价提出了一个一般框架,分别针对图书馆服务中的质量和价值两个方面进行了阐述,这是西方学者对图书馆评价研究领域的一项具有重大影响的学术成果,为后世图书馆的服务研究提供了理论基础。1977年,美国伊利诺斯州立大学教授F.W.Lancaster对图书馆服务进行研究时,将图书馆服务划分为三个层次[2]:效果评价、效果-费用评价和效益费用评价,从多个维度对图书馆的的服务进行了评价,包括检索评价、藏书评价、目录评价等。1982年,加州大学伯克利分校教授M.K.Bucland在R.H.ORR成果的基础上进一步丰富和发展了其评价体系,着重从资源这个方面探讨了其图书馆服务的影响[3]。1990年,大英图书馆知名学者Maurice Line针对图书馆服务中的价值评价做了深入研究[4],将心理学中的知觉理论和经济学中的成本效益和成本收益理论引入进来,依据回报递减定律,指出图书馆的投入产出绩效比对图书馆发展的重要性,也是衡量图书馆管理者管理水平的重要指标之一。1998年,宾州大学教授SS Andaleeb等人提出了另一种图书馆服务的测度模式[5],即以用户满意为基点,设计了五个用户满意度命题,并进行了实际调研,为图书馆界进行类似的用户满意度评估提供了方法,通过对影响用户满意度的因素进行测度和排序,及时调整相应的工作理念和方式,有利于创造出满意度更高的服务。

相较于国外,国内针对图书馆服务的评价研究起步有些滞后。1986年,山东省率先在全国开展高校图书馆绩效评估评价工作。自1987年国家教育委员会发布《普通高等学校图书馆规程》之后,其作为图书馆评估项目和指标的基本依据,关于图书馆服务评价的研究正式步入快速发展期。期间,我国学者发表了大量学术文章,取得了丰硕科研成果。比较有代表性的有张敏提出了图书馆的评级统计指标及其设计和计算方法[6];郑全太结合统计推断原理针对指标权重提出了一种新的计算方法并给出了显著性假设检验[7];薛育祁利用模糊数学的理论对图书馆质量进行了评价研究并总结了影响图书馆服务质量的关键因素[8];叶林利用通信理论中的信息熵概念对读者在图书馆获得的信息量进行了理论研究,通过引入新的评价体系,使图书馆评价更加客观、准确[9];何志兰从系统论的角度[10]对图书馆效应进行了评价等等。

可以看出,目前学界关于图书馆绩效方面的评价研究的理论已经很充实,相关的模型框架也比较完备。但是在定量化的评价研究方面还有待进一步提高,相关的指标分析还有待进一步优化。本文尝试通过熵值法对相关的指标做进一步优化,并在此基础上利用DEA模型对公共图书馆进行定量分析,相较于其他方法,结果有更具准确性和客观性。

2 相关基本理论介绍

2.1 信息熵和熵值法

熵(Entropy)是德国物理学家Clausius于1854年在热力学研究中创造出来的概念,作为衡量物质状态的一个参量,主要用来度量状态的混乱程度。后来信息学的创始人Shannon将之引入到信息学中,逐渐演变为度量信息不确定性程度的一个重要指标。

假设一项评价任务有m个评价子项目,每个项目均有s个评级指标,则该评价任务可用矩阵Xm×s表示,其中xij表示第i个子项目中对第j项指标的打分。若对于某项指标xj,xij(i=1,2,…,m)离散程度较大,则表示该项指标的所包含的信息不确定性就大,信息熵也越大,相应的该项指标的权重也就越大。熵值法的目的也就是通过一定的算法,计算出每个影响指标的信息熵,然后根据信息熵确定相对应的权重,从而为多指标评价体系提供依据。这样根据指标变异程度的大小(也即信息熵)确定权重,一方面可以较大程度上避免指标选择的主观性,另一方面也可以实现对各个评价指标的差异化处理,更能反映出不同指标对评价体系的影响程度。

熵值法的一般计算步骤如下所示:

(1)由于各个指标的量纲、数量级有可能均有差异,所以为消除量纲不同对评价结果带来的影响,需要对各指标进行标准化处理。一般做如下变换:

(1.1)

(2)计算第j项指标下第i项子项目指标值的比重yij

(1.2)

由此,可以建立数据的比重矩阵Y={yij}m×s。

(3)分别计算指标信息熵值e和信息效用值d

i.计算第j项指标的信息熵值:

(1.3)

Ii.某项指标的信息效用价值取决于该指标的信息熵ej与1之间的差值,它的值直接影响权重的大小,信息效用值越大,对评价的重要性就越大,权重也就越大。

dj=1-ej

(1.4)

(4)计算评价指标权重

利用熵值法估算各指标的权重,其本质是利用该指标信息的价值系数来计算,其价值系数越高,对评价的重要性就越大。

第j项指标的权重为:

(1.5)

2.2 DEA数据模型

数据包络分析(DEA)是由著名运筹学家A.Charnes、W.W.Cooper、E.Rhodes于1978年提出的一种基于线性规划的用于评价同类型组织工作绩效相对有效性的方法,简称为C2R模型。从生产函数的角度看,这一模型是用来研究具有多个输入,特别是具有多个输出的“生产部门”同时为“规模有效”与“技术有效”的十分理想且有效的方法。1985年A.Charnes、W.W.Cooper、B.Golany与L.Seiford、J.Stutz合作又提出了另外一个模型C2GS2模型,用来研究生产部门间的“技术有效性”。发展到目前为止,最具代表性的DEA模型有C2R、C2GS2、FG和ST模型。其中FG模型假定规模收益递减,ST模型假定规模收益递增。

DEA模型中最常用的是C2R模型。设有n个决策单元,各决策单元均有m项投入和s项产出。用xij表示第j决策单元的第i项投入,用yrj表示第j决策单元的第r项产出。现在要衡量某一决策单元j0是否DEA有效,则构造评价第j0个决策单元的相对绩效可由如下DEA模型给出[11]:

minE

进一步引入松弛变量s+和剩余变量s-,将上面不等式约束变为等式约束:

minE

显然,若求解结果有E<1,则j0决策单元非DEA有效,否则j0决策单元则处于包络线组成的生产前沿面上,也即DEA有效。

3 图书馆绩效分析评价模型的构建

为了对江苏省公共图书馆做绩效分析评价,本文以国家统计局发布的年鉴[12]、江苏省文化厅发布的年报[13]和中国知网中经济与社会发展统计数据库[14]中的数据作为数据源,时间跨度为从2011年至2015年。经过整理,具体统计指标和数据如下表1所示:

指标年份公共图书馆个数年度支出资金(千元)总藏量(万册件)中高级职称从业人员占比人均拥有公共图书馆藏量(册)每万人拥有公共图书馆建筑面积(平方米)电子阅览室终端数阅览室座席数(个)总流通人次(万人次)书刊文献外借册次(万册次)201511486604068470.4310.86129.358105070760012882201411472936862800.4390.79119.452794478254253217201311372904457700.4230.73112.153004443150472450201211268952264900.4620.82104.245094208545272040201110959755053820.4280.6885.843373979835421545

其中指标行中的前八个,即公共图书馆个数、年度支出资金、总藏量、中高级职称从业人员占比、人均拥有公共图书馆藏量、每万人拥有公共图书馆建筑面积、电子阅览室终端数、阅览室座席数为投入指标,其余的如总流通人次、书刊文献外借册次为产出指标。

3.1 评价指标权重的构建

3.1.1 投入指标权重的构建

将表1中投入指标的数据代入公式1.1中首先进行规范化处理,消除量纲差异。然后通过公式1.2、1.3得到信息熵值e,进一步代入1.4求出各个指标的信息效用值,最后由公式1.5得到各个投入指标的权重值。本文借助于Matlab[15]软件编写代码计算源数据中投入指标的权重。其中计算信息熵的entropy.m文件核心源代码如下:

function [w,t]=entropy(x)

% x为原始数据矩阵,每行代表一个决策单元,每列对应一个评价指标

% w返回各列权重,t返回归一化的数据

[X,ps]=mapminmax(x’);

ps.ymin=0.002;

ps.ymax=0.996;

ps.yrange=ps.ymax-ps.ymin;

X=mapminmax(x’,ps);

X=X’;

t=X

for i=1:n

for j=1:m

p(i,j)=X(i,j)/sum(X(:,j));

end

end

k=1/log(n);

for j=1:m

e(j)=-k*sum(p(:,j).*log(p(:,j)));

end

d=ones(1,m)-e;

w=d./sum(d);

最终得到如下投入指标的权重数据:

投入指标公共图书馆个数 年度支出资金总藏量中高级职称从业人员占比 人均拥有公共图书馆藏量 每万人拥有公共图书馆建筑面积 电子阅览室终端数阅览室座席数权重0.07790.23130.10020.16180.09890.08620.12550.1182

3.1.2 产出指标权重的构建

将表1中产出指标的数据代入公式1.1至1.5中,借助于Matlab,设置好函数参数后,执行entropy.m程序可得到如下产出指标的权重数据:

产出指标总流通人次书刊文献外借册次权重0.46950.5305

3.2 DEA数据模型的构建

基于投入产出指标的权重数据,可以构建图书馆绩效评价的DEA数据模型。

将表1中的数据分别乘以各个指标的权重得到投入产出指标的综合评价值,如下表2所示:

指标年份公共图书馆个数年度支出资金总藏量中高级职称从业人员占比人均拥有公共图书馆藏量每万人拥有公共图书馆建筑面积电子阅览室终端数阅览室座席数总流通人次书刊文献外借册次20158.8760200324.1023686.36200.06970.085111.1482728.96875993.55492817.46951528.901020148.8760168710.4404629.52440.07100.078110.2946662.34525293.22142547.03751706.618520138.7982168635.4958578.40060.06840.07229.6652664.98005251.73322369.56651299.725020128.7203159493.6442650.57530.07470.08118.9909565.73494974.43662125.42651082.220020118.4867159037.5000539.50640.06920.06737.3976544.15444704.11381662.9690819.6225

将表2数据代入公式1.6中即可求解该线性规划问题的最优解。借助于DEAP软件,编写如下代码:

执行Deap应用程序并将Instruction文件名作为参数输入到命令行中,得到该DEA模型的解如下所示:

其中firm列表示决策单元序号;crste列表示以CRS(constant returns to scale)为假定前提的CCR模型技术效率,也称综合效率;vrste列表示以VRS(variable returns to scale)为假定前提的BBC模型纯技术效率;scale列表示规模效率(irs:规模报酬递增,drs:规模报酬递减,-:规模报酬保持不变)。crste、vrste、scale三者之间的关系为crste=vrste*scale。

经过整理,最终评价结果如下表3所示:

相关参数年份θ∗(V)CSμS∗-1S∗-2S∗+1S∗+2S∗+320151.0001.0001.00000.0000.0000.0000.0000.00020141.0001.0001.00000.0000.0000.0000.0000.00020131.0000.9990.999+0.0000.0000.0000.0000.00020121.0000.9720.972+0.0000.0000.0000.0000.00020110.7920.7040.889+921.271654.96415734.5420.012263.142

4 图书馆绩效评价的结果分析

通过对上述运算过程和表3的分析,可以得出以下几个结论:

(1)总体上,江苏省公共图书馆在2011年至2015年的绩效还是不错的。具体而言,2014和2015年期间,θ*(V)=1并且S=1,同时达到了纯技术有效和规模有效,说明这两年期间图书馆的投入与产出、规模体量与资源配比之间的关系都是最优的;2012和2013年期间,由于S<1,θ*(V)=1,所以该年纯技术有效,但规模效用没有达到最优;五年之中只有2011年的纯技术效率θ*(V)=0.792<1,所以2011年没有达到DEA有效。

(2)2012和2013年的纯技术效用和规模效用没有同时达到最优,即S<1,θ*(V)=1。因为θ*(V)=1,所以纯技术效率最优,也就是说与其他年份相比,在当年的管理制度和管理水平的基础上,投入的资源和产出的效益配比是最优的并且是最有效率的。但是S<1,说明规模效益没有达到最优,也即2012年和2013年的公共图书馆的规模体量没有与当年投入资源相匹配。由表3可以看出2012和2013年的规模报酬μ呈递增趋势,所以这两年没有达到规模效用最优或者DEA有效的本质原因是规模增长较慢,如果在当年各个投入指标相较之前能得到更大幅度的增长,那么当年绩效水平会有更好的结果。

(3)对于2011年来说,由于θ*(V)=0.792<1,所以DEA无效。另外由表3得到当年规模报酬μ是呈递增趋势,可以看出2011年与2012、2013年存在类似的问题,那就是投入不足,如果政府部门当年适当增加对公共图书馆的资源投入力度,那么会得到更大的收益。具体分析2011年的投入和产出指标,经过计算,若投入指标中的年度支出资金增加30.6%,中高级职称比例增加38.1%,电子阅览室终端数增加69.2%,那么产出指标中总流通人次可增长55.4%,书刊文献外借册次可增长79.9%,从而就可以达到DEA有效。

5 对策建议

从前文DEA绩效定量分析的论述中,可以对江苏省公共图书馆在2011年至2015年期间的发展状况有一个大概的了解。更重要的是,通过分析这期间图书馆发展过程中出现的诸多问题,能使我们不断总结过去的经验教训,通过合理利用各种投入资源,包括人力、资金等等,改进和提高管理水平,达到提高图书馆的利用率,改善图书馆的发展效益的目的。结合上述分析,提出以下几点建议:

(1)从发展过程看,前几年图书馆的规模报酬一直处于递增趋势,因此政府相关部门要对公共图书馆事业更加重视,适当加大对图书馆的资金投入,提高图书馆发展过程中的规模报酬。这是社会发展的必然趋势:一方面在当下信息化和数字化的时代背景下,知识更新换代速度加快,人们对新知识的需求比以往任何时候都更加迫切;另一方面随着经济社会的发展和生活水平的提高,对大部分人来说,相较于物质生活带来的满足感,对精神生活高品质的追求越来越受到人们的青睐。而公共图书馆作为一个城市、一个地区的主要文化服务中心,是知识的蕴藏地,有着良好环境和文化氛围,已经成为人们精神世界的主要栖息地。

(2)人力投入指标的权重很大,图书馆应该重视人才队伍建设。高素质的从业人员是图书馆提升服务质量,提高发展效益的重要支撑。实际上,图书馆所有的可调配的资源最终都是靠人管理的,所以图书馆从业人员本身的能动性就至关重要。可以一方面通过不断引进高学历的图书情报专业的专业性人才,优化从业人员的学历构成;另一方面图书馆也要定期组织从业人员进行专业技能培训,使他们不断的吸收新知识、获取新技能,从而进一步优化自身的知识结构,最终实现图书馆发展绩效的提升。

(3)电子资源投入指标的权重较大,仅次于人力成本,图书馆应适当加大电子资源采购和电子阅览室的供应。当下,人们的阅读习惯已经由传统阅读转变为了碎片化阅读,并且随着互联网技术和周边产品的快速发展迭代,移动终端逐渐成为了人们阅读和获取信息的第一媒介。据中国新闻出版研究院发布的第十四次全国国民阅读调查报告[16]显示,2016年我国数字化阅读(网络在线阅读、手机阅读、电子阅读器阅读、Pad阅读等)方式的接触率已经达到了68.2%。所以图书馆的发展策略也要积极顺应和迎合社会的发展和人们的需求,通过增加对电子资源和电子阅览室的投入,提高图书馆的发展绩效。

(4)加强资源共享。目前各个公共图书馆的馆藏量虽然也在逐年递增,但在知识化信息化社会的时代背景下,单个图书馆已经无法满足民众对新知识的需求。图书馆之间可尝试建立区域性或行业性的图书馆联盟,或者通过提供和优化馆际互借和文献传递等服务,来实现资源的共建、共享、共用。这样既可以降低投入成本,还可以提高图书馆的用户体验,从而在总体上提升图书馆的绩效水平。

〔1〕 Orr,R.H.Measuring the goodness of library services:a general framework for considering quantitative measures[J].Journal of Documentation,1973,29(3):315-332

〔2〕 Lancaster,Wilfri F.If you want to evaluate your library[M].Urbana:University of Illinois,1993:45-55

〔3〕 Buckland M K.Concepts of Library Goodness[J].Canadian Library Journal,1982,39(2):63-66

〔4〕 LINE,MB.The concept of “library goodness”:user and library perception of quality and value.MB Line (ed.)[J].Academic Library Management,1991,12(4):66-87

〔5〕 Andaleeb S S,Simmonds P L.Explaining user satisfaction with academic libraries:strategic implications[J].College & Research Libraries,1998,59(2):156-167

〔6〕 张敏.图书馆评价统计浅议[J].重庆第二师范学院学报,1998(2):75-77

〔7〕 郑全太.图书馆评价中各因素权重确定的一种方法[J].中国图书馆学报,1999,25(1):83-84

〔8〕 薛育祁.模糊数学在图书馆评价中的应用[J].河南师范大学学报(自然版),1999,27(4):93-96

〔9〕 叶林.图书馆评价体系中量化指标探讨[J].图书馆杂志,2008,27(4):18-20

〔10〕 何志兰.论图书馆系统的效益评价[J].情报杂志,2004,23(11):25-27

〔11〕 胡运权.运筹学教程[M].北京:清华大学出版社,2003:36-39

〔12〕 中国统计年鉴[EB/OL].[2017-09-01].http://www.stats.gov.cn/tjsj/ndsj/

〔13〕 江苏省文化统计相关报表[EB/OL].[2017-08-01].http://www.jscnt.gov.cn/gk/zd/tj/

〔14〕 经济与社会发展统计数据库[EB/OL].[2017-11-01].http://tongji.cnki.net/kns55/index.aspx

〔15〕 温正.精通MATLAB科学计算[M].北京:清华大学出版社,2015:81-99

〔16〕 第十四次全国国民阅读调查公布[EB/OL].[2017-04-01].http://news.cnr.cn/native/gd/20170419/t20170419_523714239.shtml

猜你喜欢

信息熵阅览室权重
原创童书阅览室
原创童书阅览室
原创童书阅览室
基于信息熵可信度的测试点选择方法研究
权重常思“浮名轻”
为党督政勤履职 代民行权重担当
基于信息熵的实验教学量化研究
基于公约式权重的截短线性分组码盲识别方法
一种基于信息熵的雷达动态自适应选择跟踪方法
基于信息熵的IITFN多属性决策方法