APP下载

基于SVR的图书馆数字资源服务绩效评价方法

2018-11-13张春友闫伟吴晓强郝瑞参

现代电子技术 2018年22期
关键词:数字资源图书馆

张春友 闫伟 吴晓强 郝瑞参

摘 要: 数字资源服务是现代化图书馆提供的重要服务,数字资源服务绩效评价是图书馆改善数字资源的基础。针对现有数字资源服务绩效评价方法存在的不足,提出一种新的基于区间数支持向量回归机的图书馆数字资源服务绩效评价方法。在构建数字资源服务绩效评价指标体系的基础上,建立了基于区间数支持向量回归机的图书馆数字资源服务绩效评价模型。仿真结果表明, 所建立的评价模型是合理有效的,并且具有较强的泛化能力。

关键词: 图书馆; 数字资源; 服务绩效; 区间数; 支持向量回归机; 泛化能力

中图分类号: TN919?34; TP301.6 文献标识码: A 文章编号: 1004?373X(2018)22?0021?04

Abstract: Digital resource service is an important service provided by modern library. The performance evaluation of digital resource service is a foundation for improving digital resources of the library. In allusion to the shortcomings of the existing digital resource service performance evaluation methods, a new performance evaluation method based on interval numbers and support vector regression is proposed for the digital resource service of the library. On the basis of constructing the performance evaluation index system for the digital resource service, a performance evaluation model based on interval numbers and support vector regression is established for the digital resource service of the library. The simulation results show that the established evaluation model is reasonable, effective, and has a strong generalization capability.

Keywords: library; digital resource; service performance; interval number; support vector regression; generalization capability

在计算机、网络技术飞速发展的大背景下,具有种类繁多、信息量大、存储便捷等诸多优势的数字资源逐渐成为人们获取信息的重要渠道。图书馆数字资源建设的优劣直接影响图书馆的服务水平和层次,已成为图书馆建设的关键问题之一。如何客观评价数字资源的建设情况,如何科学衡量数字资源服务的优劣,如何解决数字资源种类繁多与经费有限的矛盾,都需开展数字资源服务绩效评价问题的研究。目前,数字资源服务绩效评价问题已成为图书馆界的研究热点。很多学者在评价指标体系、评价方法、评价模型等方面开展了深入的研究。文献[1]采用改进的层次分析法对数字资源服务绩效评价指标体系进行了研究;文献[2]提出基于擬熵权模糊综合评价的数字资源服务绩效评价方法;文献[3]采用模糊多属性决策方法对高校图书馆电子资源服务绩效评价问题进行了研究;文献[4]基于模糊语义法研究了电子资源服务绩效评价问题;文献[5]采用模糊神经网络方法构建了数字资源服务绩效的智能评价模型。现有研究方法中均需计算指标权重,但数字资源服务绩效评价指标繁多,指标权重计算复杂且主观性较大。虽然文献[5]提出了智能评价模型,取得了较好的预测效果,但神经网络方法存在收敛速度慢、学习效率低、网络结构复杂和泛化能力弱等问题。支持向量回归机(Support Vector Regression,SVR)是SVM在解决回归问题方面的具体应用,在各种预测领域表现出了较好的能力,支持向量机基于结构风险最小化理论,普遍认为其泛化能力要比神经网络的强。此外,数字资源服务绩效评价问题具有确定性评价,而用区间数表示不确定性更加符合思维习惯。鉴于此,本文拟采用区间数和SVR理论相结合的方法对数字资源服务绩效评价问题进行研究,以期为数字资源服务绩效评价问题提供一种新的智能评价方法。

1 图书馆数字资源服务绩效评价指标体系

构建一个科学有效的图书馆数字资源服务绩效评价指标体系,是优化发展图书馆数字资源、提高数字资源服务质量效益的关键。和媛媛等人基于用户满意度,建立了以数据库内容、检索系统及功能和数据库利用情况为一级指标的电子资源服务绩效评价指标体系[3];隶属于美国研究图书馆协会(ARL)的统计和测度委员会于2000年开始启动的数字资源评估项目中,将指标体系分为网络统计和绩效统计两部分,其中网络统计指标包含用户可使用的数字资源、网络资源的使用、网络资源与相关设施的花费和图书馆数字化工作四类一级指标;梁冬莹等人参照美国研究图书协会ARL E?Metrics项目推荐的高校图书馆数字资源统计和测评数据指标的体系结构的基础上,结合我国数字资源使用的实际情况和相关研究成果,构建了我国高校图书馆数字资源服务绩效评价指标体系[1];周庆梅以文献[1]构建的指标体系为基础,利用模糊神经网络方法开展了图书馆数字资源服务绩效评价研究,取得了较好的效果。综合上述研究成果中的评价指标体系,本文构建多层次的数字资源服务绩效评价指标体系,如图1所示。

2 区间数运算法则

近年来,区间数理论在不确定数学规划和不确定多属性决策等领域得到了广泛的应用。区间数是指用区间表示的数,具有不确定性,实际上是一个闭区间上所有实数所组成的集合。假设[a]是实数[x]的集合,[a=[a1,a2]={a1≤x≤a2,a1,a2∈R}],[a1]和[a2]是区间的下界和上界,则[a]定义为区间数。如果[a1≥0],那么[a]为正区间数。区间数的运算法则一般与集合的运算法则类似,设[a=[a1,a2]]和[b=[b1,b2]]为两个区间数,[k≥0],则区间数的运算法则为[6]:

核函数[K(x,y)]的形式有多种,常用的有径向基核函数、多项式核函数、Sigmoid感知核函数和多二次曲面核函数等。

4 基于区间数SVR的数字资源服务绩效评价模型

通过数字资源服务绩效评价指标体系的建立以及对区间数和支持向量回归机模型原理的介绍,构建基于区间数SVR的数字资源服务绩效评价模型,模型的具体实现步骤如下:

1) 建立图书馆数字资源服务绩效评价指标体系,确定支持向量回归机的输入和输出参数。依据前面的分析,本文选用评价指标体系中数字资源内容、供应商提供服务、用户使用情况、检索系统和资源成本5个一级指标下的29个二级指标作为数字资源服务绩效评价模型的输入参数,数字资源服务绩效评价等级作为评价模型的输出参数。

2) 为提高预测的准确性,对实验样本数据进行规范化处理,使各指标值均处于[0,1]区间内。将“优”“良”“一般”“较差”和“差”作为数字资源服务绩效评价等级,各等级对应的规范化区间数分别为[0.8,1.0],[0.6,0.8],[0.4,0.6],[0.2,0.4]和[0,0.2]。

3) 确定最佳的支持向量回归机核函数。通过比较分析和测试,最终选择应用最为广泛的径向基核函数,其表达式为:[K(x,y)=exp-x-y22σ2]。

4) 利用基于区间数SVR的数字资源服务绩效评价模型对训练样本进行训练,在训练过程中不断调整径向基核函数的宽度参数[σ],以及支持向量回归机的正则化参数C和不敏感值[ε],直到训练误差达到相应的精度要求为止。

5) 通过校验样本检验预测模型的泛化能力。利用基于区间数SVR的数字资源服务绩效评价模型对校验样本进行评价研究。

5 实例分析

为了验证基于区间数SVR的数字资源服务绩效评价模型的合理性和有效性,现以文献[5]中的样本数据为例进行仿真实验验证。样本数据中共有11个样本,各指标数值通过邀请多位专家进行打分后取平均值获得,打分过程中,评价等级为{“优”,“良”,“一般”,“较差”,“差”},对应的取值范围为{[4,5],[3,4],[2,3],[1,2],[0,1]},具体的打分情况见表1。这里以前8个样本为训练样本,后3个样本为校验样本进行仿真验证。文献[5]采用模糊神经网络方法对这11个样本进行仿真分析,所得的前8个样本的模糊综合评价结果如表2所示。

利用Matlab 7.0編写基于区间数SVR的数字资源服务绩效评价模型的仿真程序。通过多次仿真测试,得到SVR最优的仿真参数:[ε]=0.001,惩罚参数[C]=800,参数[σ=]10。在仿真过程中,首先将各指标值进行归一化处理,然后将归一化的29个指标值作为SVR的输入参数,分别将区间数评价值的下界和上界作为输出参数对8个训练样本进行训练仿真,训练效果较好,相对误差均小于0.36%。为了验证评价模型的推广能力,对后3组样本进行校验预测,可得预测的区间数评价值分别为[0.564,0.764],[0.482,0.694]和[0.226,0.426],相应的区间评价中值分别为0.652,0.588和0.326,分别对应评价等级“好”“一般”和“较差”。该评价结果与文献[5]所得的结论完全一致。由校验样本的预测结果可知,本文所建立的评价模型预测效果较好,具有较强的推广能力。文献[5]采用模糊神经网络方法得到的评价结果为模糊数形式,难以对处于同一评价等级的样本进行有效排序,而利用本文所提出的评价模型所得到的区间数形式的评价结果,可以依据区间数的排序法则或区间数取中间值的方法对各个样本进行评价排序,评价结果更加科学合理。

6 结 论

科学合理地评价图书馆数字资源服务绩效水平,可以为图书馆提高数字资源服务能力和优化数字资源建设策略提供理论依据和参考。本文基于构建的数字资源服务绩效评价指标体系,采用区间数理论和支持向量回归机相结合的方法建立了数字资源服务绩效评价模型。在此基础上利用Matlab 7.0工具箱编写了评价模型的仿真程序。在将模糊评价结果转化为区间数的基础上,利用区间数的下界和上界分别对样本进行预测,进一步对得到的区间数形式的评价结果进行分析。通过与文献[5]的评价结果进行对比分析,说明本文提出的智能评价方法是合理有效的,为数字资源服务绩效智能评价提供了新的思路,有助于图书馆提高数字资源服务质量和水平。

参考文献

[1] 梁冬莹,周庆梅,王克奇.基于层次分析法的数字资源服务绩效评价体系构建[J].情报科学,2013,31(1):78?81.

LIANG Dongying, ZHOU Qingmei, WANG Keqi. An improved AHP?based performance evaluation system of digital resources service [J]. Information science, 2013, 31(1): 78?81.

[2] 李迎迎,王焕景,郑春厚.高校图书馆数字资源服务的拟熵权糊综合评价[J].图书馆论坛,2014,34(5):71?78.

LI Yingying, WANG Huanjing, ZHENG Chunhou. The quasi?entropy weight fuzzy comprehensive evaluation of digital resources service in university library [J]. Library tribune, 2014, 34(5): 71?78.

[3] 和媛媛,巩在武.基于模糊多属性决策的高校图书馆电子资源服务绩效评价研究[J].情报科学,2011,29(3):412?415.

HE Yuanyuan, GONG Zaiwu. Study on the service evaluation of academic library electronic resources based on multi?attribute decision making [J]. Information science, 2011, 29(3): 412?415.

[4] 贺秀英,王晓文,呼翠侠.基于模糊语义法的高校图书馆电子资源绩效评价研究[J].情报理论与实践,2016,39(2):113?115.

HE Xiuying, WANG Xiaowen, HU Cuixia. Research on the performance evaluation of university library electronic resources based on fuzzy semantic method [J]. Information studies: theory & application, 2016, 39(2): 113?115.

[5] 周庆梅,王克奇.图书馆数字资源服务绩效模糊神经网络评价研究[J].情报科学,2015,33(2):41?45.

ZHOU Qingmei, WANG Keqi. FBP based evaluation on performance of digital resource service of library [J]. Information science, 2015, 33(2): 41?45.

[6] 王根霞,王祖和,段德宏,等.基于区间数层次分析法的民用建筑太阳能热水系统评价[J].沈阳建筑大学学报(自然科学版),2012,28(5):897?903.

WANG Genxia, WANG Zuhe, DUAN Dehong, et al. Evaluation based on interval number analytic hierarchy process for solar water heating system of civil buildings [J]. Journal of Shenyang Jianzhu University (Natural science), 2012, 28(5): 897?903.

[7] 关山,聂鹏.L?M优化算法BP网络在刀具磨损量预测中的应用[J].机床与液压,2012,40(15):22?26.

GUAN Shan, NIE Peng. Application of improved L?M optimization algorithm BP neural network in tool wear prediction [J]. Machine tool & hydraulics, 2012, 40(15): 22?26.

[8] 侍红岩,吴晓强,张春友.基于支持向量回归机的刀具寿命预测[J].工具技术,2015,49(11):47?50.

SHI Hongyan, WU Xiaoqiang, ZHANG Chunyou. Prediction of cutting tool life based on support vector regression [J]. Tool engineering, 2015, 49(11): 47?50.

[9] 安文森,孙彦广.一种新的支持向量回归核函数构建方法[J].信息与控制,2006,35(3):378?381.

AN Wensen, SUN Yanguang. A new method for constructing kernel function of support vector regression [J]. Information and control, 2006, 35(3): 378?381.

[10] 沈晓安.基于支持向量回归机的反卷积技术[J].机床与液压,2009,37(3):105?107.

SHEN Xiaoan. Study on deconvolution technique based on support vector regression [J]. Machine tool & hydraulics, 2009, 37(3): 105?107.

猜你喜欢

数字资源图书馆
图书馆
时间重叠的图书馆
图书馆
美术教科书使用应把握的几个视角
图书馆员新角色
高校数字资源云服务平台的建设研究
评价高校图书馆数字资源综合服务能力
图书馆与出版企业数字资源共享的环境因素分析
去图书馆