文献采购评标指标的权重优化
——基于方差最大化的AHP+熵权组合的研究
2020-08-31金秀玲
金秀玲,陈 翔
(闽江学院数学与数据科学学院,福建 福州 350108)
随着大数据时代的来临,各行各业都大量借鉴数据挖掘模式,深化拓展服务,图书馆亦不例外。图书馆文献采购直接关乎馆藏质量建设,在采购招标中通过科学设置评标指标及权重,对馆配商进行正确的评估和选择,是文献采购中极其重要的一个环节。目前全国高校图书馆在文献采购招标中基本各自为政,招标指标标准及权重设置随意,相差甚远。因此,笔者立足于全国高校的视野,应用科学算法计算文献采购的指标权值,与同行们共同商榷。
与图书馆的其他业务工作相比,图书馆界对于文献采购评标指标权重的研究还较薄弱,在图书招标的体系研究方面的成果还较少,共有12篇,主要分布在2007—2018年之间。
以综述形式出现的文献,如石剑兰等[1]对我国图书招标评标体系构建和研究的现状做了全面的剖析,明确指出图书采购的主要内容停留在具体某个图书馆某次的招标项目的具体数据研究,或者图书的某块特殊资源的招标工作。 通过单一赋权法构建文献采购的评标体系的文献,如李明珍等[2]、余合剑[3]使用AHP方法设置图书采购指标权重,温汉荣[4]利用变权原理在法律法规层面构建图书馆招标评标体系等。通过综合赋权法构建文献采购的评标体系的文献,如孙林山[5]、孙晓雅[6]结合层次分析法和模糊综合评判法,确定图书馆采购中的评价指标的权重等。
据分析可知,目前上述研究成果所采用的研究数据的获取都依赖于专家打分评价和问卷调查等形式,不同的专家、不同的人群所提供的数据波动性较大,主观性较强。研究的内容仅仅着眼于具体某次招标或者某块项目的采购工作,具有一定的片面性。且目前研究成果中,主、客观组合赋权只是停留在简单的平均赋权,未进行优化。
鉴于此,本文选取的数据为全国25所本科高校图书馆(1)本文选取的25所本科高校图书馆样本分别是:厦门大学、北京中医药大学、天津医科大学、中国药科大学、山东大学、四川大学、第二军医大学、暨南大学、贵州大学、广西大学、石河子大学、新疆大学、贵阳学院、北京航空航天大学、浙江大学、武汉大学、东北财经大学、辽宁大学、华中科技大学、华南理工大学、合肥工业大学、大连理工大学、大连交通大学、中国石油大学、上海海洋大学图书馆,涉及福建、北京、天津、上海、山东、四川、江苏、广东、贵州、广西、新疆、浙江、湖北、辽宁和安徽等省、自治区和直辖市。评标体系,时间设定为2017—2018年。数据来源于不同层次、不同区域的高校图书馆,具有客观性和普适性。采用基于方差最大化原理将主观赋权法和客观赋权法相结合的综合赋权法,既充分利用了评价专家的知识和经验,又有客观的数据为基础,能够保证指标权重符合客观实际,同时又有很强的科学性和说服力,是最优的赋值方法。随着评标工作的程序化和智能化,综合赋权法将得到更为广泛的应用。
一、研究设计
(一)文献采购评标体系
本文在参考前人成果的基础上,结合全国25所高校的评标体系,根据系统性、可行性、普适性的原则,将评标指标分为3个层面:技术、商务和价格。技术下设二级指标和三级指标,商务下设二级指标,价格不设下级指标。共细分为24个指标,具体如图1所见。
图1 文献采购评标体系Fig.1 Document purchase evaluation system
(二)权值计算的理论依据
本文研究路线如图2所示。针对原始数据,构造各级指标的判定矩阵,计算主观AHP权值;同时用一致最小性原则对原始数据进行标准化处理,计算改进的熵权值;然后利用方差最大化原理,计算主、客观组合权值;最后检验复合权值的优良性。
图2 研究技术流程图Fig.2 Research technology flow chart
(三)评价指标权值优化算法
1.基于AHP的主观赋权
AHP称为层次分析法,AHP对各测度因素的相对重要性做出定量判定,适用于衡量多层次、复杂系统的排序问题。因此,本文采用AHP法对文献采购评标指标的赋权是合理的。在AHP模型中,图书采购评标指标分为三级,如图1所示,包括技术指标A、商务指标B和价格指标C。
AHP权值的设置步骤为:
步骤1:构造判定矩阵。采用九级标度法。
步骤2:计算层次权重。依据最大特征值法,设置权值。
步骤3:一致性检验。即同层次之间的一致性检验。
判断矩阵偏离一致性条件应有一个度,为此,必须对判断矩阵是否可接受进行鉴别,这就是一致性检验的内涵。目的是检验判定矩阵是否一致,保证权值的合理性。计算随机一致性比率为:
(1)
步骤4:总层次之间的一致性检验。目的是检验大局的稳定性能。
AHP权值的计算过程比较复杂,本文使用R统计软件,通过求解特征值和特征向量的方法进行评标指标权值的确定。
2.基于改进熵的客观赋权
(1)熵权法赋权。熵权法是一种客观赋权方法。信息熵是信息无序度的度量,信息熵越大,信息的无序度越高,其信息的效用值越小,对应评标指标的权重就小,反之则越大。图书采购评标指标信息有序性不强,符合熵权法的特点。故可利用信息熵的大小确定图书采购评标指标的重要性,从而可以得到25个样本、24个评价指标的熵权值。与AHP主观赋权法相比,熵权法所得到的权值的精度更高,客观性更强。
(2)用一致最小性原则对指标的标准化。当多个指标处于不同量纲时,直接进行线性组合就会导致权重的失真,因此将各指标进行标准化是其中重要的一步。评价指标分为正指标、逆指标、一般指标,在馆配商选择的24个指标中都是属于正指标,适合使用极差化方法一致性公式[7]进行数据标准化:
(2)
(3)
a)计算第i项评价指标的熵权值Hi:
(4)
b)确定第i项评价指标改进熵权值:
(5)
3.基于方差最大化原理优化AHP权值与熵权值的组合赋权
主观赋权法中虽然有显而易见的弊端,但不可否认其中含有专家学者们的宝贵经验,不能全盘弃之。同样,客观赋权法也有自己的优缺点:熵权法使用较强的数学理论挖掘原始数据的信息,客观性强,却不能反映专家的知识、经验以及决策者的意向,有时得到的权重可能与实际重要程度不相符。为克服AHP赋权和熵权法的缺点,得到更加科学有效的权值,对AHP权值和熵权值进行线性组合,其组合系数用方差最大化原理加以优化,以权值稳定性作为优化的标准。
假设AHP赋权的权值为p=(p1,p2,...,p24),改进熵赋权的权值为q=(q1,q2,...,q24),结合AHP和改进熵赋权方法的优缺点,进行线性组合赋权:
w=αp+βq。
(6)
方差最大化优化赋权的基本思想是综合得分的大小尽量分散,在数学意义上就是使得它们之间得分的离差平方和达到最大。根据最大方差原则构造AHP权值和改进熵权值的最优组合权值,转为数学上的最优化问题解:
(7)
根据拉格朗日乘数法确定系数α,β,求得
(8)
把公式(8)代入公式(6)得到AHP权值和改进熵权值的组合赋权w=(w1,w2,...,w24)。对得到的w进行归一化处理,即:
(9)
二、数据分析
(一)样本的选取
以全国25所高校图书馆图书采购评标标准为样本,对原始数据进行整理,得到适合R统计软件的数据格式。
(二) AHP的主观权值
AHP权重的设置是通过采购评标指标的两两比较确定出相对重要程度,然后通过客观的运算确定各评价指标权数。使用R统计软件,先计算各级评价指标均值,利用二者之间的比值大小,依据1~9级标度法构造各级指标之间的判定矩阵,共6个。再通过R软件构造的各个判定矩阵,求解出最大特征根λ和对应的特征向量ω0,ω0进行归一化处理就得到各级指标的权值。最后计算随机一致性比率,进行一致性检验。具体的各级指标的AHP主观权值计算过程如下:
根据评标体系(图1),需要对3个级别的评标指标进行6次的AHP权值设定,故以一级指标即技术、商务、价格为例,说明具体AHP权值的计算过程,二级指标和三级指标的权值设定方法相同,具体过程不赘述。
1.一级指标的AHP权值
根据全国25所图书馆标准标书的评分细则,利用一级指标中的技术、商务、价格的均值分别为:48.64、20.96、30.40。用均值的比值作为相对数,据1~9级标度法构建技术、商务、价格指标的AHP判定矩阵D:
求出最大特征根为3,对应的特征向量为0.816 5、0.408 2、0.408 2,归一化得到技术、商务、价格指标的对应权值w1为0.50、0.25、0.25。
2.二级指标的AHP权值
(1)技术二级指标A1~A4的AHP权值wA为0.251 6、0.394 5、0.311 0、0.042 8。
(2)商务二级指标B1~B6对应AHP权值wB为0.479 8、0.290 9、0.100 4、0.064 5、0.038 3、0.026 0。
3.技术三级指标的AHP权值
(1)技术三级指标A11~A14对应的AHP权值w11~w14为0.375 0、0.375 0、0.125 0、0.125 0。
(2)技术三级指标A21~A27对应的AHP权值w22~w27为0.315 8、0.293 0、0.180 5、0.089 2、0.075 2、0.023 6、0.022 7。
(3)技术三级指标A31~A35对应的AHP权值w33~w35为0.217 5、0.274 9、0.217 5、0.190 4、
0.099 7。
4.总层次之间的一致性检验
通过技术指标的三级指标对其二级指标的总层次的一致性检验,计算结果得到:CR=0.071 4<0.1,故层次总排序通过一致性检验。
5.AHP综合权值
计算某一层次所有因素对于最高层(总目标)相对重要性的权值,称为层次总排序。这一过程是从上到下依次逐步合成的,综合得到图书采购评标指标的AHP权值,如表1所示。
表1 各级指标的AHP权值和综合权值p
续表
(三)改进熵权法确定文献采购评标指标权重
使用R统计软件,根据公式(2)(3)对原始数据集中的每一列评标指标数据进行标极差一致性公准化处理和坐标平移法,得到标准化后的指标矩阵R,根据信息熵的计算公式(4)(5)编写R软件代码,把矩阵R读入R统计软件,运行R软件小脚本,得到图书采购评标指标的熵权值q,如表2所示。
表2 文献采购的熵权值q
(四)方差最大化原理优化组合权重
方差最大化原理的权重设置遵循差异性明显原则,该优化问题为二次规划最优解问题。对AHP得到的权值p和改进的熵权值q,进行线性组合,用方差最大化原理确定组合系数。把p、q代入公式(8),通过R统计软件计算确定组合系数α=0.758 9,β= 0.651 2。利用公式(6)得到AHP权值和改进熵权值的组合赋权w=(w1,w2,...,w24),再进行归一化处理。最终优化的复合权值向量,详见表3。
表3 文献采购评标体系指标权值
续表
三、讨论分析
(一)一级指标讨论分析
结果表明,一级指标综合权值最为重要的是技术分值,其次是商务分值,最后才是价格分值。这一数据结果表明,馆配商的技术指标是衡量馆配服务的最重要指标,评标体系中占比接近60%;商务权值为22.64%,馆配商的信誉和馆配年限(即经验)等成为评价馆配商的第二大指标;价格权值占17.40%,馆配市场日益透明,商业竞争重心由价格转向服务,图书馆在图书采购中从较早的打价格战转向以合理价格获取最佳服务。
(二)二级指标讨论分析
在技术的4个二级指标中,供货能力占比最大,供货能力在所有二级指标中包含的内容也最为丰富,从A21~A27共有7个三级指标,其中较为细致的有A24缺货登记、A26特需保障和A27订单调整,可见供货能力是馆配商评价指标的重中之重,不容小觑。
商务的二级指标中,B1合作图书馆的指标权值最大,合作图书馆的要求可根据各馆情况加以取舍,如与985、211、“一流学科”建设高校馆、本地高校馆的合作数量、年限、合作金额等都可作为馆配商的评价指标。一些占比小但能在一定程度上反映馆配商实力的,如B5馆配会组织、B6馆配年限等亦可选择设置。
(三)三级指标讨论分析
三级指标中权值最大的3个分别是:A22合作出版社0.053 8,A21到书率0.048 9,A32加工质量0.046 4。A22合作出版社,可依合作出版社的数量、购销金额、重点出版社数量、国家级出版社数量等进行评分。到书率可区分到书周期为1、2、3、6、12个月不等,也可再细分现采和订货的到书率。A32加工质量可依各馆实际而定。
(四)方差最大化优化AHP与改进熵组合赋权的可靠性对比验证
以闽江学院图书馆某次招标为例,用3种赋权方法进行对比分析。计算7个馆配商主、客观权值和组合权值的得分排名,结果见表4。
表4 主、客观权值和组合权值的得分排名表
AHP权值、改进熵权值和组合权值的馆配商排名结果为:前4名与真实排名一致的,后面3名也一致,但排序不同。根据合作经验值证明排名前四的4所馆配商近年与闽江学院图书馆合作频次最高,且信誉度很高。通过对比,组合权值的算法与评标结果的拟合程度最高,并对原有的评标得分进行了科学修正。
四、 结论
用方差最大化的原理优化主客观线性组合赋权,结合了主客观赋权的优缺点,从图3的权值对比图可以看出:
图3 3种算法对应的指标权值对比图Fig.3 The comparison chart of index weights of the three algorithms
(1)主观AHP权值的变化范围大,容易受到某个指标的影响。(2)客观改进熵权值的变化范围最小,可能会使得馆配商的得分接近,难以进行取舍。(3)用方差最大化原理优化的主客观组合权值,变化范围适中。主客观赋权的侧重点不同,其中价格指标为最明显权值,在主观权值中占比最大,在客观权值中占比最小。从3种方法得到的对应指标权值对比图(图3)可以清晰地看出,方差最大化原理组合权值是对主、客观权值的协调统一。
本文在前人构建的图书评标指标的基础上,针对图书采购评标指标权值设置的局限,利用全国25所高校图书馆的评标指标数据,建立维度为25×24的原始数据集;采用AHP和改进熵权法分别对评标指标进行了主、客观赋权;然后基于方差最大化原理优化主客观权值,进行组合赋权,构建评标效能模型。该方法能协调主、客观因素,同时处理指标的模糊性和随机性,最终结果直观明了,有效地保证了指标权值的合理性,使得评标结果更加有效,实证分析亦予以验证,这对图书馆文献采购评标权值的科学重构具有一定的参考意义。