基于相关—主成分分析的高校移动图书馆服务质量评价指标体系构建
2019-05-15
(辽宁工业大学图书馆,辽宁 锦州 121001)
1 引言
智能手机用户的井喷式增长及用户时间碎片化、阅读重点化等因素的影响,使得移动图书馆应运而生并快速发展起来。它依托移动网络及多媒体技术,使读者可以方便灵活地对图书馆资源进行查询、浏览与获取[1]。在我国,移动图书馆尚处起步阶段,服务内容多限于一些基础性的工作,诸如查、约、借等,服务质量也良莠不齐。而学术界对专门性研究高校移动图书馆服务质量的文献少之又少,笔者在中国知网期刊数据库进行检索:检索范围选择“全部”,篇名=“移动图书馆”ד评价”,对检索到的相关文献进行深度阅读后发现,真正评价移动图书馆服务质量的文献只有11篇,评价方法主要采用LibQual+和层次分析法,其评价的指标体系多是通过文献法或专家访谈法建立因果关系模型构建移动图书馆服务质量评价指标体系,指标选择较多,合理性有待商榷。鉴于此,本文采用因子分析法中的相关分析法和主成分分析法对已有研究成果中的各个指标进行分析、筛选、剔除,以期构建一套针对高校移动图书馆服务质量评价的指标体系。
2 相关—主成分分析法应用于高校移动图书馆服务质量评价指标体系构建的可行性
“数据处理”是信息时代最主要的特征之一,数据无所不在,充斥于我们的生活之中。面对繁杂的数据,我们试着通过量化它,达到理解它、控制它、改变它的目的。因子分析法是当前较为成熟的数据处理与分析方法,它利用公因子的公式组合来表示样本的整体特征,通过从变量中找出关键因子,实现将本质相同的变量归入同一个因子的目的[2],从而避免所统计的指标出现信息重复,它不但可以最大限度地减少评价指标的数目,增强评价指标全面性与易用性,还可以检验变量间关系的假设,已被广泛应用到各个领域。本文的评价指标体系的构建主要采用因子分析中相关性分析和主成分分析。相关性分析是通过计算相关系数来实现对原始指标的定量删除,避免反应信息冗余的指标出现在最终的评价体系中。在相关性分析的基础上,对初步筛选后的指标进行主成分分析,删除影响力小的评价指标,最终实现评价指标体系既简洁又影响显著。
3 高校移动图书馆服务质量评价指标体系构建及筛选思路
3.1 海选原始指标体系
海选的原始评价指标来源于两部分:已有研究成果中采用的指标;图书馆界专家学者的意见。
笔者在中国知网期刊数据库进行检索,检索入口为“篇名”,检索词为“移动图书馆”×(“评价”+“评估”),匹配度为“模糊”,共检索到相关文献29篇,深度阅读后,提取了相关文献内涉及的移动图书馆服务质量评价指标,作为原始评价指标之一[1,3-5]。
另外一个原始评价指标来源于图书馆领域的专家学者。我们共选取了10位涉足移动信息服务领域且具有多年高校图书馆工作经验的学者作为调查对象,听取了他们的意见建议,作为原始评价指标之二。
我们对这两部分指标体系进行了汇总,选取了内容质量、环境质量、交互质量、结果质量4个一级指标22个二级指标,构建出高校移动图书馆服务质量评价的原始评价指标体系,具体见表1。
表1 高校移动图书馆服务质量原始评价指标体系
注:本文采用因子分析法对这22个原始指标进行了优化,以避免指标间的重复度,并力争使每个指标对测评结果具有显著性影响。
图1 原始评价指标筛选示意图[6]
3.2 评价指标筛选思路
首先,在查阅了相关文献和咨询专家的基础上,对影响高校移动图书馆服务质量的指标进行构建,即选取原始变量;其次,利用因子分析法中的相关性分析和主成分分析对四个原始指标准则层内的指标进行分析,计算出相关系数得分和因子载荷得分,删除载荷因子小和相关系数大的指标;最后,构建出新的高校移动图书馆服务质量评价指标体系。具体分析、评价、筛选过程见图1所示。
4 高校移动图书馆服务质量评价指标体系的重构
4.1 筛选前原始指标数据的标准化
数据的标准化就是通过公式计算将评价指标转化为0-1之间的数,以便消除指标差异性对筛选指标的影响。评价指标有正向、负向、区间三种,它们是依据评价指标对被评价主体影响的不同而划分的。正向指标标准化数值越大、负向指标标准化数值越小,指标越好,区间指标在特定的区间范围内,指标最好。具体剔除时要剔除正向指标指数值小、负向指标指数值大、以及区间范围之外的指标。
正向指标数据和负向指标数据标准化处理时采用的公式分别为:
(1)
(2)
其中:i为原始评价指标体系中指标的数值,j为评价对象的数值,m为指标的总个数(本文中m为20),vij为第j个评价对象的第i个指标数值,xij为将vij标准化后的数值。
4.2 相关性分析筛选原理与方法
4.2.1 筛选原理
万物是相互关联的,具有相关性。相关性是指两个变量之间的变化趋势的一致性,而相关性分析是分析客观事物之间关系的数量分析方法,通过对具备相关性的变量进行分析,达到衡量两个变量的相关度的目的。利用公式,计算出同一准则层中每对指标的相关系数,系数较大的指标中删除其中一个,保证评价指标的简练,避免指标重复反映信息[7]。本文中主要是剔除高校移动图书馆服务质量原始评价指标中高度重复度的指标,以降低重复性评价指标对评价结果的影响。
4.2.2 筛选方法
(1)计算高校移动图书馆服务质量评价各指标的相关系数
各指标的相关系数可以通过SPSS软件来实现,具体的计算公式为:
(3)
其中:i为原始评价指标体系中指标的数值,j为评价对象的数值,k为评价对象的数值,rij为相关系数(高校移动图书馆服务质量原始评价指标中i、j两指标的相关系数),zki为第k个评价对象的第i个指标的值[8]。
(2)设定临界值,筛选指标
根据高校移动图书馆服务质量评价的实际情况设定一个临界点M(0 4.3.1 筛选原理 主成分分析的基准思想是降维,通过降维可以实现指标的精简——即把多个指标转化为少数的主成分。这种方法在引进多方面变量的同时将复杂因素归结为几个主成分,从而保证筛选出的指标均为重要指标[9]。 在相关性分析的基础上,继续对评价指标进行主成分分析,获取各个指标的因子载荷,因子载荷是介于-1和1之间的数值,它反映评价指标对评价结果的影响力度。保留因子载荷绝对值大的指标,删除因子载荷绝对值小的指标。 4.3.2 筛选方法 (1)主成分分析的计算模型 主成分分析的计算模型为:Fj=xi1X1+xi2X2+……+ximXm 其中:k为主成分的个数,m为指标个数,Xi为原始指标体系中的第i个指标(1≤i≤m),本文中m为22,则Xi表示X1到X22;Fj为第j个主成分(1≤j≤k),本文中k为4,则Fi表示F1到F4;xij为为对应第i个特征值的特征向量中第j个分量。 (2)主成分分析的步骤 主成分分析的步骤如图2所示: 图2 主成分分析流程图[6] 相关性分析、主成分分析都是以同一准则层内的原始评价指标为对象,筛选出具有代表性的指标。相关性分析通过删除相关系数大的指标,来避免指标所辖信息冗余重复。而主成分分析则是通过主成分因子载荷的数值对指标进行删除,删除对评价结果影响力小的指标。依次使用相关性分析和主成分分析筛选原始指标,既可以使选出的指标间没有高度的相关性,又可以使统计指标含义清晰,从而使构建出的新的指标体系更加科学合理。但是新构建的评价指标体系是否合理尚需要判断。因此,我们运用因子分析法,用数据方差来表示指标信息含量,建立高校移动图书馆服务质量评价指标体系合理性判定标准。具体来说,用IN表示筛选后的原始评价指标对原始海选评价指标的信息贡献率[10],具体公式如下: IN=trSs/trSh (4) 其中:S表示高校移动图书馆服务质量原始评价指标的协方差矩阵,trS表示高校移动图书馆服务质量原始评价指标协方差矩阵的迹,h表示海选的高校移动图书馆服务质量原始评价指标总个数,s表示原始评价指标筛选后得到的指标个数,trSs筛选后指标的方差之和,trSh筛选前的指标方差之和,IN为二者的商——信息贡献率。 在借鉴相关文献论述和对部分读者进行访谈的基础上,设计了针对高校移动图书馆服务质量评价调查问卷。问卷分为两部分:第一部分为读者的基本情况(性别、年龄、学科、身份……);第二部分是对影响高校移动图书馆服务质量的各个指标进行调研。问卷采用李克特五级量表,对下设的“非常满意”“满意”“不确定”“不满意”“非常不满意”五个指标,分别赋值5分、4分、3分、2分、1分。 以辽宁省高校图书馆为例,共发放问卷500份,问卷回收率96%,其中无效问卷23份,有效问卷回收率为91.4%,达到了调查问卷的基本要求。 本文所涉及指标均为正向指标,数据代入公式(1)即得到标准化数据。在SPSS中具体操作过程如下: 在SPSS的菜单中依次选择:分析—描述统计—描述,在弹出的对话框里勾选“将变量保存为标准化得分”复选框,然后把要标准化的变量选入右边变量框,点击“OK”,就可以得到我们预期的标准化数据,见表2。 表2 高校图书馆评价指标筛选原始数据及标准化数据 依据公式(3),计算出同一准则层中每对指标的相关系数。系数高表明两指标关系紧密,所代表的信息重复,则可删除其中一个指标。系数低表明两指标关系疏远,均应予以保留。在SPSS中具体操作步骤如下: (1)导入数据:把数据录入SPSS中,依次点击“文件”—“打开”—“数据”(并选择你的数据,如果为SPSS数据可以直接导入,若为excel格式,需要在“文件类型”框中选择“excel格式”); (2)数据分析:在SPSS工具栏处,依次点击:“分析”—“相关”—“双变量”; (3)选择变量:点击“选项”,选择需要分析的“统计量”,将要分析的变量放入“变量”框; (4)获取结果:选中要分析的数据,点击“确定”,在output窗口就可以看到结果; (5)结果分析:计算结果称皮尔逊相关系数,用字母r来表示,设定临界点M,若r>M,则可删除两项比较指标中的一个;若r 表3 相关性分析的筛选筛选 对标准化后的数据进行相关性分析,本文设定一个临界点M=0.8,若|rij|>0.8,则删除两项比较指标中的一个指标;若|rij|<0.8,两个指标都保留。 在利用相关性分析对原始评价指标进行第一次定量删除后,还要用主成分分析对余下指标进行二次定量删除,并依据计算出的各个指标的因子载荷,删除因子载荷绝对值小的指标。在SPSS中的具体步骤如下: (1)打开SPSS,在栏中输入需要分析的数据; (2)在菜单栏中,依次选择“分析”—“降维”—“因子分析”,进入到因子分析界面; (3)在因子分析界面里,将预计分析的数据选择进入变量框内; (4)点击“描述”按钮,在“方法”选项卡、“分析”选项卡、“输出”选项卡、“抽取”选项卡中分别选择“主成分”“相关性矩阵”“未旋转的因子节和碎石图”“基于特征值”,选择完毕后,点击“继续”按钮; (5)点击“抽取”按钮,选择“主成分”—“碎石图”; (6)点击“旋转”按钮,选择“载荷图”,点击“继续”—“确定”,新窗口中就会出现所需的主成分的因子负载数据; (7)根据因子载荷绝对值筛选原始指标:保留因子载荷的绝对值大的指标,删除因子载荷绝对值小的指标。 表4 主成分的特征值和贡献率 表5 主成分载荷系数 表6 构建的高校移动图书馆服务质量评价指标 对标准化后的数据进行主成分分析,计算出主成分负载系数。并根据辽宁工业大学图书馆读者对移动图书馆服务质量的期望设定一个临界点N,本文将N定也0.9,对于|bij|<0.9的指标予以删除,反之保留。最终的保留指标如表6所示。 利用前面数据,通过公式,计算出筛选前后各指标的方差之和trSh和trSs的数值分别为2.042和2.064。带入公式IN=trSs/trSh,得到筛选后的指标对筛选前指标的信息贡献率为98%。即从海选22指标中筛选出16个指标,63.6%(14/22)的指标反映了98%的原始信息,指标构建合理。 本文通过借鉴前人研究成果和专家访谈的方式,海选出了影响高校移动图书馆服务质量的原始指标22个,运用因子分析法中的相关性分析和主成分分析对这22个指标进行梳理筛选:通过相关性分析,剔除同一准则层内相关系数大的指标,通过主成分分析剔除负载系数绝对值小的指标。共精选出16个评价指标,重构了新的高校图书馆服务质量评价指标体系。规避了主观确定指标权重的随意性,实现了定量定性的结合,使得高校图书馆评价指标体系更具科学性、合理性。最后用信息贡献率对评价指标的合理性进行了判定,新构建的63.6%的指标能反映98%的原始信息,说明所构建的新的评价指标体系合理有效。4.3 主成分分析筛选原始指标的原理与方法
4.4 判定新建评价指标体系的合理性
5 高校移动图书馆服务质量评价指标的实证分析
5.1 样本的选取
5.2 指标数据的标准化
5.3 基于相关性分析的指标筛选
5.4 基于主成分分析的指标筛选
5.5 判定指标体系构建的合理性
6 结语