基于灰色关联度分析的图书馆资源建设研究
2018-02-01王建芳
王建芳
摘 要:高校的内涵建设和学科建设与图书馆资源建设密不可分。为了使馆藏图书尽可能地满足读者需求,文章在研究灰色系统理论的基础上,对图书借阅的原始数据进行分析,建立了灰色关联度模型,得到图书的综合指标值,由此可判断图书的相对重要性。分析结果与实际相符,具有较高的精度和实用价值,为图书馆资源建设提供了可靠的科学依据。
关键词:资源建设;图书流通量;关联度模型
中图分类号:G250.76 文献标识码:A 文章编号:1671-0037(2018)11-93-3
DOI:10.19345/j.cxkj.1671-0037.2018.11.025
Research on Library Resource Construction based on Grey Correlation Analysis
Wang Jianfang
(Xi'an Railway Vocational and Technical Institute, Xi'an Shaanxi 710026)
Abstract: The connotation construction and discipline construction in the universities are inseparable from the construction of library resources. In order to satisfy the readers' needs of books as far as possible, based on the study of Gray System Theory, this paper analyzed the original data of books borrowing, and established a gray correlation model to get the comprehensive index value of the books, on that basis, the relative importance of the books is determined. The analysis results are consistent with the actual situation, and have high accuracy and practical value, which have provided reliable scientific basis for the construction of library resources.
Key words: resource construction; book circulation; correlation model
随着社会的迅速发展,科技的不断进步,人们的阅读方式越来越多元化,许多高校图书馆借阅量呈现下滑趋势。为改变现状,图书馆定期投入大量资金购置图书,但效果甚微。因此,图书馆资源建设势在必行。由于图书流通量受多种不确定因素影响,不能用定数论规律描述,而灰色系统理论可以对多指标模糊事物进行识别。本文在灰色关联度模型基础上,结合实际需要做了适当改进,利用图书借阅的原始统计数据,分析了各类图书的相对重要性,为图书馆资源建设提供了可靠的依据。
1 评价指标体系的确定
研究以西安铁路职业技术学院图书馆为例,图书馆每学年都要投入大量资金购置图书,以满足各学科专业老师和学生的需求。目前,馆藏图书涵盖工程、自动化、电工、运输、经济、法律、军事、文学、艺术、医学、天文学、计算机、化学、能源等,每学年不同图书流通量差异很大。在此选取15种图书,统计其5个评价指标的数据进行分析,5个评价指标分别为种类数、借出种类数、图书册数、借出册数和借出天数。
2 灰色关联度分析法原理及步骤
灰色关联度模型的基本思想是利用灰色关联分析法对系统发展变化态势的定量比较和反映。所谓灰色关联分析,就是系统的因素分析,是根据系统各因素之间发展趋势的相似或相异程度,即“灰色关联度”,作为衡量因素间关联程度的一种方法[1-2]。具体步骤如下:
2.1 收集评价指标体系数据
假设有[n]个对象,[m]个指标,[xij]表示第[i]个对象第[j]个指标的值,则原始数据矩阵表示为
[Xn×m=x11 x12 … x1j … x1mx21 x22 … x2j … x2m? ? ? ? ? ?xi1 xi2 … xij … xim? ? ? ? ? ?xn1 xn2 … xnj … xnm1≤i≤n,1≤j≤m] (1)
2.2 数据标准化处理
由于系统中各因素列可能因单位不同,即量纲不同,使得各指标值的数量级别差距很大,不便于比较,或在比较时难以得到正确的结论。因此,在进行灰色关联度分析时,一般都要对原始数据进行标准化(无数量级、无量纲化)的预处理,使其具有可比性。常用的处理方法有初值化、均值化和归一化法,初值化法适用于较稳定的社会经济现象的数据处理;均值化法适用于无明显升降趋势现象的数据处理。具體应用可根据实际情况选用其中之一。本文采用均值化法,即
[x*ij=xij1ni=1nxij] (2)
2.3 分析序列确定
在相互关联的指标体系中,要进行关联分析,必须确定出母序列和子序列。母序列作为参考数据列应该是一个理想的、对方案影响相对重要的指标,因此,以各指标的最优值(或最劣值)构成母序列(参考序列),也可根据评价目的选择其他参照值,记作[X0],即[Xo=x10,x20,…xi0…xn0]其他影响因子构成子 序列(比较序列),记作[Xj],即[Xj=x1j,x2j,…xij…xnj]。
2.4 关联系数计算
关联系数是衡量各因素列对应曲线间几何形状的差别程度。对于一个参考序列[Xo]和若干个比较序列[Xj],各比较序列与参考序列在第[k]点(即曲线中的[k]点)的关联系数可分别由下式算出:
(a)邓氏算法[yjk=a+AξΔjk+Aξ] (3)
其中,[Δjk]为差序列,记为[Δjk=x*kj-x*kok=1,2,…n,j=1,2,…m],两极最小差为[a= min1kn min1jmΔjk],两极最大差为[A= max1kn max1jmΔjk],[ξ0ξ1]为分辨系数,其作用是削弱最大差太大引起的失真,以提高关联系数之间差异的显著性。[ξ]越小,表明关联系数差异越大,区分能力越强。(通常取[ξ=0.5])。
(b)斜率算法[yjk11+Δxokσxo-Δxokσxi] (4)
其中,[Δxok,Δxik]为后减差序列,[σxoσxi]为标准差,分别由下式计算:
[Δxok=xok+1-xok] (5)
[Δxik=xik+1-xik] (6)
[σxo=1nk=1nxok-xo2] (7)
[σxi=1nk=1nxik-xi2] (8)
2.5 关联度计算
关联度是衡量子序列与母序列相似程度的测度。比较序列构成的曲线与参考序列构成的曲线的几何形状越相似,其关联度越大。由于上述关联系数的数值很多,使得信息过于分散,不方便比较,因此,可将各个点的关联系数集中为一个值,即求出其平均值反映各比较序列与参考序列的关联程度,称为关联度[3-4](等级如表1所示)。
表1 关联度分级表
[等级 关联度 评价描述 低关联 0~0.3 两指标耦合作用弱 中等关联 0.3~0.6 两指标耦合作用中等 较高关联 0.6~0.8 两指标耦合作用较强 高关联 0.8~1 两指标耦合作用极强 ]
(a)邓氏关联度算法
[rj=1nk=1nyjk] (9)
(b)斜率关联度算法
[rj=1n-1k=1n-1yjk] (10)
歸一化处理后,即
[r*j=rjj=1mrj] (11)
2.6 改进的关联度计算
考虑到实际问题中,数列内各元素的重要性互不相同,直接取关联系数平均值作为关联度,缺乏一定的可信度,因此可主观引入权重因素来消除该误差,若[wj]为第[j]个元素的权重值,则改进后的关联度可由下式计算:
[w*j=wj·r*jj=1mwj·r*j] (12)
其中[wj]可由图书馆主管领导结合资料与实践给出指标比较矩阵,通过层次分析法计算确定。
2.7 综合指标值计算
综合各个因素的权重和各个指标的取值,可得到第[i]个参评对象的综合指标值[Zi],即
[Zi=j=1mw*j·x*ij] (13)
[Zi]式中愈大,說明其重要程度愈大。由此,可判断各指标的相对重要程度。
3 实证分析
3.1 数据资料收集
收集西安铁路职业技术学院15种图书一学年流通量数据。通过统计分析,不同图书的出借量差异很大,但影响因素相互关联。因此,下面用灰色关联度模型进行分析,在计算得到5个指标相应权重的基础上,定量表示出各类图书的相对重要程度。
3.2 数据标准化处理
对数据进行均值化处理,通过matlab编程[5-6]得到
3.3 确定分析序列
母序列:借出册数,即
[X0=0.6350,0.5042,3.2637,…0.5264,0.2555']
子序列:种类数、借出种类数、图书册数和借出天数,即
[X1=0.6796,0.6614,2.2305,…0.8074,2.0321']
[X2=0.6078,0.5523,2.4967,…0.6732,2.2712']
[X3=0.7775,0.6288,3.0.488,…0.6738,0.2465']
[X4=0.4987,0.4890,3.4671,…0.4866,0.3183']
3.4 AHP法确定评价指标权重
由西安铁路职业技术学院图书馆主管领导及馆员综合分析图书资料数据,结合实际给出指标比较矩阵,通过层次分析法计算确定。采用1-9标度法构造5项指标间相对重要性的比较矩阵如下:
由matlab编程求解得到
[wj=0.0776,0.2650,0.0506,0.4693,0.1375]。为了满足实际需求,此项指标也可灵活调整给出。
3.5 计算关联系数和关联度
由公式(1-12)依次计算得到关联度,其中分辨系数取值[ξ=0.5],由matlab编程求解分别得到邓氏关联度和斜率关联度(见表2)。
3.6 计算各类图书的综合评价值
由公式(13)计算得到。选取表2中任一组关联度即可,在此选改进后的斜率关联度计算,通过matlab求解得到排序结果如表3所示。
4 结语
由表3的结果可知,模型计算结果与客观实际均相符。其中经济类、文学类、语言类和自动化、计算机类在上述图书中占据相当大的权重。文学和语言属于通识类,各专业均有需求,经济类是社会发展需求,而计算机类作为技能课重要性可见一斑。此外,作为公共课的数理科学、法律和重点专业的建筑、电工、运输等也具有相当的重要性。由此分析可见,改进后的灰色关联度模型对图书馆资源建设是完全可行的,根据模型分析合理调整馆藏图书结构,可有效提高图书利用率,达到学科建设和内涵建设的需要。
参考文献:
[1] 王显燕.基于读者决策采购的高校图书馆资源建设策略研究[J].情报探索,2013(10):68-71.
[2] 李晔,秦梦.基于灰色关联分析法的城镇化水平的综合评价:以中原城市群为例[J].河南科学,2013(3):388-393.
[3] 鲍学英,李海连,王起才.基于灰色关联分析和主成分分析组合权重的确定方法研究[J].数学的实践与认识,2016(9):129-134.
[4] 刘盼盼,洪旭东,郭剑毅.基于灰色关联分析的中文新闻事件关联性识别[J].计算机应用, 2016,36(2):408-413.