APP下载

区域信息化简约评价指标体系的构建

2015-02-25阮家港

关键词:熵权法评价指标体系聚类分析

阮家港

(商丘学院 工商管理学院, 河南 商丘 476000)

(责任编辑:张璐)

*本文已于2014-11-27 09∶38在中国知网优先数字出版。 网络出版地址: http:∥www.cnki.net/kcms/detail/21.1558.C.20141127.0938.010.html

区域信息化简约评价指标体系的构建

阮家港

(商丘学院 工商管理学院, 河南 商丘 476000)

摘要:踏着全球信息化和经济全球化的浪潮,区域信息化评价正在不断地向深度和广度推进,建立一套科学而简约的评价指标体系迫在眉睫。在海选区域信息化评价指标的基础上,采用变异系数和相关系数初步筛选指标,通过聚类因子分析法对指标进行二次筛选,以确保指标体系简洁而全面。构建由9个指标组成的区域信息化水平简约评价指标体系,运用熵权法对各指标赋权并构造综合评价函数,对31个省市的信息化水平进行测度,并通过信度、效度分析和方差贡献率验证指标体系的合理性。

关键词:信息化; 评价指标体系; 聚类分析; 因子分析; 熵权法

区域信息化评价是一项复杂的系统工程,而建立一套简洁而又合理的评价指标体系是有效评价的关键。学者们已构建了多种形式的评价指标体系,代表性的有2001年公布的《国家信息化指标构成方案》,确定了信息化六要素并将其分解为25项具体指标[1];修文群在国家信息化六要素基础上提出了区域信息化评价指标体系[2];高华等提出了用于比较中部与发达省份信息化水平的评价指标体系[3];张义龙等构建了用于省级信息化差异性评价的指标体系[4]。

深入分析有关区域信息化指标体系构建的研究文献,发现尚有不足之处:一是指标数量多,部分指标数据难以获取,且有些指标数据需要经过复杂的计算才能够得到;二是指标体系中部分指标间相关性较高,反映的信息重复,有些指标在样本得分上无明显差异,缺乏鉴别力[5];三是指标选取随意性大,指标体系多是直接给出,缺乏指标体系合理性的论证;四是指标权重的确定主观性较强,易使评估结果失真[2]。综上所述,建立一套简洁、合理的区域信息化评价指标体系十分必要。

一、省级信息化评价指标体系构建方法与实证

1. 研究思路

(1) 深入分析相关文献并结合年鉴资料中与信息化有关的统计数据,全面海选指标。

(2) 计算各指标数据的变异系数,去除鉴别力较小的指标;计算任意两个指标数据间的相关系数,从相关系数较高的指标对中选择一个指标。

(3) 对指标组聚类分析,并对每一类指标进行因子分析,删除因子负载较小的指标。

(4) 通过熵权法对各指标赋权并构造综合评价函数,对31省的信息化水平进行测度。

(5) 从信度、效度和方差贡献率3个方面判定指标体系的合理性。

2. 指标海选

依据指标选取的客观性、可操作性、时效性等原则,海选出下列指标:人均地区生产总值(元),固定长途电话交换机容量(路端),局用交换机容量(万门),移动电话交换机容量(万户),光缆线路长度(公里),电话普及率(部/百人),移动电话普及率(部/百人),每千人拥有公用电话数(部),开通互联网宽带业务的行政村比重(%),互联网普及率(%),互联网上网人数(万人),域名数(万个),网站数(万个),互联网宽带接入端口数(万个),互联网宽带接入用户数(万户),普通高等学校在校学生数(人),普通高等学校数量(所),有效发明专利数(件),三种专利申请授权数(件),技术市场成交额(万元),广播节目综合人口覆盖率(%),电视节目综合人口覆盖率(%),人均拥有公共图书馆藏量(册),邮电业务总量(亿元),邮政业务总量(亿元),电信业务总量(亿元),3G移动电话用户数(万户),信息传输、软件和信息技术服务业就业人数(万人),科学研究和技术服务业就业人数(万人),平均受教育年限(年),信息产业增加值占GDP比重(%),信息产业研发经费占GDP比重(%),城镇居民彩色电视机拥有率(台/百户),城镇居民计算机拥有率(台/百户),农村居民彩色电视机拥有率(台/百户),农村居民计算机拥有率(台/百户),R&D经费支出占GDP比重(%),教育经费投入占GDP比重(%),共计38个。

3. 数据来源及标准化

本文数据来源于2011—2013年《中国统计年鉴》、《中国信息年鉴》、《中国第三产业统计年鉴》和各省统计年鉴。

本文指标体系中所有指标均为正向,数值越大表明信息化水平越高。正向指标数据的标准化公式[6]为

(1)

式中:xik和xik′分别为第i个评价对象第k个评价指标得分的原始值和标准化后的值;n为评价对象的个数。

4. 指标数据的变异系数和相关系数分析

评价指标的鉴别力作为指标区分评价对象特征差异的能力,是评价一个指标品质好坏的重要标志[5]。信息化水平各评价指标的鉴别力是指评价指标区分不同省份信息化水平高低的能力。如果所有省份在某个指标上的得分趋于相同,则可认为该指标几乎没有鉴别力,不能区分各省份信息化水平的高低;反之,如果各省份在某个指标上的得分呈现明显差异,则表明该指标有较高的鉴别力,能够诊断和识别出不同省份信息化水平的高低。在实际应用中,通常用变异系数来描述指标的鉴别力,其计算公式如式(2)所示,变异系数越大,指标的鉴别能力越强;反之越弱[7]。根据实际情况确定一个临界值,去除变异系数小于临界值的指标,可得到可比性较好的指标体系。

(2)

变异系数分析后的指标间依然会存在高度相关性,这将导致被评价对象信息的过度重复使用,从而极大地降低评价结果的科学性和合理性,相关系数分析可以进一步简化指标体系[5]。第i个指标和第j个指标的相关系数rij的计算公式为

(3)

为防止由于某一年数据间的偶然联系而误删指标,因此使用近三年的统计数据进行变异系数和相关系数分析。此外,数据标准化变换过程中虽然变量之间的相关系数不改变,但变异系数一般会发生改变,因此本文的相关分析和变异系数分析均直接使用原始数据。给定变异系数和相关系数的临界值分别为0.30和0.95,两者的分析结果分别如表1、2所示。

表1 变异系数分析结果

表2 相关系数分析结果

由表1可知,2010年31省在“广播节目综合人口覆盖率”指标上得分数据的变异系数值为0.033,2011年和2012年该指标得分数据的变异系数值分别为0.030和0.026,可见三年数据的变异系数值均小于临界值0.3,因此变异系数分析删除该指标。相关系数分析中选留指标的原则是:参照信息化统计评价研究组信息化发展指数(Ⅱ)指标体系的指标选取思想,从两个相关系数较高的指标中选留综合性较强的指标。

5. 指标数据聚类因子分析

采用ward(离差平方和)系统聚类法对所剩指标进行R型聚类。Ward系统聚类法的思想来自方差分析,如果类分得正确,同类指标的离差平方和应当较小,类与类之间的离差平方和应当较大。Ward系统聚类法使得两个大的类倾向于有较大的距离,因而不易合并;相反,两个小的类却因倾向于有较小的距离而易于合并;这往往符合我们对聚类的实际要求[8]78。

(4)

整个类内离差平方和为

(5)

Ward系统聚类法的具体步骤[9]为

(1) 原始数据标准化,将n个评价指标看成n个类。

(2) 将n个指标中的任意两个合并成一类,共有n(n-1)/2种方案,计算各方案总的离差平方和,按总离差平方和最小的合并方案进行新的分类。

(3) 用新的指标类代替原来的指标类,重复步骤(2)直至将所有指标归为一类。

为了避免分类数目确定的主观随意性,对聚类后每一类的指标进行非参数K-W检验。非参数K-W检验的原假设是不同的指标在数值特征上无显著差异,若每一类的显著性水平sig值均大于0.05,则接受原假设,即同一类指标间无显著差异,聚类数目合理[9]。

表3 指标筛选的聚类因子分析

续表

二、区域信息化水平综合评价

采用熵权法[10]35对各指标赋权并构造综合评价模型,具体过程为:

(1) 计算熵值。设有m个评价指标和n个评价对象,则第i个指标的熵值为

(6)

(2) 计算熵权。第i个指标的熵权为

(7)

(3) 构造综合评价模型。第i个样本的综合评价值为

(8)

对数据标准化处理后,运用Excel软件求得的权重和综合评价结果见表4。

三、指标体系合理性判定

1. 信度和效度分析

表4 区域信息化水平综合评价结果

续表

(9)

使用Spss软件计算简约评价指标体系中各类别的Cronbach’sα信度系数,量表中类别1、2、3三个维度的Cronbach’sα系数分别为0.709、0.637、0.748,信度系数均在0.7左右。对整个简约指标体系的所有指标进行内部一致性分析,得出总的Cronbach’sα系数为0.859,说明指标体系具有较好的信度。

效度分析是为了检验指标能够解释测量相关变量的有效程度,主要包括内容效度、构想效度和效标效度三种[11]。本文采用效标效度对指标进行效度检验。以信息化统计评价研究组发布的2012年中国信息化发展指数(Ⅱ)研究报告中对31个省市的信息化水平评价结果的排序(2011)为效标,计算本文得到的31省市的信息化水平评价结果排序间的Kendall和Spearman相关系数。结果表明,两排序间的Kendall相关系数为0.604,Spearman相关系数为0.778,两个系数在0.01的显著性水平上均呈现高度相关,说明本文测评结果有较高的效标关联效度,进而说明构建的指标体系合理。

2. 方差贡献率分析

由于指标所含信息量的大小用方差大小来衡量,因此,也可计算最终指标体系中各指标方差之和占筛选前各指标方差之和的比例,即用方差贡献率来判定指标体系的合理性。方差贡献率=1.913×1013/1.945×1013=98.4%,即用最终的9个指标代替原来的38个指标进行区域信息化评价,信息损失率仅为1.6%,也说明了所构建的指标体系合理。

四、结论

本文通过对海选的区域信息化水平评价指标变量综合运用变异系数分析、相关系数分析、聚类分析和因子分析,构建了由9个数量指标构成的区域信息化简约评价指标体系,通过熵权法确定各指标权重并构造综合评价函数,对31省市的信息化水平进行了测度。结果表明,该指标体系有较好的信度和效度及较高的方差贡献率,指标含义明确,数据易获取,方便区域信息化水平的实际测度。

参考文献:

[1]国家统计信息中心.1999—2001年中国各地区信息化水平测评与比较研究 [J].统计研究,2004(3):3-11.

[2]修文群.区域信息化的测度与评价 [J].情报学报,2002,21(2):197-208.

[3]高华,徐绪松.中部五省与沿海发达省份信息化水平比较研究 [J].武汉大学学报:哲学社会科学版,2007,60(1):19-24.

[4]张义龙,章昌平,朱玉鑫,等.我国省级信息化水平差异性的综合评价 [J].社会科学家,2012,183(2):75-78.

[5]范柏乃,徐伟红.中国地区科技竞争力的评价体系与实际测度研究 [J].自然辩证法通讯,2005,27(6):56-68.

[7]许燕,屈云龙.人口素质评价体系的构建及应用:以江苏省为例 [J].人口与发展,2011,17(1):45-54.

[8]王学民.应用多元分析 [M].上海:上海财经大学出版社,2009.

[10]邱菀华.管理决策与应用熵学 [M].北京:机械工业出版社,2002.

[11]周平红,杨宗凯,张屹,等.基于结构方程模型的我国高等教育信息化水平综合评价研究 [J].电化教育研究,2011(11):5-10.

[12]江蕾,李小娟.我国区域自主创新能力的评价体系构建与实际测度研究 [J].自然辩证法通讯,2010,32 (3):70-80.

(责任编辑:张璐)

Construction of simplified evaluation indicator system

of regional informatization

RUAN Jia-gang

(School of Business Administration, Shangqiu University, Shangqiu 476000, China)

Abstract:Following the trend of global informatization and economic globalization, the evaluation of regional informatization is progressing both in depth and in breadth. It is imperative to establish a set of scientific and simplified evaluation indicator system. Based on the various evaluation indicators of informatization in regional areas, the indicators are firstly screened by using the coefficients of variation and correlation coefficients. And the indicators are then screened through the cluster-factor analysis method so as to ensure the indicator system concise and comprehensive. The simplified evaluation indicator system of regional informatization is composed of 9 indicators. The weight of each index is given by the entropy weighting method, and the comprehensive evaluation function is formed. The informatization levels of 31 provinces and municipalities are calculated with the function, and the rationality of the simplified indicator system is verified though the confidence, validity analysis and variance contribution rate.

Key words:informatization; evaluation indicator system; cluster analysis; factor analysis; entropy method

中图分类号:C 939

文献标志码:A

文章编号:1674-0823(2015)01-0076-06

doi:10.7688/j.issn.1674-0823.2015.01.13

作者简介:阮家港(1980-),男,河南睢县人,讲师,硕士,主要从事复杂系统评价等方面的研究。

基金项目:河南省教育厅科学技术研究重点项目(14A630033)。

收稿日期:2014-06-26

猜你喜欢

熵权法评价指标体系聚类分析
大学周边健身房满意度调查报告
基于熵权法的京津冀区域信息化协调发展规律模型及其应用
民办高职院校评价指标体系研究
农村居民家庭人均生活消费支出分析
工程咨询企业可持续竞争力评价指标体系研究
新常态下大型煤炭企业生态竞争力实证分析
基于熵权法的西安市外向型经济发展综合评价研究
关于三江源生态移民创业能力评价指标体系构建的研究
基于省会城市经济发展程度的实证分析
城市与区域经济可持续发展