因子分析在各地区科技能力综合评价中的应用
2018-04-04张莉芳
张莉芳
摘要: 社会的发展与科技的发展密切相关,因此评价中国各地区的科技发展水平是必要的。笔者以中国统计年鉴2014的数据为样本,选取反映各地区科技发展水平的8个指标值,采用因子分析法对这些指标值进行综合评价,构建综合评价得分模型,避免了单纯地以某个指标评价科技发展水平产生的偏差,以便更好地评价中国各地区的科技发展水平提供参考。
Abstract: The development of society is closely related to the development of science and technology. Therefore, it is necessary to evaluate the level of science and technology development in various regions of China. Based on the data of China Statistical Yearbook (2014), the author selects eight indicators which reflect the level of scientific and technological development in each region. Factor analysis method is used to evaluate these indexes, and a comprehensive evaluation score model is constructed. The bias resulting from evaluation of the level of technological development with single indicator is avoided, which helps to evaluate technological development level of the various regions of China.
关键词: 科技发展水平;评价指标;因子分析
Key words: level of scientific and technological development;evaluation index;factor analysis
中图分类号:F273.1 文献标识码:A 文章编号:1006-4311(2018)10-0178-04
0 引言
纵观历史,人们发现,每逢全球经济危机,往往靠科技创新“救市”[1]。人类区别于动物的生存方式就是创新,而创新需要由科技来实现。科技创新的社会经济和社会伦理价值无不涉及社会文化价值。改革开放以后,邓小平重申马克思科学技术是生产力的观点,科学技术是第一生产力。因此,评价中国各地区的科技发展水平有了十分积极的社会意义。
1 因子分析文献回顾
王汉斌等[2]2009年建立因子分析模型,评价山西煤矿安全性,该模型中从煤矿施工工人的个人素质、施工现场环境状况、施工安全防护设备、管理机制等方面选取了一系列与煤矿安全由关的评价指标。章柳云[3](2010)采用因子分析法,从编辑意识、编辑认知能力、核心专业能力、信息化操作能力和自我发展能力五个方面评价了体育学术期刊编辑的专业能力。薛庆根[4](2013)首先采用因子分析将传统期刊评价指标分为影响力与时效性两个公共因子,然后采用传统回归和分位数回归研究特征因子与期刊影响力与时效性的关系。董建军和付中静[5](2014)对2011年SCI-E收录的8000多种期刊的主要文献计量学指标与特征因子之间的相关性进行了研究,发现特征因子与总被引频次、5IF被引量、IF-被引量具有高度的正相关关系、与期刊的综述篇均引文数、论著篇均引文数、被引半衰期之间具有低正相关关系,与期刊IF-自引率、引用半衰期和自引率具有低负相关关系。郑丽霞[6](2016)以汤森路透社JCR中收录到SCI期刊的8个评价指标数据信息为基础,运用因子分析法对期刊的学术地位进行综合评价,得到影响期刊学术地位的因子及其相应权重。并与常用的影响因子评价法进行比较,较好地消除了单一指标评价引起的评价失真等问题。类似地,郭建校等[7]以能代表科研水平的19个评价指标数据为来源,利用因子分析法对自然科学类学科进行全面阐述。
2 因子分析原理
2.1 模型的提出
因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法,它的基本思想是将观测变量进行分类,将相关性较高的分在同一类,那么每一类变量实际上就代表了一个基本结构即公共因子。因子分析试图以最少个数的公共因子来描述原来观测变量的每一分量。
2.2 因子分析模型
2.3 因子分析步骤
①将原始数据标准化,消除变量间在数量级和量纲上的不同。
②求标准化矩阵的相关矩阵。
③计算方差共享率与累计方差贡献率、相关矩阵的特征值和特征向量。
④确定因子:取累计贡献率大于80%的前m个因子。
⑤若所得的因子无法确定或其意义不明显时候进行因子旋转。
⑥用原指标的线性组合来求各因子得分。
⑦计算综合得分并排序。
⑧结果分析。
3 R软件实现过程及结果分析
3.1 評价指标的选取
笔者所选用的数据来自中国统计年鉴2014,从中选取了教育、城市、文化科技等与各地区科技发展能力由较大关系的8各指标值,这些指标分别为地面观测站(X1)、地震总台数(X2)、技术市场成交额(X3)、国内专利申请授予量(X4)、工业企业数(X5)、普通高等学校数(X6)、城区面积(X7)以及服务站(X8)等。见表1。
3.2 因子分析
利用R软件进行因子分析。为了消除原始数据的数量级和量纲的差异,首先将数据进行标准化处理,处理方法是计算原始数据矩阵的相关矩阵,再进行后续的步骤。同时,还需要对数据的适应性进行检验,检验结果见表2。
表中KMO值为0.6256,介于0.6至0.7之间说明样本充足,巴特利特(Bartlett)球形检验的显著性为0.000,遠小于0.01。两种结果均表明原始数据适合进行因子分析,进而可以得出各指标的特征值和方差累计贡献率,如表3所示。
根据特征值大于1和前m个方差累计贡献率大于80%的标准,如表3选取3个因子,累计贡献率达84.95%。由于公共因子在原始变量上的载荷值不太好解释,故利用方差最大化正交进行因子旋转,旋转前后的特征值和方差累计贡献率如表3所示,可以看出旋转前后累计方差贡献率没有变化。旋转前后的载荷矩阵见表4,可以看出载荷矩阵向两级明显分化了。公共因子Factor1在X4(国内专利申请授予)、X5(工业企业数)、X6(普通高等学校)、X7(城区面积)、X8(服务站数)上的载荷值都很大,可视为反映人们教育水平和接受社会服务的经济文化因子,记为F1而且这个因子的方差贡献率也比较大,为47.22%,对各地区的科技发展水平与科技地位有很大的影响;Factor2在X1(地面观测台数)、X2(地震总台数)上的载荷值都很大,可直接视为技术投入因子,记为F2这个因子的方差贡献率较大为22.58%;Factor3仅在X3(技术市场成交额)上有很大的载荷,可直接视为技术产出因子,记为F3,这个因子的方差贡献率为15.15%,所占比重也比较小。最后可由表5计算出各地区的综合得分F并进行排名F表达式为F=(0.4722*F1+0.2258*F2+0.1515*F3)/0.8495,如计算北京的综合得分则计算过程为F=(0.4722*0.04536-0.2258*0.05851+0.1515*4.9499)/0.8495=0.89。由此可以得出经济文化因子、技术投入因子、技术产出因子综合评价值和排名情况(见表5),进而画出因子得分图(如图1)和信息重叠图(如图2)。
3.3 结果分析
在图1中可以看出,F1得分最高的前4个省依次为江苏、广东、浙江、山东,且江苏和广东明显高于其他,这几就说明就人们教育普及程度和接受社会服务程度等经济文化水平相对要高一些,且江苏和广东等沿海地区的经济文化水平要远高于其他省;湖北、四川、福建等相对较小些;而青海、西藏、云南甘肃等西北和西南地区在经济文化水平上处于最末,这符合实际情况。天津、上海、重庆、西藏、云南等在因子F2上得分较高,反映了这几个省市的技术投入程度较高;河北、吉林、山西、河南等的技术投入因子相对较小;得分较低的是甘肃黑龙江等,这说明甘肃、黑龙江等省没有很注重对技术的投入水平,可能重点放在了其他方面。总括上述分析可以看出,各地区的科技水平与其教育普及程度和经济水平、技术投入程度以及技术产出水平密切相关,特别是各地区的经济文化发展水平。相对来说,沿海省市经济文化发展水平较高相应科技发展水平也较高,中部地区其次,偏远地区如西北西南等由于地理原因和国家政策原因等经济发展与沿海及中不有很大的差距因此其科技水平也相应的不高,远落后于平均水平。
在图2信息重叠图中可以看出,各个变量在广东、江苏、山东、北京等地区反映强烈,说明这些地区的各个指标都较高,广东和江苏尤其在工业企业、国内专利申请授予量特别强烈,反映这两个省在这两方面的投入尤其多。
4 结语
本文以中国统计年鉴2014的数据为基础,先选取了教育、城市、文化科技等与各地区科技发展能力有较大关系的8项指标对全国31个省和地区的科技能力进行综合评价,利用KMO和巴特利特检验方法对数据的适应性进行检验,结果显示KMO值为0.6256,介于0.6至0.7之间说明样本充足,巴特利特(Bartlett)球形检验的显著性为0.000,远小于0.01,这表明原始数据适合进行因子分析。利用R软件编程,根据特征值大小计算累计方差贡献率,前3个因子累计贡献率达84.95%。由于公共因子在原始变量上的载荷值不太好解释,故利用方差最大化正交进行因子旋转,因子旋转后的载荷矩阵向两级明显分化,其中公共因子Factor1在X4(国内专利申请授予)、X5(工业企业数)、X6(普通高等学校)、X7(城区面积)、X8(服务站数)上的载荷值都很大,可视为反映人们教育水平和接受社会服务的经济文化因子,记为F1,而且这个因子的方差贡献率也比较大,为47.22%,对各地区的科技发展水平与科技地位有很大的影响;Factor2在X1(地面观测台数)、X2(地震总台数)上的载荷值都很大,可直接视为技术投入因子,记为F2这个因子的方差贡献率较大为22.58%;Factor3仅在X3(技术市场成交额)上有很大的载荷,可直接视为技术产出因子,记为F3,这个因子的方差贡献率为15.15%,所占比重也比较小。最后计算出各地区的综合得分F并进行排名F。由此得出经济文化因子、技术投入因子、技术产出因子综合评价值和排名情况,进而画出因子得分图和信息重叠图。结果表明,江苏和广东等沿海地区的经济文化水平要远高于其他省;湖北、四川、福建等相对较小些;而青海、西藏、云南甘肃等西北和西南地区在经济文化水平上处于最末,这符合实际情况。天津、上海、重庆、西藏、云南等省市的技术投入程度较高;河北、吉林、山西、河南等的技术投入相对较小;得分较低的是甘肃黑龙江等,这说明甘肃、黑龙江等省没有很注重对技术的投入水平,可能重点放在了其他方面。总括上述分析可以看出,各地区的科技水平与其教育普及程度和经济水平、技术投入程度以及技术产出水平密切相关,特别是各地区的经济文化发展水平。相对来说,沿海省市经济文化发展水平较高,相应科技发展水平也较高,中部地区其次,偏远地区如西北西南等由于地理原因和国家政策原因等经济发展与沿海及中不有很大的差距,因此其科技水平也相应的不高,远落后于平均水平。
最后本文选取的方法可以消除指标间的相关性,并客观地给出了各指标的权重,避免人为的确定指标权重,还较好地消除了单一指标评价造成的失真,做了一个客观的综合评价。
参考文献:
[1]贺善侃.论科技创新的社会价值[J]. 科学技术哲学研究,2010,27:93-97.
[2]王汉斌,白云杰,王萍.山西煤矿安全因子分析评价[J].辽宁工程技术大学学报,2009(28):905-909.
[3]章柳云.体育学术期刊编辑专业能力的因子分析[J].北京印刷学院学报,2010(3):29-33.
[4]薛庆根.土壤学期刊特征因子与影响力、时效性关系研究 [J].情报杂志,2013(7):101-105.
[5]董建军,付中静.2011年收录的8281种期刊特征因子分析[J].科技情报开发与经济,2014(24):120-123.
[6]郑丽霞.因子分析在SCI期刊综合评价中的应用[J].农业图书情报学刊,2016(28):54-56.
[7]郭建校,王洪礼,郭龙.基于因子分析法的学科科研水平综合评价[J].科学管理研究,2009,27(I):34-37.