地区经济社会发展与高校科技投入产出关系研究
——基于主成分分析和聚类分析的评价
2010-11-02王碧云杨洪美
王碧云,杨洪美
(武汉大学教育科学学院,湖北武汉 430072)
地区经济社会发展与高校科技投入产出关系研究
——基于主成分分析和聚类分析的评价
王碧云,杨洪美
(武汉大学教育科学学院,湖北武汉 430072)
高等学校是国家知识创新体系的重要组成部分。文章运用主成分分析和聚类分析方法对我国各省、自治区、直辖市经济社会发展和高等学校科技投入和产出进行了分析,表明我国各地经济社会发展和高等学校科技投入产出呈中度相关,高等学校服务经济社会发展的意识和能力存在较大地区差异。
经济社会发展;高等学校;投入产出;主成分分析法;聚类分析法
高等学校是国家创新体系的重要组成部分,高等学校的科技活动是知识创新、发展、传播和应用的过程,其科技创新对区域社会经济发展发挥着重要的科技支撑作用。本文旨在运用主成分分析法和聚类分析方法,对我国各地区经济社会发展和该地区高等学校科技投入和产出进行分析,并对地区经济社会发展与高等学校科技活动相关关系进行分析,为相关部门实现科学管理提供有效的决策依据。
根据权重确定方法的不同,对于经济社会发展和高校科技活动的评价,分为主观赋权法和客观赋权法两类。主观赋权法主要有层次分析法、德尔菲法等,多是采用综合咨询评分的定性方法,受到人为因素影响较大,效率也较低。客观赋权法主要有主成分分析法、因子分析法等,评价过程中主要运用相关统计分析软件,根据各指标间的相关关系或各项指标值的变异程度来确定权数,避免了人为因素带来的偏差,能如实反映和精确分析评价客体的状况,因而得到了广泛的运用。
一、主成分分析法在地区社会经济发展和高等学校科技活动评价中的应用
人类社会活动是一个庞大的系统。对于它们的评价是一个复杂的系统工程。由于它们不仅涉及的变量众多,而且各变量之间还可能存在着错综复杂的相关关系,这时最好能从中提取少数的综合变量,使其能够包含原变量提供的大部分信息,还要求这些变量尽可能地彼此不相关。主成分分析法就是为解决这一问题而提出的统计分析方法。它是通过降维方法将多个观测变量转换为少数几个不相关的综合指标,得出原来变量的线性组合,以便于利用主成分描述数据集内部结构。
其中 Ai是综合因子 Fi的权数,它是根据 Fi的贡献率确定的,即 Fi的方差占全部总方差的比重是确定的。
(一)主成分分析法的基本步骤
主成分分析法的步骤如下:
(3)求相关矩阵 R的特征根λi(i=1,2,…,m),将其由大到小排列。
按预定的累积贡献率,通常累积贡献率达到85%以上为宜,确定主成分个数p(p≤m),求出λi(i=1,2,…,p)对应的贡献率、累积贡献率和特征向量。
(4)求各主成分zi与标准化指标x*j对应的系数关系。
(5)求各例样品在p个主成分的得分 z1,z2,
…,zp。
(6)求各样品综合得分Z,并排列名次。[1]
以上步骤均可通过SPSS13.0 for Windows XP等软件完成。
(二)地区社会经济发展主成分分析评价
本研究中,使用 SPSS13.0 for Windows XP软件运用主成分分析法,根据《中华人民共和国国民经济和社会发展第十一个五年规划纲要》中《“十一五”时期经济社会发展的主要指标》,选取了 GDP总值、GDP增长速度、人均 GDP、第一产业增加值、第二产业增加值、第二产业增加值占GDP比重、第二产业增长速度、成本费用利润率、工业污染治理完成投资、第三产业增加值、第三产业增加值占 GDP比重、第三产业增长速度、三产业从业人员占社会劳力比例、一般预算收入、税收占一般预算收入的比重、人均一般预算收入、在岗职工年平均工资、城镇居民人均收入、农村居民人均收入、全社会固定资产投资总额、外贸出口额、社会消费品零售总额、每十万人口高等学校平均在校生数、大专及以上人口数、城镇人口占比、全社会就业人口占比、每千人口卫生人员数等作为地区经济社会发展综合评价的主要指标。研究数据来自《中国统计年鉴-2009》[2],由于后续对地区高等学校科技投入与产出的分析中西藏自治区数据不完整,本处对西藏地区经济社会发展水平不作分析,以求前后研究向本一致。
从《中国统计年鉴-2009》获取或经处理的全国各地区2008年经济社会发展数据,各个度量指标并不统一,有元、亿元和比率等等,在SPSS13.0中输入数据后,先对各个指标进行标准化处理,再利用SPSS13.0对数据进行主成分分析,得到了相关系数矩阵(R=XTX,具体略),取R的特征值≥1,使用主成分按累计贡献率≥85%提取主成分,结果列于表1,提取的主成分个数为5个。经过方差最大化旋转得到主成分载荷表见表2。
表1 主成分贡献率及累计贡献率表
从表2可以看出,X3,X11,X13,X16,X17,X18,X19,X23,X24,X26在 F1上有较大的载荷因子,即F1反映了经济效率、经济效益和人民生活水平情况;X1,X4,X5,X9,X10,X14,X20,X21,X21,X27在F2上有较大的载荷因子,即 F2反映了经济发展规模、结构和人口素质;X2,X7,X12在 F3上有较大的载荷因子,即 F3反映了经济发展速度;X25在F4上有较大的载荷因子,即 F4反映了社会就业情况;而X6,X8,X15在每个主成份的载荷因子相对来说都不太大,说明目前我国产业结构发展水平还较低。5个主成份从5不同的方面刻划了地区经济社会发展水平,其累计贡献率达86.92%。对5个主成份计算因子得分,计算结果列于表3,为综合评价各地区经济社会发展水平,以主成份的贡献率为权数求加权均值得到综合得分F:
(三)各地区高等学校科技投入产出主成分分析评价
高等学校作为知识创新体系的重要组成部分,其科技创新已成为经济社会发展的重要推动力量。本研究在对各地区高等学校科技投入产出进行评价时,遵循评价指标构建全面性、一致性、连贯性、科学性原则,采用原国家教委科技司制定的高等学校科技统计指标体系[3],较好地反映了高等学校在科技活动投入、活动产出诸方面的性质、特点和规律,其基本内容和分类见如表4。[4]
本研究数据均选自中华人民共和国教育部科学技术司1999-2007年各年出版的《高等学校科技统计资料汇编》,使用SPSS13.0 for Windows XP软件运用主成分分析方法对各地区高等学校科技投入和产出进行分析,得出评价结果见表5、表6。
表2 主成分载荷表
表3 我国30个省、市、自治区经济社会发展水平综合评价表
表4 高等学校科技投入产出指标
从表5可以看出,就科技投入而言,北京、上海、江苏、湖北、辽宁、广东、浙江、四川、陕西、山东、黑龙江位列第一方阵,浙江省稳步上升,由1999年第11位上升至2004年第7位,陕西省则略有下降,由1999年至2005年的第6位降至2007年第9位,其他省市位次相对稳定。
从表6可以看出,就产出而言,北京、上海、江苏、湖北、山东、辽宁、陕西、浙江、河南、吉林、广东位列第一方阵,河南、吉林两省进步较大。
二、地区社会经济发展和高等学校科技活动的聚类分析
根据表3、表5、表6,整理出各地社会经济及高等学校科技活动排名表,见表7。
根据表中数据,使用 SPSS13.0运算出各地社会经济发展水平与高等学校科技活动相关系数矩阵见表8。
结果表明,各地经济发展水平与高等学校科技投入及产出水平呈中度相关,相关系数r大于0.5接近0.8,而高等学校科技投入与产出呈高度相关,相关系数 r高达0.976,接近于1。这一方面说明,我国各地的经济社会发展属投资推动型而非科技进步型;另一方面也说明我国高等学校还没放下身价走出象牙塔,服务地方经济发展意识有待增强,科技成果转化为生产力水平较低,高校科技进步对经济社会进步的推动作用有待进一步发挥。
表5 1999-2007年各省、自治区、直辖市高等学校科技投入评价
由于我国地区经济社会发展水平的不平衡,本研究拟运用聚类分析方法对各地经济社会发展水平与高等学校科技投入和产出作进一步分析。
(一)聚类分析的基本步骤
聚类分析是对样品或变量进行分类的一种多元统计方法,目的在于将相似的事物归类。通过聚类,将某个对象集划分为若干组,使得同一组内的数据对象具有较高的相似度,而不同组中的数据对象是不相似的。相似或不相似的定义基于属性变量的价值确定,一般采用各对象间的距离来表示。系统聚类的步骤分为5步:
(1)定义样品之间的距离以及类与类之间的距离。
(2)令每个观测记录各自成为一个类别。
(3)计算类与类之间的距离,并将距离最近的两个类合并为一类,类的数目减1。
表6 1999-2007年各省、自治区、直辖市高等学校科技产出综合评价
表7 各省、自治区、直辖市社会经济及高等学校科技活动得分及排名
表8 各地社会经济发展水平与高校科技活动相关矩阵
(4)如果当前的类的数目大于 1,转到第(3)步。
(5)结束聚类过程。[5]
使用SPSS13.0软件,可以实现聚类过程。
(二)地区社会经济发展和高等学校科技活动的聚类实现
基于表格7中各省、自治区、直辖市社会经济及高等学校科技活动得分,使用SPSS13.0运用聚类分析法将全国除西藏外30个省、自治区、直辖市经济社会发展和高等学校科技投入产出情况划分为4类,见表9。
表9 各省、自治区、直辖市经济社会发展及高校科活动聚类
由表9可以看出,对经济社会发展水平与高校科技活动聚类处理结果表明:北京为1类,经济社会发展水平及高校科技投入产出水平最高;上海、江苏为2类,经济社会发展水平高,高校科技投入产出水平次高;广东、天津、浙江、山东、河北、辽宁、吉林、黑龙江、安徽、河南、湖北、湖南、四川、陕西为3类,其中,广东、天津、浙江、河北、辽宁、吉林、黑龙江、安徽、湖南、四川、陕西投入产出相适应,山东、河南、湖北属低投入高产出型;内蒙古、福建、江西、广西、重庆、山西、云南、宁夏、海南、贵州、新疆、青海、甘肃为 4类,其中,内蒙古、福建、江西、广西、重庆经济社会发展水平属3类,但高等学校科技投入及产出均较低,海南、山西分属东、中部省份,经济社会发展水平及高校科技投入产出水平均较低,贵州、云南、甘肃、青海、宁夏、新疆的西部省份,经济社会发展水平及高校科技投入产出水平均较低。
三、结束语
经济社会的发展离不开科技进步,高等学校作为国家创新体系的重要组成部分,理应担当起科技创新的重任,然而,通过本文的主成分分析和聚类分析发现,我国经济社会的发展和高等学校的科技活动进程中度相关,说明高等学校服务地方经济发展的职能远未得到充分发挥。另一方面,我国经济社会的发展存在着较大的地区差异,东部地区经济社会发展水平较高,高等学校的科技投入和产出水平也较高;中西部地区虽有部分省份如湖北、陕西高等学校科技投入和产出水平较高,但两省的经济社会发展水平与高等学校投入产出水平不相称。而中西部其他省份对经济社会发展水平及高校科技投入产出均处于较低水平。只有真正树立科学技术是第一生产力的观念,力促经济发展方式的转型,着力提高中西部地区高等学校科技投入和产出水平,强化高等学校服务经济发展的意识和能力,才能促进我国经济社会又好又快和谐发展。
[1]张优智.基于主成分分析的陕西科技竞争力实证研究[J].大连理工大学学报(社会科学版),2009(1):79-84.
[2]中华人民共和国国家统计局.中国统计年鉴-2009[Z].北京:中国统计出版社,2009.
[3]国家教委科技司.高等学校科技统计指南[M].北京:科学出版社,1994.
[4]中华人民共和国教育部科学技术司.高等学校科技统计资料汇编(1999-2007各年).[M].北京:高等教育出版社.
[5]杜强,贾丽艳.SPSS统计分析从入门到精通[M].北京:人民邮电出版社,2009.
(责任编辑:杜红琴)
G640;F205
A
1008-2603(2010)06-0118-06
2010-08-20
教育部人文社会科学研究2007年度一般项目“提升中国大学创新力的研究”(项目编号:07JA880030)成果之一。
王碧云,男,武汉大学教育科学学院副教授,博士研究生。