基于时序差异的新老国家高新区动态比较
2015-06-01王玉茹
薛 强,王 帅,芮 雪,王玉茹
(1.北京航空航天大学 经济管理学院,北京 100191;2.科学技术部 高新技术发展及产业化司,北京 100862)
基于时序差异的新老国家高新区动态比较
薛 强1 2,王 帅1,芮 雪1,王玉茹1
(1.北京航空航天大学 经济管理学院,北京 100191;2.科学技术部 高新技术发展及产业化司,北京 100862)
1988年后我国分批建立了114家国家高新区,总体规模和发展质量不断提高,但由于批建时间、政策扶持等方面的差异,国家高新区的发展水平不尽相同。2009—2011年,国务院相对集中批复了34家高新区升级为国家高新区,数目较多,对国家高新区整体水平影响显著。运用时序立体数据表主成分分析的原理及聚类分析方法,针对2008—2012年五年的时间跨度,比较了新增34家高新区和2008年以前建立的54家高新区的动态发展轨迹。研究发现,相对于老高新区,新高新区整体实力较弱,尤其是科技创新方面。建议国家对新高新区分类指导,出台有针对性的政策措施。
高新区比较; 时序差异; 主成分分析; 动态轨迹; 聚类分析
1988年5月,中共中央、国务院批准在北京中关村建立北京市新技术产业开发试验区。20世纪90年代,国务院在智力产业比较密集的武汉、南京、沈阳、长春、广州、重庆、西安、兰州、上海等城市建立了高新技术产业开发区,分两个批次共批复52家。2009年以来,国务院再一次较大规模批准升级了60家新的国家级高新区。截至2014年6月,国家级高新区总数已达到114家。二十几年间,国家高新区规模不断扩大,对区域发展的辐射作用不断增强,已经成为我国高新技术产业发展的重要载体。
在高新区发展趋势的评估方面,黄宁燕、梁战平提出将聚类分析法实际应用于评价研究我国高新区的发展状况及趋势[1]。韩伯棠、方伟、王栋从地理位置、发展方向、产业结构、管理模式等4个方面分别论述了经济技术开发区和高新技术产业开发区的趋同趋势[2]。王方2013年通过考察两类政策——高新区整体建设、升级和各类载体、机构建设,探析我国高新区政策变迁历程及发展趋势[3]。在高新区分类的相关研究方面,蔡龙海、侯玲娟等从经济发展速度和高新区的研发投入两个角度,运用主成分分析和聚类分析相结合的方法对中国53 个国家级高科技园区进行了定量研究[4]。汪海凤、赵英运用因子聚类分析方法,对我国国家高新区2007年和2008年的综合发展水平进行了统计分析[5]。
综合相关研究,对于高新区整体发展水平的研究比较广泛,在发展趋势的研究方面多应用定性分析和专家法,对新增高新区和早期高新区的比较研究较为缺乏。为更好地反映国家高新区的发展轨迹,分析新增高新区对整体实力的影响,本文采用主成分分析和聚类分析的定量分析方法,利用时序立体数据表进行动态的实证研究。对未来高新区发展之路给出一定的建议,以期高新区更好更快发展壮大,利用其辐射影响拉动周边乃至全国的经济水平。
一、分析方法
(一) 主成分分析
本文采取一种数学降维的主成分分析方法[6],在原始变量较多并具有较强相关性的条件下,提取几个综合变量代替众多的原始变量,使这些综合变量能尽可能地包含原变量的信息,且新的综合变量之间互不相关。主成分分析将P个观测变量综合成为P个新的变量(综合变量),即
Fj=aj1x1+aj2x2+…+ajpxpj=1,2,…,P。
要求模型满足以下条件:
(1)Fi,Fj互不相关(i≠j,i,j=1,2,…,P);
(2)F1的方差大于F2的方差大于F3的方差,依次类推;
(3)ak12+ak22+…+akp2=1k=1,2,…P.,
称F1为第一主成分,F2为第二主成分,依此类推,共有P个主成分。这里aij称为主成分系数。
(二 )聚类分析[7]
本文采取的聚类方法为系统聚类法,其主要思想是:开始将n个样品各自作为一类,并规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并为一个新类,计算新类与其他类的距离;重复进行两个最近类的合并,每次减少一类直到所有的样品合并为一类。
距离的定义采用欧氏距离,方法采取最短聚类法。具体步骤如下:
(1) 计算n个样品的距离矩阵D(0),它是一个对称矩阵。开始的每个样品自成一类,这时Dij=dij。
(2) 找出D(0)中非对角最小元素,记为Dpq,将Gp和Gq合并成一个新类,记为Gr。
(3) 计算新类和其他类的距离,有
将D(0)中p,q行和p,q列用上面公式合并成一个新行新列,得到矩阵D(1)。
(4) 依次重复(2)(3)两步,直到全部合并成一类。
二、主成分分析及聚类分析结果
(一)指标和样本点的选取
在指标的选取中,参考现行的国家高新区统计指标,结合相关文献研究和实证分析,用总收入、工业增加值、产品销售收入三个指标反映高新区的经济规模;用创汇总额反映高新区的经济外向度;用技术收入反映高新区技术推动经济的能力;用科技活动人员、科技活动经费支出、R&D经费支出反映其科技发展水平,共选取了8个反映高新区发展水平的指标,如表1。依据《中国火炬统计年鉴》中有关54个国家高新区2008—2012年的数据,按需要对数据进行整理。由于中关村科技园区相关数据在统计学意义上的极大影响,引入本框架将会对其他数据产生干扰,因此剔除中关村这一样本点,最终用于提取主成分的样本点为53个国家高新区。
表1 变量名称表
主成分分析样本数为87家国家高新区,除上述53家早期高新区外,新增34家高新区如下:唐山、齐齐哈尔、绍兴、新余、安阳、江门、白银、燕郊、上海紫竹、蚌埠、济宁、宜昌、东莞、青海、营口、泰州、芜湖、烟台、湘潭、柳州、银川、辽阳、昆山、泉州、临沂、益阳、自贡、昌吉、延吉、江阴、景德镇、南阳、肇庆、渭南。
(二)提取主成分
第一主成分F1与原始变量总收入、工业增加值、产品销售收入和创汇总额有较高的相关性,它反映了高新区发展的规模水平和经济外向度;第二主成分F2与表示科技力量要素中的技术收入、科技活动人员数、科技活动经费支出、R&D经费支出有较高的相关性,反映的是高新区发展的科技创新水平。因此将F1和F2分别命名为“规模和外向度”和“科技创新水平”。
本研究提取了前两个主成分进行分析,计算结果是,累计贡献率接近于88%[8],对原始信息的保留程度超过了85%,能够较好地保留原始信息。
(三)因子得分
表2 成分得分系数矩阵
根据表2中的成分得分系数矩阵,得到主成分的因子得分表达式为:
F1=0.211x1+0.180x2+0.550x3-0.440x4+0.336xs-0.063x6+0.062x7-0.040x8,
F2=-0.001x1+0.021x2-0.420x3+0.638x4-0.141xs+0.284x6+0.155x7+0.256x8。
三、新老高新区发展比较
(一)新升级高新区对2012年国家高新区总体发展水平的影响
按照上述表达式,带入标准化后的2008—2012年所有高新区的8个指标数据进行计算,将各年的因子得分分别求出平均值,绘制成总体轨迹如图1。图1中FAC1和FAC2分别对应表2中的成分1和成分2。
如图1所示,2008—2011年,国家高新区的总体发展呈上升趋势,在规模和外向度、科技创新水平两个维度上均有显著提高。然而,2012年的高新区总体水平却偏离了趋势曲线,在两个主成分上均有明显回落。
(二)2012年时点新老高新区发展水平的对比
为进一步证明2012年高新区整体实力下降是由于新增高新区发展状况较为落后,将2012年的87家高新区(去除北京中关村)分为两组,第一组为2008年之前建立的53家高新区,图2中用“2012早期”表示;第二组为2012年新建立的34家高新区,图中用“2012新增”表示。重新绘制总体轨迹如图2。
图2显示,2012年新增高新区的规模和外向度及科技创新水平均较为落后,低于2008年国家高新区的平均水平。除去新增高新区后,观察从2008年至2012年的早期53家高新区,可以得出结论:早期的53家高新区发展趋势良好,稳步上升。新增的高新区整体实力较弱,和原有高新区相比具有较大差距。
(三)2012年新老高新区各指标差异
表3 2012年新老高新区平均指标比较
由表3可知,新高新区所选取的8个指标和老高新区均有较大差距,尤其是科技创新指标,如技术收入,新升级高新区的平均水平不到早期建立高新区的2%。
(四)87家高新区的聚类分析
采用欧氏距离和最短距离法进行系统聚类得到结果如下:
第一类:上海;
第二类:武汉、广州、深圳、西安;
第三类:天津、长春、南京、无锡、成都;
第四类:苏州、长沙、佛山;
第五类:石家庄、太原、包头、沈阳、大连、鞍山、吉林、哈尔滨、大庆、常州、杭州、合肥、厦门、济南、青岛、淄博、潍坊、济宁、郑州、襄樊、宜昌、珠海、中山;
第六类:保定、辽阳、泰州、昆山、江阴、宁波、福州、南昌、威海、洛阳、株洲、湘潭、惠州、南宁、柳州、重庆、绵阳、贵阳、昆明、宝鸡、兰州;
第七类:唐山、燕郊、延吉、齐齐哈尔、上海紫竹、绍兴、蚌埠、芜湖、泉州、烟台、南阳、安阳、益阳、江门、东莞、桂林、海南、自贡、杨凌、渭南、青海、乌鲁木齐、昌吉。
以上从第一类至第七类,综合经济规模和科技水平依次递减。根据系统聚类结果可知,新升级高新区多数聚集在第六类和第七类。其中,辽阳、泰州、昆山、江阴、湘潭、惠州、柳州分类结果为第六类;唐山、燕郊、延吉、齐齐哈尔、上海紫竹等分类结果为第七类;宜昌、济宁两家新升级的高新区进入了第五类(说明:营口、景德镇、新余、临沂、肇庆、白银、银川7家高新区由于数据不完全,无法参与聚类分析过程)。
四、总结和展望
综合以上分析,关于我国高新区的现状与未来出路,总结并展望如下。
第一,新增国家高新区壮大了高新区队伍,但对整体发展水平影响明显。经研究分析可知,高新区平均发展水平下降的原因是新增高新区的平均实力与早期的54家高新区差距较大。先批准建立的高新区经济基础较为稳固,对外开放程度较高,科技创新水平处于全国上游。后期建立的高新区是在早期高新区发展取得一定成果后,受到辐射作用影响被国家批准的。
第二,根据聚类分析结果,新升级高新区多数聚集在后两类,经济基础较为薄弱,科技创新水平不高。在新升级高新区中,仅有宜昌、济宁两家高新区进入了第五类。通过对指标和因子得分的分析,这两家高新区的发展主要依赖于规模的推动,技术收入指标低于新升级高新区平均水平,科技创新的驱动作用偏弱。
第三,在评价高新区整体发展水平时,将新增高新区和早期高新区分开研究是有必要的。然而由于新升级高新区发展时间较短,没有完整的时序立体数据供分析,需待新升级高新区发展时间延长后再行研究。另一方面,在指标体系构建过程中如何选择更加合适的、可统计的指标反映科技创新情况,在下一步动态比较研究中可以就这些方面进行改进。
第四,国家需要加强对国家级高新区的分类指导,特别是对新升级高新区应出台针对性的政策措施。20世纪90年代批建的国家高新区,经历了近20年的特别扶持政策,激励作用和效果非常明显。而随着2008年新的企业所得税法实施后,区域性政策逐步减少,新增国家高新区无法享受特殊的优惠政策。结合相关研究[9]分析,国家层面需要制订差异化的扶持政策,引导地方采取符合实际需要的激励措施。
[1] 黄宁燕, 梁战平. 我国高新技术产业开发区的发展状况及趋势——聚类分析评价研究?[J]. 科学学研究, 1999, 17(2):79-88.
[2] 韩伯棠, 方伟, 王栋. 高新区与经开区的趋同趋势及两区合一的管理模式研究[J]. 特区经济, 2007(4):29-31.
[3] 王方. 我国高新区政策变迁历程及发展趋势研究 ———基于中国1984-2011年高新区政策的考察[J]. 科技进步与对策, 2013, 30(12):31-36.
[4] 蔡龙海, 侯玲娟, 周泓. 中国高新区发展水平的主成分分析和聚类分析[J]. 西北工业大学学报:社会科学版, 2009, 29(4):25-30.
[5]汪海凤, 赵英. 我国国家高新区发展的因子聚类分析[J]. 数理统计与管理, 2012, 31(2):270-278.
[6]Jolliffe I T. Principal Component Analysis, Series: Springer Series in Statistics, 2nd ed.[M]. NY:Springer, 2002.
[7] 徐哲, 石晓军, 杨继平, 等. 应用统计学:经济与管理中的数据分析[M].北京:清华大学出版社, 2011.
[8]薛强,王帅,芮雪,等.基于动态主成分分析法的国家高新区评价研究[J].科学管理研究,2014(4):48-51.
[9]薛强, 赵静. 基于产业生态学的创新型产业集群培育路径分析——以32家新升级国家高新区为例[J].中国科技论坛,2014(3):67-71.
[责任编辑:靳香玲]
A Dynamic Contrast between the Old and New National Hi-Tech Industrial Development Zones on the Basis of the Time Series Difference
XUE Qiang1, 2, WANG Shuai1, RUI Xue1, WANG Yu-ru1
(1. School of Economics and Management, Beihang University, Beijing 100191, China;2. Department of High and New Technology Development and Industrialization, Ministry of Science and Technology, Beijing 100862, China)
114 national hi-tech industrial development zones have been established successively in China since 1998. Although the entire scale and development quality has been improving increasingly, the developing levels differ among those national hi-tech industrial development zones, due to the differences in the time of establishment, policy support and so on. From 2009 to 2011, the State Council of China ratified the upgrade of 34 hi-tech industrial development zones to the national level, and the large number has a significant effect on the whole level of national hi-tech zones. Applying the principle of principal component analysis and the method of cluster analysis with the cubic time series data, the paper contrasts the dynamically developing course of the 34 newly ratified and 54 previously established national hi-tech industrial development zones from 2008 to 2012. The study shows the newly ratified ones are generally poorer when compared with the old ones, especially in terms of the technological innovation. It is suggested for the country to guide the national hi-tech industrial development zones according to the different categories and put forward the relevant countermeasures.
contrast of hi-tech industrial development zones; time series difference; principal component analysis; dynamic course; cluster analysis
2015-05-18
薛强(1979-),男,辽宁沈阳人,北京航空航天大学经济管理学院2013级博士研究生,研究方向为科技管理、创新体系和现代服务业。
C 931.3
A
1004-1710(2015)05-0046-05