湖南省科技投入关联因素相关性及因果关系测度
2020-06-15谢静波黄晓林陈新胜
谢静波,黄晓林,王 辉,陈新胜
(湖南省科学技术信息研究所,湖南长沙 410001)
创新是推动一个国家和民族向前发展的重要力量,也是推动整个人类社会向前发展的重要力量[1]。科技创新作为创新的重要内涵,是提高区域生产力和竞争能力的战略支撑,科技创新能力的强弱直接影响着区域竞争能力的强弱。科技投入是衡量科技创新水平和能力的重要指标[2],增加科技投入是提升创新能力的重要手段和有效途径[3]。但是科技投入受多重因素的影响,目前我国许多地区科技研发投入比例偏低,因此如何提高科技投入成为国家以及各地日益关注的焦点。湖南属于我国中部省份,处于国家中部崛起战略规划和长江经济带战略规划的交汇区域,虽然在中部地区的优势较明显,但发展不充分、不平衡的基本省情并未从根本上改变,经济总量不大、创新能力不强的问题较突出。《湖南省“十三五”科技创新规划》也指出,湖南省科技投入严重不足,财政科技支出总量偏低、投入机制不健全,全省全社会科技投入与全国平均水平差距较大,难以推动全社会创新创业向纵深发展[4]。2018 年湖南省科技研发经费投入强度达到1.94%,但是与《湖南省“十三五”科技创新规划》提出的2.5%的发展目标仍然有较大差距[5]。2018 年12 月,《湖南创新型省份建设方案》出台,明确提出要以创新为第一动力,以科技创新为核心[6]。由此可以看出,湖南省科技创新正进入创新发展的重要战略机遇期,已经处于差距进一步拉大和实现跨越式发展的分水岭,如何调动各种经济社会因素、增加科技投入、提升区域科技创新能力已经成为湖南省区域发展的重要研究内容。
1 文献回顾
目前,对于科技投入影响因素的研究虽然较多,但多集中在企业视角和科技投入与经济增长之间的关系研究,如高管激励、盈余波动性、董事会监督、企业透明度、研发费用加计扣除政策、官员更替、银行授信等对企业研发投入的影响[7-12],而科技投入与经济增长的关系一直是研究的热点,近年的研究认为科技投入水平与经济增长之间存在均衡关系,并且经济增长对科技投入水平具有显著的单向促进作用,或者存在非对称的双向正效应,且相互之间存在稳定的脉冲响应[13-16]。
在关于科技投入影响因素的系统性研究中,于健樵[17]在国内最早开展科技投入相关因素的探讨研究;而后许治等[18]和吴辉凡等[19]利用投入产出模型从知识积累的角度分析了知识弹性系数、“R&D学习”效率、物质和劳动物理形态产出弹性系数和“干中学”学习效率与科技投入的关系;张洪阳[20]认为,经济发展水平、政府科技投入、产业结构、国际贸易、外商直接投资、知识积累及人力资本积累是影响R&D 经费投入的重要因素;谢子远等[21]通过回归分析发现市场竞争程度、企业利润水平、企业规模对高新区研发投入有正向影响,而出口规模、资产负债率则对高新区研发投入有负面影响;符洋等[22]研究发现R&D 人员数、外商投资总额、地区生产总值(GDP)、第三产业增加值等因素对加大研发投入具有显著的促进作用;詹祥等[16]发现专利产出效率对科技投入有滞后的促进作用。另外,倪志敏等[23]的研究也发现,专利申请量与科技投入存在相关关系;孙萍等[24]从财政的角度分析了产业结构变迁、城市化水平、人力资本投入、财政收入分权、财政支出分权5 个因素与财政科技投入的关系;吴先明等[25]从后发国家的视角通过检验发现,R&D 研究人员数、金融发展对后发国家研发投入具有显著的正向影响,而制造业进口和外国直接投资(FDI)净流入对后发国家研发投入具有显著的负向影响。
科技统计指标是进行科技管理的重要基础数据,而关于科技统计范畴内各个指标与科技投入的关系,除了前述的符洋等[22]、詹祥等[16]、倪志敏等[23]对其中的专利指标与科技投入的关系进行了研究之外,尚未见较系统的研究。因此,本文从科技管理的视角出发,分析科技统计范畴内各因素与科技投入的相关关系,以期为科技管理工作中制定提高科技投入的促进措施提供决策参考。
2 变量及模型选取确定
2.1 变量选取
科技统计指标数量繁多,涉及与科技相关的人力、物力、财力,投入、产出、效益、环境等多方面。本文参考前人的研究结果和笔者的工作经验,经过反复分析、对比,最终筛选了R&D 投入、GDP、R&D 人员数、科研机构数、高新技术企业数和科技成果登记数等20 个指标进行分析,并将R&D 投入作为科技投入的代表性指标。本文认为,这20 个指标基本覆盖了科技统计的主要方面,能够反映区域科技综合实力的概况。
2.2 关联度分析模型
一般的两个变量(X,Y)的关联程度可用相关系数表示。表示2 个变量间相关程度的相关系数有多种,一般的,简单的线性相关可用Pearson 相关系数表示,其计算公式如下:
式(1)中:cov(X,Y)为协方差;SX和SY为两个变量的标准差。
在本文所选取的众多变量中,也可能存在与科技投入呈非线性相关关系的变量,因此为了增加分析的可靠性,本文还计算了各个潜在关联因素(X)与科技投入(Y)的灰色关联度。灰色关联分析是在灰色系统中,根据各因素变化曲线几何形状的相似程度来判断因素之间关联程度的方法,无论变量间呈线性还是非线性相关。其计算的基本过程为:
第一步,采用极差值法对原始数据进行无纲量化处理,公式如下:
第二步,计算比较序列(X)与参考序列(Y)的绝对差值,公式如下:
第三步,计算关联系数,公式如下:
式(4)中:Δmin为两级最小差;Δmax为两级最大差;ρ为分辨系数,0<ρ<1,一般取0.5。
第四步,计算关联度,公式如下:
2.3 Granger 因果关系检验
相关系数或关联度虽然可以表明2 个变量间的关系密切程度,但是却无法对变量间的依赖性即因果关系进行判定。本文希望对科技投入关系与关联因素变量间的依赖性进行辨别,从而判定调动哪些关联因素更有利于提高科技投入。目前比较成熟的方法是进行格兰杰(Granger)因果关系检验,其计算的基本过程如下:
首先,对样本数据进行平稳性检验,或者将样本处理成去均值的成平稳时间序列,使其满足进行Granger 因果关系检验的条件。常用的方法有单位根检验、差分和协整检验。
第二步,建立有约束和无约束回归模型。有约束回归模型(u)为:
无约束回归模型(r)为:
式(6)(7)中:p和q分别为变量的最大滞后期;为常数项;为白噪声。
第三步,对2 个回归模型进行F假设检验。
假设H0:X不是引起Y变化的Granger 原因(等价于H0:
利用两个回归模型u、r的残差平方和对假设进行F检验:
式(8)中:n为样本容量。
第四步,置换变量X、Y的位置,重复上述第二、三步。
本文的原始数据来源于《湖南统计年鉴》,数据分析采用SPSS 19 软件和EView 9 软件。
3 数据处理及结果分析
3.1 湖南省科技投入关联因素统计概况
为充分扩展分析数据的时间跨度,提高分析结果的准确性,结合年鉴数据统计的实际情况,本文最终对湖南省2010—2017 年8 年间相关20 个科技统计指标因素进行了采集整理,结果如表1 所示。表1 中2010 年部分变量的统计数据缺失,此处用符号“*”标示,并用该变量2009 年和2011 年的平均数替代。
表1 2010—2017 年湖南省科技投入关联因素统计
3.2 相关性测度
本文分别从简单线性相关和灰色关联两个角度,对表1 中所有与R&D 投入相关的因素进行了相关性分析,分析这些指标与R&D 投入的关联程度。由表2 可知,在被纳入分析的19 个因素中,大部分因素与R&D 投入相关性较高,在Pearson 相关性分析中呈极显著相关或显著相关,具有统计学意义。对本文中的样本数据,Pearson 相关分析虽然能辨别出与R&D 投入不相关的因素,但是对相关因素之间的辨别度不是很高,而灰色关联分析的结果则可以将变量间的相关关系区分开来,而不论两者之间呈线性相关还是非线性相关。其中,R&D 投入与高新技术企业相关数据的相关性最高,包括新高技术企业数、高新技术企业总产值、高新技术产业增加值,表明两者之间关系最为密切;其次与专利相关数据的相关性也较高,包括申请专利数、发明专利申请数、批准专利数和发明专利批准数;另外与经济数据如GDP、R&D 项目金额的相关性也较强,而与技术市场签订合同数和科技成果登记数无显著的相关性;此外,各类专业技术人员数与R&D 投入呈不相关或呈显著负相关,这可能与近年来国务院取消大批职业资格许可和认定事项导致获得资格或认定的专业技术人员数量减少有关[26]。
表2 2010—2017 年湖南省科技投入各因素与R&D 投入相关性测度结果
3.3 Granger 因果关系测度
本文通过相关因素与R&D 投入的相关性测度分析发现,湖南省科技统计范围内多个指标与R&D 投入的关系较为密切,为进一步分析这些因素与R&D投入的作用关系,我们引入了Granger 因果关系检验。在因素选取上,与R&D 投入相关性较高的各因素中,X8、X9、X10均与高新技术企业相关,X13、X14、X15和X16均与专利相关,而R&D 项目金额由于统计原因无法获得更多的样本数据,因此最终在考虑了数据的关联性、代表性以及样本数据可获取性的基础上,本文选取了GDP(X1)、高新技术企业数(X8)和申请专利数(X13)3 个因素与R&D 投入(Y)进行进一步的Granger 因果关系检验。由于Granger 因果关系检验要求样本数据为平稳的时间序列,为提高检验结果的准确性,我们尽可能地延长时间序列,补充了2000—2009 年湖南省R&D 投入、GDP、高新技术企业数和专利申请数的统计数据(如表3),最终使用2000—2017 年的统计数据进行分析。
表3 Granger 因果关系检验中补充的2000—2009 年有关变量数据统计
由表1 和表3 可知,Granger 因果关系检验的4个变量的样本数据为明显的上升型非平稳时间序列,因而有必要进行适当转换并通过平稳性检验,使其满足Granger 因果关系检验的前提条件。本文通过对样本数据取自然对数得到转换数据LNY、LNX1、LNX8和LNX13,并对数据进行ADF 单位根检验,以观察其平稳性。根据检验结果,对部分数据进行了一阶差分后的再检验。由表4 可知,拒绝“存在单位根”的原假设,证明LNY、LNX1、LNX8为平稳的时间序列;LNX13原始数据序列不平稳,经过1 次差分后达到在5%显著水平下的平稳,为一阶单整序列;而LNY经过一阶差分之后ADF 检验值在10%显著水平临界值以下,可以认为仍是平稳的时间序列。
表4 2000—2017 年湖南省R&D 投入与部分关联因素的ADF 检验结果
同阶单整且具有协整关系的两个非平稳序列也可进行Granger 因果关系检验。本文对LNY和LNX13进行Engle-Granger 两步法协整检验但结果不通过,因此无法采用LNY和LNX13,只能采用差分后的ΔLNY和ΔLNX13进行因果关系检验,从而间接分析LNY和LNX13之间的关系。
由于在Granger 因果关系检验中得到的P值较大,为了有效区分检验结果,本文在10%显著水平下进行分析。由表5 可知:(1)在滞后1~3 期时R&D 投入不是GDP 的Granger 原因,而在滞后1~2期时GDP 是R&D 投入的Granger 原因,当滞后3 期时GDP 作为R&D 投入的Granger 原因已不显著,可见湖南省GDP 的增长变化会单向引起R&D 投入的变化;(2)在滞后1~3 期时R&D 投入一直是高新技术企业数的Granger 原因,而高新技术企业数并不是R&D 投入的Granger 原因,可见湖南省R&D投入与高新技术企业数量之间存在较为显著的单向Granger 因果联动关系,R&D 投入增加会刺激高新技术企业数量的增长;(3)在滞后1~3 期时R&D投入与申请专利数的Granger 因果关系检验结果并不显著,直到滞后4 期时才明确R&D 投入是申请专利数的Granger 原因,而申请专利数不是R&D 投入的Granger 原因,这可能是由于经过一阶差分后用Y和X13的增量来替代进行检验,样本数据已损失了较多的信息所致,可见湖南省R&D 投入增加对专利数量增长也存在一定的单向刺激作用。
表5 2000—2017 年湖南省R&D 投入与部分关联因素的因果关系检验结果
4 结论
本文通过相关性分析和Granger 因果关系检验,对比分析了湖南省科技统计口径内的多个因素与R&D 投入的关系,通过分析发现,在众多的科技统计范畴内的因素中,大部分因素与R&D 投入存在强弱程度不一的正相关性,其中与R&D 投入关系较密切的有高新技术企业数、专利申请与授权数、GDP和R&D 项目金额等,高新技术企业数量与R&D 投入的相关性最高;而在对R&D 投入与其关系较密切因素间的相互影响关系分析中发现,在短期内,湖南省的经济增长促进了省内R&D 投入增加,而R&D 投入的增加又会进一步催化省内高新技术企业的萌生,并刺激研发主体专利成果的产出,但这种作用关系是单向的,反向的促进作用并不明显。R&D 投入处于经济增长与企业成长、研发产出之间,可以理解为,从短期效应上来看,湖南省的R&D 投入是将经济动力转化为企业成长动力和研发产出动力的中介。
5 对策建议
综上分析,本文对湖南省增加R&D 投入、提升区域科技创新能力提出如下对策建议:
(1)稳定经济稳增长。经济增长对R&D 投入的刺激作用直接而明显,稳定的经济环境是研发投入资金来源的重要保证。要鼓励企业开展研发活动,将经济收益适度地用于研发投入,提高研发支出在企业成本中的占比,促进湖南省经济活动和研发活动主体的良性发展。
(2)提高R&D 投入的转化水平。R&D 投入作为经济动力转化为企业成长动力和研发产出动力的重要中介,R&D 投入转化水平提高意味着更好的企业成长条件和更多的科技成果。要引导R&D 资金投入到经济社会效益好、潜力大的主导产业链,重点关注《湖南省“十三五”科技创新规划》中十大领域的产业技术创新链;研发主体要选择与自身能力相适宜的研发任务进行攻关,尽可能高效地取得科学或技术上的进步;合理控制基础研究和应用研究的比例,使原创性理论和应用性技术相辅相成、相得益彰。
(3)合理搭配科技政策。相对于经济增长对科技投入促进作用的快速直接,科技投入对经济增长的促进作用往往具有延时性[27],因此湖南省在制定科技政策时,既需要制定短期的阶段性政策来引导经济收益用于研发、刺激R&D 投入的增长,也需要制定较为长远的持续性政策来促进科技成果转移转化,使R&D 投入最终转化为经济社会效益。