APP下载

基于工具变量法分析科研人员素养对科研创新产出纯技术效率的影响

2019-08-15任红松李朝晖陈宝峰郭文超

新疆农业科学 2019年5期
关键词:投入产出科研人员变量

任红松,张 琼,王 芳,赵 龙,李朝晖,陈宝峰,郭文超

(1.中国农业大学经济管理学院,北京 100083;2. 新疆农业科学院吐鲁番农业科学研究所,新疆吐鲁番 838000;

3.新疆农业科学院农业经济与科技信息研究所,乌鲁木齐 830091;4.新疆农业科学院微生物应用研究所,乌鲁木齐 830091)

0 引 言

【研究意义】科研素养是一个可以较为准确描述科研人员的科研素质,能力的概念。科研素养不仅可以对科研人员的科研投入产生影响,诸如科研人员投入的精力、经费、获得的科研平台;还可以对科研人员的科研产出,诸如论文、专利、著作等产生影响。有研究指出了科研素养可以影响到科研创新的投入产出效率。分析科研人员素养对科研创新影响对于提升科研人员科研效率有实际意义。研究使用投入产出的纯技术效率作为被解释的那个变量。这主要是因为在关于投入产出效率的问题上有综合效率、规模效率、纯技术效率,而只有纯技术效率是无关规模的"纯效率"的代表指标,更能体现出效率的一般性。研究科研素养对科研人员的投入产出纯技术效率进行影响,找出影响的机理,并且理清科研素养对于科研效率的影响路径。【前人研究进展】关于评价科研人员科研素养的指标,Durant认为科研素养有三层含义:首先是科学的内容(即科学知识);科学知识产生过程的重要性,也就是"科学方法";科研过程中需要遵守的伦理道德[1,2]。科研素养是在经过后天教育培养之后形成的科研过程中稳定表现出的基本品质[2]。有些研究把科研素养等同于科研能力,指的是科学研究人员运用科学方法顺利完成科研活动所需要的身心条件。基于此,提出科研素养中应包含科研理论素养、科研能力素养、科研道德素养[3]。从科研素养的研究理论层面来说,加涅认为,学习者通过学习,最终习得了某种或者某些"性能"(capabilities),可以划分为五类,也就是五种学习结果[4]。在此基础上,可以提出基本的科研素养的指标,主要可以划分为四个方面:第一个方面,科研基础;第二个方面,个人能力;第三个方面,思维风格;科研修养[5]。科研素养对于科研投入、科研产出以及科研效率的影响。从环境因素、政策因素等多个角度研究对科研产出的影响。有的采用采用灰色关联分析模型,以江苏高校为例对科研经费与科研产出的关联度进行了测算,研究结果表明,企业委托经费和政府下拨经费与科研成果产出的关联度明显大于其他投入转入经费与科研成果的关联度。梁文艳等[7](2014)研究表明,科研管理和资源配置是制约科研生产的主要因素;所在区域科技进步对大学科研生产效率存在显著影响,但经济发展水平和集群效应这两个变量影响并不显著。戴万亮等[8](2017)从政策支持、市场导向角度,运用DEA-Tobit模型对高校科研效率影响进行分析,结果表明政府支持不足及高校科研的市场导向性不足是导致高校科研效率较低的主要原因[7]。另外,很多学者从个体因素出发对研究人员科研产出进行分析,但是对科研产出的衡量和对影响因素的具体认识上却不尽相同。性别、本科生源校、学科差异为基本影响因素,对比分析了博士研究生科研产出水平。研究发现,影响研究人员国际科研产出的因素包括个体层面的自我效能感和结果预期因素以及组织环境层面因素。科研素养如何影响科研投入产出效率。在这个方面的研究目前还有待挖掘。第一类就是的方法就是使用结构方程模型来对影响机理和路径进行研究,这一类的研究主要依靠可观测变量、潜变量、结构模型、影响路径等方面共同构建一个影响机理的模型,经过实证检验来得出研究的结论[9]。但是这一类的模型有一个特点,那就是对于可测量数据的要求较高,需要经过一系列的信度、效度的验证,对于一般的不同类数据很难进行拟合[10]。另外一种常用的方法就是工具变量法,可以解决多个变量之间由内生性的问题,并且在解决内生性的同时,解决变量之间关系不明的问题,是一种可以通过普通计量实现部分结构方程模型中的研究机理描述的功能。其中,主要的方法有GMM(广义非线性),间接最小二乘法和两阶段最小二乘法[11]。目前关于此类问题中,面板数据对于GMM的应用更为广泛,但是对于截面数据两阶段最小二乘法使用较多。【本研究切入点】目前在国内的文献中,还没有发现在个人层面使用科研素养对个人的创新投入产出效率的影响机理进行研究。研究从科研素养对科研投入产出效率的影响机理作为切入点,利用工具变量法作为主要的研究方法,找出影响的机理,理清科研素养同其他控制变量之间的关系。【拟解决的关键问题】分析科研素养对于科研的投入产出纯技术效率产生影响,研究科研素养中的科研修养、个人能力、思维风格、科研基础对科研产出的纯技术效率的影响,以及在加入了其他的控制变量,诸如年龄、科研平台、性别、学历基础之后的变化。

1 材料与方法

1.1 材 料

以新疆农业科学院的科研人员作为本次调研对象。问卷的调研采取分层抽样的方法进行。具体办法如下:1.第一层以不同的科研院所进行划分,每个科研院所调研问卷的目标定为28份,可以视情况、人数具体变化上下浮动。2.第二层以年龄进行划分,对单个科研院所来说:小于30岁的科研人员,目标随机调查7人;30<年龄≤40的科研人员,目标随机调查7人;40<年龄≤50的科研人员,目标随机调查8人;50<年龄的科研人员,目标随机调查7人。如果某一层的人员数量不足7人,则全部进行调查,其余各层抽样数量可以不变。

相关科研人员科研素养的指标体系、科研投入产出效率指标体系、科研素养相关指标见文献[4-12]。

科研投入产出效率相关指标,分别为理论成果和产品成果。其中理论成果包括O1到O3,分别为论文数量、最高影响因子以及核心论文数量。产品成果主要为标准专利数量、创新产品质量。表1

可以看出,不论是创新投入指标还是创新产出指标,方差(标准差)的值比较大,证明在样本群体中,高低差别大,并不平均。尤其是科研经费不论是总经费还是单个最高经费的标准差更大,而且最大值与最小值的差距也非常大。

对个别单个指标进行分析,首先是获得课题的数量,平均每一个样本可以获得各种级别课题4次,但是方差也较大,而且最高值与最低值相差44,也就是说获得课题数量最多的人大小课题项目一共44项。在一般的科研人员中属于数量巨大。其次是产出项中的论文数量,也呈现出方差大,最小值与最大值差别大的情况。最高的发表论文180篇,属于非常大量产出的情况。

表1 投入产出数据
Table 1 Input-output data analysis

科研投入/产出Research input/output指标题号Index id均值The mean最大值Max最小值Min标准差standard deviation创新投入指标Index of Research inputB14.144405.1B22.97511.09B31804 6500505.13B483.862 5000256创新产出指标Index of Research outputC110.4180015.1C21.348.9501.17C38.25178014.63C44.1747032.5C57.845309.33

在对数据进行初步的分析之后需要对数据在DEA模型中使用情况进行检验和分析。在使用DEA方法时,第一个原则是所有的投入产出项都为正数,在这九个变量中可以得出的是全部都是正数,最小值为0,没有负数,因此第一个原则通过。第二个原则是决策单元的数量要较多的大约投入产出指标数,在本研究中投入产出指标一共为9个,而决策单元的数量为178个,因此也符合第二个检验。第三个原则是指标为非比率型指标,也就是指标尽量不要是两个指标的比值,而本文使用的所有投入产出指标均为量和质的体现,且不存在比率问题,因此第三个原则的检验也通过。

模型相关其他控制变量,在对科研素养相关指标数据进行处理和分析之后,就对其他的控制变量或者叫补充变量也进行一个初步的分析。表2

表2 模型其他自变量
Table 2 Other independent variables of model

科研投入/产出Research input/output指标题号Index id均值The mean最大值Max最小值Min标准差standard deviation性别Sex0.69100.46第一学历Edu13.85510.68年龄Age3.03510.41参与课题级别PARTI112.385012

1.2 方 法

1.2.1 工具变量法(二阶段最小二乘法)

在一般的计量分析中,OLS(最小二乘法)是一个基本的模型构建的方法,但是这个方法对于模型构建的基本假设要求较高,尤其是自变量之间要互不相关。但是,在本文的研究中可以发现,在构建科研素养对投入产出效率影响的模型时,科研素养和其他一些控制变量之间从理论上可能存在相关性,因此,不适合直接使用最小二乘法来分析。基于自变量的这种情况,工具变量法(IV)是一种较为常用的方法。这种方法具体如下所示:

Si=β0+β1Xi+εi.

Yi=β0+β1Xi+β2Xi+εi.

最后的方程为

其中,Xi和Si为两个类型的自变量。Xi为互相独立的一些自变量,Si则为与Xi之间由相关性的自变量,这两类自变量不能放在同一个估计方程中,因为其不符合经典的ols方法的假设,但是经过处理,就可以符合自变量之间互相独立的假设。这个处理就是二次估计原有的Si这类变量。在上文中提到,既然Si与Xi存在一定的相关性,那么Si也必然可以由Xi来进行估计和计算,建立一个Si与Xi的估计方程,就可以把原有基本方程中的Si这一类变量进行消除,从而消除自变量之间的相关性问题,回到OLS的经典假设范围之内。

在最后的方程内,括号外面的被称之为结构性的方程,括号内的估计值被称为初步方程,因此,这个方程的本质就是其中个别或者部分的自变量受到了其他变量的影响,换成了一个有独立不相关变量估计出的估计值。这种二次估计的方法也被称之为两阶段的最小二乘法。

1.2.2 因子分析

因子分析的主要目的是用来描述隐藏在一组测量到的变量中的一些更基本的,但又无法直接测量到的隐性变量 (latent variable, latent factor)。最早由英国心理学家C.E.斯皮尔曼提出。 因子分析主要由探索性因子分析和检验性因子分析构成。 因子分析的方法有10多种,但是最主要也是覆盖面最广的是主成分分析法 。其主要的步骤如下所示:

(1)原始指标数据的采集p 维随机向量x= (x1,X2,…,Xp)T,n 个样品xi= (xi1,xi2,…,xip)T,i=1,2,…,n;n>p,构造样本阵,对样本阵元进行如下标准化变换:

(2)对标准化阵Z 求相关系数矩阵。

(5)对m个主成分进行综合评价:对m个主成分进行加权求和,即得最终评价值,权数为每个主成分的方差贡献率。

在本文中,因子分析的方法主要是用于对科研素养相关指标的降维,以便使其在后面的研究中,消除科研素养指标之间的强相关的内生性问题。

1.2.3DEA基本方法

在本文的研究中,需要对投入产出的纯技术效率进行研究,而纯技术效率的测算需要使用DEA数据包络分析法,现阶段常用的DEA模型为DEA-BCC模型,因为它是一个既考虑规模效应,又考虑纯技术效应的DEA模型。之前的DEA-CCR模型并不能区分规模效率与纯技术效率,因此无法从结果中提取出纯技术效率,基于此本文研究的投入产出的纯技术效率也必须在这个模型下得出的结果。一个基本的DEA-BCC模型如下所示。

其中的X0和Y0分别代表了第J0个决策单元的输入变量和输出变量,而θ则代表了产出效率的数值。但是在一般的BCC模型中仍然要引入投入松弛变量s-、s+产出松弛变量 以及阿基米德无穷小量ε。最终的一个DEA-BCC模型中第J0个决策单元的表达式为:

2 结果与分析

2.1 科研素养指标体系验证结果与科研素养水平

对科研素养的相关题项指标进行分析和检验,检验结果全部通过题项检验,研究表明,研素养以及科研基础、个人能力、思维风格,科研修养178个样本,作为测算出的数值,其大小高低代表这个维度水平的高低,形成一个连续的变量。表3

表3 科研素养水平值Table3Analysisofscientificresearchliteracylevel

科研投入/产出Research input/output指标题号Index id均值The mean最大值Max最小值Min标准差standard deviation科研素养F2.273.181.060.46科研基础F12.653.921.220.64个人能力F23.324.400.880.79思维风格F32.503.230.830.67科研修养F42.493.650.780.53

表4 BCC模型松弛变量Table4 BCC model relaxation variable analysis section

单元数 Unit numbers_S-s-s-S+S+S+S+S+100000000004500000000066000000000670000000006800000000082000000000100000000000101000000000105000000000124000000000125000000000132000000000137000000000141000000000152000000000164000000000177000000000平均值The mean0.3810.3260.3130.5570.340.3210.4711.0150.111

2.2 DEA-BCC模型投入产出纯技术效率

在178个决策单元中所有的投入松弛变量和产出松弛变量都为0的17个决策单元,在这些决策单元中,既不存在投入冗余又不存在产出不足,属于资源配置效率相对较优单元。这些单元属于纯技术效率相对最大化的单元。可以分析的是在178个科研人员经过DEA-BCC模型的计算之后,得出了影响效率的第一个较为重要的影响因素--投入项的配比状态,即如果资源不能以合适的比例进行配比,就也会浪费其他已经配置给个人的资源。另外,除了这17个决策单元之外的161个决策单元要不然存在着投入冗余,要不然存在着产出不足,都是属于没有达到所有资源优化配置的单元。从整体来看,达到资源优化配置的仅占9.5%,说明在样本的群体中,个人之见的资源使用效率相差较大,达到优化配置的属于较小的群体。初步判断在样本群体的中需要进行资源的优化,使用效率的提升从而达到较为优化的效果。表4

2.3 基于2SLS的科研素养对创新投入产出纯技术效率影响

2.3.1 科研素养及其四个维度的基本回归

研究表明,对于创新产出的纯技术效率在1%的显著水平上显著正向影响个人产出的纯技术效率。即在投入科研资源相同的情况下,科研素养水平越高的人产出的量也越大。其次,科研素养中的个人能力、科研基础在1%的显著水平上正向的影响科研产出的纯技术效率,而科研修养在5%的显著水平上正向影响科研产出的纯技术效率。思维风格在投入一定的情况下并不显著影响纯技术效率。究其原因是因为思维风格不同可以导致科研产出类型的不同,但是在综合评价的产出指标下,并不显著影响量化后的产出水平。表5

表5 科研素养对纯技术效率相关性
Table 5 of The influence of scientific research literacy on pure technical efficiency

指标Item纯技术效率pure technical efficiencyP值P纯技术效率pure technical efficiencyP值PF0.220 3430.000 0F10.083 4690.000 2F20.048 2180.002 4F30.013 3530.474 0F40.040 2920.021 1

2.3.2 加入控制变量的科研素养对纯技术效率影响回归

当加入了控制变量之后,科研素养对于科研创新产出的纯技术效率的影响发生了变化,尤其是科研修养这个变量,影响从正向变为了负向,这说明一个问题,那就是科研修养这个变量在加入了其他控制变量之后,在回归时受到了其他的控制变量的影响,科研修养作为科研素养中意愿、精神方面的指标是需要一些"介质"才能产生影响并且发挥作用的。表6

表6 加入控制变量的回归
Table 6 of regression results for adding control variables

指标Item纯技术效率pure technical efficiencyP值P纯技术效率pure technical efficiencyP值PF0.231 1080.000 0F10.083 4690.000 2F20.048 2180.002 4F30.013 3530.474 0F4-0.547 7710.078 1EDU10.028 3570.021 80.055 2280.023 0SEX0.003 3820.856 10.062 7990.086 5PARTI10.031 4320.014 00.005 5330.8257Age0.001 3730.000 00.002 0840.000 3

2.3.3 使用2SLS下的两阶段回归分析

首先,可以得出的是科研修养收到第一学历、年龄以及参与课题级别的显著影响,而且方程的拟合优度为0.774(一般为0.4以上就较好),这说明建立方程的拟合度较好。但是个人能力、科研基础和思维风格并不影响科研修养,这与预期一致,因为在之前的因子分析当中已经把各个变量之间内生的相关性消除,及科研素养对的四个维度应该相对独立。在此基础上进行二阶段的结构方程,其回归的结果如下所示:

在第二阶段的回归过程中,首先拟合优度为0.445,表明方程的拟合优度较好,证明该方程中的主要影响因素得到了表达和描述。其次可以看到科研修养的影响方向回到了正向影响,恢复到了正常。科研修养在性别、第一学历、年龄以及课题参与的平台影响下产生了不同的影响。首先,可以看出当一个科研人员的年龄越大,他的科研修养就相对较高,从而较好的影响到科研投入产出的效率。即随着年龄以及科研阅历的增长,对于个人科研修养,以及其作用下的科研产出效率可以产生较为明显的影响。第二,科研修养在第一学历的基础上,即第一学历越高,其科研修养也相对越高,从而影响其科研产出的纯技术效率,这也解释了为什么通常情况下在职业招聘的过程中,除了最终学历还有相当的单位考察第一学历,因为第一学历作为一个工作者尤其是科研人员,其对一些不明显的,隐藏下的科研修养产生着重要的影响,从而影响其产出的效率。第三,科研修养在参与课题或者科研平台的作用下,呈现正向相关的关系,即参与的课题平台越高,对于科研修养的影响越朝着正向的方向去影响,进而影响到科研产出的纯技术效率。表7、8

表7 一阶段回归
Table 7 of First-stage regressions

指标Item纯技术效率pure technical efficiencyP值PF10.018 6740.762F20.020 0940.645F30.066 3770.135EDU10.028 3570.031SEX0.003 3820.323PARTI10.031 4320.001Age0.001 3730.00 0

表8 二阶段的结构方程
Table 8 of Instrumental variables (2SLS) regression

指标Item纯技术效率pure technical efficiencyP值PF10.018 6740.001F20.020 0940.013F30.066 3770.845F40.001 3730.000

3 讨 论

3.1 对于科研人员的使用问题。现阶段的大部分科研机构倾向于过多的使用年轻的科研工作者。当然,年轻的科研工作者可能掌握了更新的方法,有着更好的精力,可以有助于科研产出的提升,但是从经济学效率的角度讲,经验更为丰富的老科研工作者在精力、体力允许的情况下,其投入产出的效率更高,因此在科研工作时需要统筹安排老科研工作者与新晋的科研工作者的工作和分工。

3.2 对于科研单位的效率来讲,男女员工在投出产出的效率上并没有明显的差异,如果存在最终科研产出结果上的差异,更多的原因是投入的时间和精力不同导致,在相同投入的情况下,男科研工作者并不比女科研工作者效率高,因此在工作时也应适当给予女员工相对更多的工作机会,从而最大限度的保证效率。

3.3 对于科研工作者中的高学历人才要格外关注,尤其是第一学历出众的科研工作者,可能在更少投入的情况下或者更高的产出。

3.4 科研单位如果想提升科研产出的效率,以及后续的可持续的创新产出,就一定要鼓励工作人员申请、参与更高级别的科研课题。

3.5 在研究问题的过程中,尤其需要注意的自变量之间的相关性问题,如果不考虑其相关性问题就容易造成扰动,影响正常的回归结果。

4 结 论

4.1 科研素养对科研人员的科研投入产出纯技术效率有正向影响,而且科研修养、个人能力以及科研基础正向影响科研人员的创新产出的纯技术效率。

4.2 科研人员的科研素养中,科研修养通过年龄、第一学历以及参与课题的级别影响科研人员的投入产出纯技术效率,是一个间接的影响机制。

4.3 科研人员的科研素养中,科研基础、个人能力是直接影响,科研修养是间接影响,即科研素养对科研人员的纯技术效率影响是一个多路径的影响机制。

猜你喜欢

投入产出科研人员变量
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
科研人员揭示油桃果实表皮不长毛的奥秘
科研人员破译黑猪肉特征风味物质
寻求不变量解决折叠问题
抓住不变量解题
企业科研人员激励问题及对策研究
无锡高新区制造业投入产出分析
基于DEA-Tobit模型的我国2012—2013年群众体育投入产出效益评价与影响因素研究
基于DEA方法的高校R&D投入产出绩效评价与对策研究——以河北省29所高校为例
分离变量法:常见的通性通法