APP下载

科技发展目标、R&D资源清查工作与R&D/GDP指标数据的正态分布特征

2013-08-24章刚勇朱世武

中国软科学 2013年5期
关键词:正态正态分布检验

章刚勇,朱世武

(1.南昌大学 经济管理学院,江西南昌330031;2.北京大学光华管理学院,北京100871;3.清华大学经济管理学院,北京100083)

一、引言

20世纪70年代末开始,我国经过不断努力,形成了比较完整、系统的统计调查制度和稳定的调查指标体系,逐步形成了一套比较完善、规范并与国际接轨的科技统计指标体系和统计制度,扩大了科技统计范围和扩展了其内容,制定了系列统计标准和规范,通过加强与国际间的业务交流与合作,使科技统计工作为国际社会日益关注[1]。在20世纪90年代后我国才基本上按国际惯例对R&D投入有关指标进行统计[2]。1995年我国制定颁布的《中共中央、国务院关于加速科学技术进步的决定》把2000年我国R&D经费/GDP的发展目标定为1.5%;2005年颁布的《国家“十一五”科技技术发展规划》把2010年R&D经费/GDP发展目标定为2%。在2000年和2009年我国分别组织了两次全国R&D资源清查工作,R&D经费及占GDP比重虽然在资源清查年度的增长率远高于其它年度,但2000年和2010年我国R&D经费/GDP的实际值分别为0.9%和1.75%,科技发展目标落空。由此引起我们对由此引发我们对R&D资源清查工作与数据质量,R&D资源清查工作与科技发展目标的思考。

大多数科技管理和科技评价文献使用了科技统计指标和定量研究法,但多侧重于评价指标体系的构建和应用,而关于科技统计基础指标的统计性态及数据质量评价方面的探讨较少[3]。R&D投入指标是科技统计指标体系的主要组成部分,其中R&D经费和R&D经费/GDP是R&D投入指标中两个主要指标。了解R&D投入增长变化规律,把握R&D投入指标的统计特性,一方面可以应用于数据质量评价,以了解我国R&D投入及科技统计工作较为真实的现状,对科技监控和科技管理具有较强的现实意义;另方面可以为使用R&D投入指标数据进行统计建模正确评价科技投入到产出之间以及科技投入在经济社会发展中所起的作用提供支撑。

成邦文[4-5]认为我国各省市研究机构的R&D经费等指标数据在横截面上具有服从对数正态分布规律,并采用K-S检验法加以验证。谭文华[2]认为,对未来R&D经费总量和R&D/GDP的预测,长期以来世界各国还是主要采用基于定性方法的主观判断方法,当前我国R&D强度(R&D/GDP)增长趋势与国际R&D强度增长一般规律基本相符,并已进入一个快速增长的关键时期,但R&D投入水平仍滞后于经济发展水平几乎一个阶段。本文首先简单探讨了R&D投入指标数据具有随机性的统计特征,提出了在社会经济稳定和统计调查制度稳定的前提下,一国的R&D投入指标的时序数据应具有服从正态分布的特点之观点,并以经验实证法加以论证;然后分别从指标数据正态分布的规律出发,对我国R&D经费、R&D/GDP指标的数据质量进行了评价,对我国未来R&D/GDP进行预测;最后是有关结论和思考。

二、R&D投入数据具有随机的特点吗?

R&D投入受社会经济发展程度、科技政策、科技意识和科技文化等因素影响,具有不确定性;反映科技投入的统计数据受统计调查范围、统计调查方法等因素影响,具有随机性。

(一)经济发展与R&D统计数据

一个国家或地区的R&D投入与其社会经济发展状况相互影响,一方面,R&D投入影响科技进步水平,而科技进步是经济增长的主要驱动因素之一;另一方面,国家或地区的经济发展状况,制约着R&D投入水平,特别是基础科学技术研究的投入。另外,R&D投入还受科技政策效力,科技意识和科技文化等因素的影响。各因素的相互作用使得R&D投入的绝对指标和相对指标数据都具有不确定性。

(二)统计调查范围与R&D统计数据

根据经济合作与发展组织制定的科技统计手册《弗拉斯卡蒂手册》的规定,R&D统计调查范围应当是一国中所有从事R&D活动的成建制的机构。如企业、研究机构、高等学校、社会团体和协会等具有法律地位的实体。实践中,各国根据本国的具体情况和特点,R&D统计中所采用的调查范围和调查起点有所不同。由于事先并不知道哪些单位在从事R&D活动,并且从事R&D活动的单位也在变化,使得统计范围具有一定的不确定性,从而影响到R&D投入统计数据。

(三)统计调查方法与R&D统计数据

R&D统计调查方法可分为抽样调查和全面调查的方法,抽样调查无论是简单随机抽样还是分层抽样等方法,要求总体中的个体都以已知的概率被抽中,调查所采撷的数据是随机数据;即便是全面调查,受调查范围和调查起点的影响,以及在数据采撷过程中,受到系列调查误差影响,最终公布的R&D统计指标数据也应该具有随机的特点。

三、R&D投入指标数据的正态分布特征

R&D投入指标数据具有随机的特点,那么在不同的社会、经济、科技政策和科技文化的作用下,是否具有共同的随机规律,服从正态分布?正态意味“正常性态”,指若在观察或实验中不出现重大失误,则结果应遵从正态分布。这个看法既有大量的经验事实支撑,也有中心极限定理作为理论支撑①引自:陈希孺为《正态性检验》(梁小筠,1997)所作的序,中国统计出版社。。韩德瑞[6]认为时间序列的差分实质上是剔除时序当中某种固有的规律性,经过数次差分后的时序主要含有随机性的独立误差性质,自然趋向于正态分布。当一国的社会经济因素稳定时,并且统计调查制度规范稳定时,R&D投入数据逐年稳定上升或下降,在一定的时间跨度里,应表现为“两头少,中间多”的正态分布趋势。若时序面的数据不服从正态分布,呈现左偏或右偏的形态,可能缘于科技政策的效力或统计调查制度或方法的调整而引起的结构性突变。相应数据经差分或取对数等平滑技术处理,消除这种突变后,也应服从正态分布。施建军[7]认为对R&D活动的评价,应从应把握指标体系的空间上的联系性和时间上的动态性,通过时序数列,可以从全部时点上掌握科技活动的动态性,反映科技活动发展的水平和速度。R&D时序数据的正态分布规律与R&D投入增长规律并不相互冲突。R&D投入增长规律描述的是其在增长趋势上的特征,而正态分布规律度量的是R&D投入数据的随机特性。

因此我们认为:在社会经济因素稳定,在统计调查规范和稳定的前提下,一国的R&D投入的时序数据应具有遵从正态分布的特点。无法从数学上给出这结论的严格证明,本文以经验实证法对部分国家的R&D投入数据的正态分布特征加以验证。

(一)正态性检验方法

判断一列数据的分布是否具有正态性规律,有许多种方法。第一类:使用图示法从直观上判断,如频率分布直方图,QQ图(四分位数图)和PP图(百分位数图)等;第二类:规范检验法,主要包括:Shapiro-Wilk检验、Kolmogrov-Smirnov检验、Cramer-von Mises检验和Anderson-Darling检验等方法②正态性检验方法还包括偏度检验法、峰度检验法等,使用这两种方法的前提是要有偏度和峰度的先验信息。本文选择的四种检验方法是无方向正态性检验方法,且被主流统计软件包SAS所集成。。正态性检验方法的原假设一般为H0:数据服从正态分布;相应的备择假设为H1:数据不服从正态分布。章刚勇[8]在随机模拟的基础上计算和比较了四种检验方法的功效,认为四种检验方法对备择分布形式,备择分布的非对称性和厚尾的特点都较敏感。在实际应用中,较好的办法是同时使用四种检验方法对样本进行正态性检验,若有一种检验方法p值较小,并在选定的显著性水平下拒绝了原假设,可以认为所检验的数据不服从正态分布。本文采用上述的四种规范正态性检验方法。

(二)部分国家R&D经费数据和R&D经费/GDP数据正态性检验结果

科技活动的定量研究应放在国际大系统中进行比较和分析[7],我们采用四种正态性检验方法分别对中国、美国、法国、德国、俄罗斯、日本、韩国和印度等八个国家1987-2008年R&D经费(单位:十亿本国币)和R&D经费/GDP(%)数据进行检验。数据来源于中国科技统计主要指标数据库(http://www.sts.org.cn/)。数据库虽有部分数据缺失①数据库中部分数据缺失。其中:(1)R&D经费数据:中国(1987-2008)共22个观测值;美国、法国、德国、日本(1987-2007)各21个观测值;俄罗斯(1991-2007)17个观测值;韩国(1991-2007)17个观测值;印度(1994-2005)12个观测值(印度1992年,1993年R&D经费为1931十亿本国币和1991十亿本国币,是1994-2005年各数据的10-20倍左右,表现异常,被作者作为异常值而剔除)。(2)R&D经费/GDP数据:中国(1987-2008)共22个观测值;美国、法国、德国(1987-2007)各21个观测值;日本(1987-2006)20个观测值;俄罗斯(1990-2007)18个观测值;韩国(1991-2007)17个观测值;印度(1987-2005)19个观测值。,但不影响检验方法的使用和相应结论。检验结果如表1和表2所示:

表1 部分国家R&D 经费数据正态检验结果

表2 部分国家R&D经费/GDP 数据正态检验结果

如表1、表2所示,美国、法国、日本等市场经济成熟的国家,即使是发展中国家印度,其工业化发展阶段尚处于初级阶段,R&D经费及R&D经费/GDP指标数据在0.1的显著性水平下,未能拒绝原数据服从正态分布的原假设。各国的R&D投入的主体结构有所不同,经济发展程度不同,工业化发展阶段不同,科技政策效力不同,科技文化意识不同,但不同的社会经济形态,科技政策和科技文化形式并不影响R&D投入数据的正态分布特征。

俄罗斯和中国的指标数据均在0.05的显著性水平下,拒绝了原数据服从正态分布的假设。俄罗斯经1991年前苏联解体后,经历了相当长一段时期的政治混乱,这段期间政治利益优于经济发展,维系社会稳定是国家主要目标,经济在缓慢中求序和发展,R&D投入数据难于维持正态分布特征。中国科技统计起步较晚,科技统计调查制度和调查方法处于逐步调整和完善阶段,其规范性和科学性影响到R&D投入统计数据的正态分布特征,从而影响数据质量。进一步对中国和俄罗斯指标数据分别经一次差分和两次差分后再进行正态性检验,在0.05的显著性水平下未能拒绝其服从正态分布的原假设,可以认为差分后的数据消除了经济社会不稳定和统计调查方法的改变等因素对数据的影响,遵循正态分布规律(检验结果表略)。

正态性检验结果表明了在社会经济稳定,在统计调查规范和稳定的前提下,一国的R&D投入时序数据具有遵循正态分布的特点。具有正态分布特征的数据具有良好性态,基于正态总体的一系列重要检验统计量有形式完美简洁且在计算上可行的特点。在小样本情况下,当总体服从正态分布的假定不成立时,相应的参数检验是失效的,统计推断是不可信的。R&D投入指标的时序数据的正态分布规律,给科技监控、科技评估等科技统计应用领域中的一些统计方法的使用提供了理论依据。

四、我国R&D投入指标数据质量评价

统计数据质量一般被认为是统计信息对用户需求满足的程度。随着我国经济的快速发展及国际地位提高,官方统计数据的用户越来越多,统计数据质量和可信性问题也日益引起关注。统计数据质量问题一直是困扰中国统计部门的难题[9]。我国科技统计数据采集过程中存在统计信息及时性需要改善、指标体系需要修订、统计数据质量控制手段单一等问题[10]。统计数据质量评价可以从数据的准确性、适用性、及时性、可比性和可衔接性等五个主要维度着手。数据的及时性维度主要依赖于科技统计调查和管理部门工作的效率。郭红丽[11]对宏观统计数据质量评估的研究范畴与基本范式作了探讨。受2009年第二次R&D资源清查工作影响,作为我国科技统计门户网站的中国科技统计数据库截止到2010年7月①2010年7月是本文初稿完成时间。尚未把相应数据更新到2009年。统计调查制度的稳定和规范影响数据的准确性、可比性、可衔接性和适用性等数据质量维度。我国1987-2008年R&D投入时序数据不具有遵循正态分布规律的特点,其数据质量的准确性、可比性和可衔接性等特征被怀疑。

进一步对我国 R&D经费及 R&D经费/GDP指标数据进行分析。两指标数据不遵循正态分布规律,分别计其偏度得:R&D经费样本数据的偏度为1.5596;R&D经费/GDP样本数据的偏度为0.8183。数据呈明显右偏形态。样本数据的右偏形态表明我国R&D投入近年来超“正常性态”提升,可能缘于科技政策的效力促使实际R&D投入增大,也可能缘于统计调查制度不稳定或调查方法的改变。表3给出1987-2008年我国R&D经费和R&D经费/GDP数据,数据来源于中国科技统计数据库,并计算了两指标的年增长率。我国R&D经费支出逐年上升,R&D经费/GDP从1995年后,连年上升。2000年R&D经费的年增长率为32%,R&D经费/GDP年增长率为18%,为1987-2008年间R&D投入增长速度最快的年份。2000后,两指标增长速度回落并趋于稳定。分别以R&D经费和R&D经费/GDP为依赖变量,对时间T做简单线性回归,然后以年份2000为分界点(breakpoint)做Chow检验②关于Chow检验原理可以在一般的《计量经济学》教材中找到,这里不作叙述。这个Chow检验的结果还表明:在两个时间段里,我国R&D经费及R&D经费/GDP其在模型中所的截距项和斜率项都发生了显著性变化,这也是本文的第五部分关于R&D经费/GDP预测模型的假设依据。,得到表4。从检验结果表明我国R&D经费和R&D经费/GDP数据在2000年发生了显著性的结构突变。那么R&D投入在2000年增长速度如此之快是主要缘于R&D投入实际的增长,还是主要缘于科技统计调查范围和方法的调整?

表3 我国R&D投入指标数据(1987-2008)

表4 R&D经费和R&D经费/GDP的Chow检验结果

在科技政策方面,我国在1995年发布的《中共中央、国务院关于加速科学技术进步的决定》中要求在“十五”期末,即2000年,R&D经费/GDP要达到1.5%,实际上2000年R&D经费/GDP指标值为0.9%,政策目标虽落空,但2000年的R&D经费/GDP年增长率却为最高。在科技统计调查制度方面,2000年为满足宏观科技管理需要,更好地与国际接轨,科技部、国家统计局等七部委联合组织了第一次全国R&D资源清查工作,首次得到了全面的、系统的统计数据[12]。指标数据的结构突变导致数据在1987-2008年期间不再具有服从正态分布之规律。R&D经费指标在资源清查年度2000年的增长速度远高于其它年度。1999年我国R&D经费增长速度为23%,而2000年我国R&D经费增长速度达到32%;1999年我国R&D/GDP指标值为0.76%,2000年R&D/GDP指标值虽然受GDP影响,仍低于1.5%的科技发展目标,但其当年增长速度仍高于其它年度。然后2001年的增长速度又迅速回落。很明显,2000年指标数据的结构突变并非缘于R&D投入规模和强度的实际增长,而应主要归因于资源清查工作中的统计调查范围和方法的调整。考虑到2000年是我国“九五”计划的末年,虽然不能下结论,2000年我国第一次R&D资源清查工作是受科技发展目标驱动,但至少可以认为科技发展目标并未导致2000年我国R&D投入规模和强度的实际的突飞猛进,科技政策的着力点似乎在科技统计工作;虽然我们仍无法对R&D投入数据的准确性进行评判,但R&D统计调查范围和统计调查方法的改变影响了R&D投入数据的数据质量的适用性①适用性在这里主要指使用R&D投入指标的时序数据建模时,未考虑到其在某年份发生结构性突变,而直接考察其对经济社会的影响,比如对经济增长的影响及在经济增长中的贡献。、及时性、可比性和可衔接性等方面的维度。

进一步地把两指标分成1987-1999和2000-2008两个区间段,再一次对R&D经费和R&D经费/GDP数据进行正态性检验,检验结果见表5。各检验方法未能在0.1的显著性水平下拒绝数据服从正态分布。再一次表明R&D投入数据具有正态分布特征,2000年我国第一次全国R&D资源清查工作使得R&D投入数据破坏了其正态分布规律,影响了其数据质量。

表5 我国R&D经费和R&D经费/GDP 分区段正态检验结果

五、我国R&D经费/GDP的预测

在社会经济因素稳定,在统计调查规范和稳定的前提下,一国的R&D投入数据在时间序列层面上应具有遵从正态分布的特点。R&D经费支出及其占GDP的比重是衡量一个国家科技活动规模和科技投入水平的重要指标,也是反映我国自主创新能力和创新型国家建设进程的重要内容。我们从指标数据的正态性规律出发,根据时间序列的构成分析,导出了R&D经费/GDP的循环预测模型。李子奈[13]认为,由于异常点的存在,当使用我国宏观经济统计数据,进行时间序列数据建模并对未来预测时,可能得到有偏误甚至错误的结论。我们的设置预测模型时充分地考虑到了科技规划,R&D资源清查工作等科技政策和科技统计工作方面对数据序列的影响。

(一)预测模型的设定和几个相关假设

按照时间序列数据的分解,一个时间序列可以分解成三项,即趋势项、周期项和随机项,在这里我们把模型设定为(1)式。模型的基本假定为:R&D经费/GDP数据除了受新信息冲击外,基本复制了上一个时间段的增长趋势和波动信息。新信息来源于科技统计调查制度的变更或科技规划年度末的发展目标,表现在(1)式等号右边的第一项;等号右边的第二项表示模型复制了上一个周期的增长趋势;等号右边的第三项为随机项,由R&D经费/GDP服从正态分布,易推导出随机项亦服从正态分布,该项复制了上一周期的波动信息。本文的第三部分的Chow检验支持了我们的假设。

其中:Y表示单列的时间序列变量,在这指R&D经费/GDP;

ΔTi表示第i个时间区间;

t表示时间,在这以年为单位;

A表示信息冲击项,其取值为常数在时间区间ΔTi+1段,为此区间第0年的时间序列变量值;

BΔTi表示第i个时间区间段变量对时间回归所得出的系数;

εt表示随机项

假设及理由:

假设1.关于A,信息冲击来自于外部,并且变量取值受信息冲击只在区间段开始时发生突变,在区间里其它时间点上保持不变。在这信息冲击可理解为某个年份展开R&D资源清查工作,或科技规划开始或终止年对R&D投入的冲击;

假设2.关于BΔTi,由上一个时间段回归所得出的系数,是假定本时间区间段将重复上个时间段变量变化的规律,表示趋势性和周期性特征对变量数据的影响。这样的假设基于两个理由,其一,以往文献已论证R&D投入增长分阶段有其变化规律,比如谭国华[2];其二,我国R&D投入数据展现除了某个年份受R&D资源清查工作影响之外,其它年份的R&D投入增长速度相对较稳定,因此,我们认为在经济社会及统计调查制度稳定的前提下这样的假定是较合理的;

假设3.关于εt,由时序变量Y在某个区间服从正态分布易知εt亦服从正态分布,因此假定εt~N(0,σ2ΔTi),其中Var(εt)=Var(YΔTi),实际意义可理解为上一期变量的随机波动信息延续到本期。

(二)预测方法和结果

综合考虑政策方面及科技统计调查方面的因素:(1)政策:1995年发布的《中共中央、国务院关于加速科学技术进步的决定》中要求在“十五”期末,即2000年,R&D经费/GDP要达到1.5%;2005年发布的《国家“十一五”科技技术发展规划》把2010年R&D经费/GDP发展目标定为2%;2005年发布的《国家中长期科学和技术发展规划纲要(2006-2020)》把2020年 R&D经费/GDP发展目标定为2.5%;(2)科技统计调查:2000年我国组织了第一次全国R&D资源清查工作;2009年我国展开了第二次全国R&D资源清查工作①2009年,我国R&D/GDP的比值为1.7%,注意到2008年我国R&D/GDP指标值为1.47%,2010年R&D/GDP指标值为1.75%,数据来源于中国科技主要指标数据库。。我们把时间区间段划分为 1995-1999、2000-2004、2005-2008和2009-2020四个区间段,在后三个区间使用(1)式进行循环预测,其中随机项εt是由随机模拟产生的均值为0,方差为上个区间段的样本方差,服从正态分布的随机数。并且我们把2000-2004和2005-2008两个区间段的数据作为训练样本,分别以(2)式评估模型的预测精确度。然后再给出2010-2020各年的R&D/GDP的预测值。

表6给出了2000-2004和2005-2008两个区间段的R&D/GDP的实际值和预测值②注意到预测值并不是如实际值连年递增。我们认为是合理的,基于以下几个原因:(1)R&D投入具有随机性;(2)R&D/GDP的数值大小取决于分子分母增长量的权衡,不确定因素多。并且国际经验表明R&D/GDP并非逐年递增;(3)在我们的预测模型中,当随机项的波动在某期对序列的影响大于增长趋势对序列的影响,就可能出现某期R&D/GDP低于上期的可能。,经(2)式计算,2000-2004年区间段预测的平均绝对误差率为9.1%;2005-2008年区间段预测的平均绝对误差率为3.6%。

表7给出了我国2010-2020年我国R&D/GDP的预测值,2010年我国 R&D/GDP预测值为1.73%,实际值为1.75%,而《国家“十一五”科技技术发展规划》把2010年R&D经费/GDP发展目

表6 2000-2008年我国R&D/GDP实际值与预测值(%)

标定为2%;2020年我国R&D/GDP预测值为2.17%,而《国家中长期科学和技术发展规划纲要(2006-2020)》把 2020年 R&D经费/GDP发展目标定为2.5%。实际值或预测值与目标值有一定的差距。可以从三方面理解这类差距:其一,R&D投入的增长未能跟上经济增长的速度,我国目前经济的高速增长仍是以粗放型的增长模式为主,R&D投入的增长与目前GDP的高速增长关联度不大;其二,影响R&D投入的两个主要因素为政府投入和企业R&D活动。政府投入在目前阶段和以后相当长时期内仍是我国R&D投入的主要来源[2],即使未来政府进一步加大R&D投入,但可能对企业自主的R&D投入产生排挤,政府投入作用有限。而只有当中国绝大多数产业的发展由产业间的技术溢出与自主的R&D投入同时驱动时,中国才能进入到由“中国制造”转向“中国创造”的路径上来[14];其三,科技发展目标制定的方法应该科学,并结合实际,在计划年度里可以审时度势地对目标加以调整,而且目标的实现需要制度上的保证,否则目标将一一落空。另外,我们预计2010-2020年间,我国将展开第三次R&D资源清查工作,可能发生在2015年或2019年左右①2011-2020期间,若如我们预计发生科技统计调查制度的变更,比如第三次R&D资源清查,将影响我们后期的预测值,我们认为:根据我国政策规划特点,循环预测模型的循环周期最好为五年一个跨度。。尽管如此,2020年R&D经费/GDP发展目标2.5%也较难实现。

表7 2010-2020年我国R&D/GDP预测值(%)

六、结论及思考

科技投入受社会经济发展程度、科技政策、科技意识和科技文化等因素影响,具有不确定性。反映科技投入的统计数据受统计调查范围、统计调查方法等因素影响,具有一定的随机性。在社会经济因素稳定,统计调查制度稳定的前提下,一国的R&D投入的时序数据应具有服从正态分布的特点。R&D投入时序数据的正态分布规律与R&D投入增长规律并不相互冲突。R&D投入增长规律描述的是其在增长趋势上的特征,而正态分布规律度量的是R&D投入数据的随机特性。其服从正态分布的统计特性可以应用于数据质量评价,以及应用于时序数据建模。

我国1987-2008年 R&D经费和 R&D经费/GDP指标数据,受2000年第一次全国R&D资源清查工作影响,数据结构发生突变,不再具有服从正态分布的良好性态。此时其数据质量在及时性、准确性、可比性、可衔接性和适用性等五个维度方面被怀疑。2009年我国展开第二次全国R&D资源清查工作,又一次使得R&D投入数据结构发生突变。两次R&D资源清查工作使得R&D投入的增长速度在清查年度里远高于其它年度,但显然并非缘于清查年度里实际的R&D投入规模和投入强度加大,而是主要缘于统计调查范围和方法的变更。现阶段影响我国R&D投入数据质量的主要因素为统计调查制度的稳定性。由此引起我们对R&D资源清查工作的思考。

第一,R&D资源清查工作的必要性。我国科技统计工作已经历了几十年的发展,已逐步形成了一套比较完善、规范并与国际接轨的科技统计指标体系和统计制度。如果R&D资源的调查范围、调查方法已经标准化、规范化,R&D资源的统计工作已经制度化,那么全面的全国R&D资源清查工作是否是必要的?

第二,R&D资源清查工作与科技统计数据质量。全国R&D资源清查工作目的之一为夯实统计基础,提高数据质量(国统字[2009]57号),但根据本文的分析,R&D资源清查工作已破坏了数据质量中的及时性、可比性、可衔接性和适用性等主要维度,并且数据质量中的准确性维度也被怀疑。造成科技统计数据质量不高的原因主要来自于科技统计和科技管理方面,以及基层原始数据源方面[15],归结起来主要是制度因素和人为因素,设计适当的制度约束和激励科技统计人员为提高统计数据质量而努力,才能真正提高统计数据质量。全国R&D资源清查工作是否能达到提高数据质量之目的?

第三,R&D资源清查工作与科技发展目标。到目前为止,我国分别在2000年和2009年开展了两次全国R&D资源清查工作。注意到两个事实:(1)2000年为我国“九五”计划末年,科技发展目标是到 2000年我国 R&D经费/GDP要达到1.5%;2010年为我国“十一五”末年,科技发展目标是到2010年我国R&D经费/GDP要达到2%;(2)虽然我国R&D经费/GDP在2000年的实际值(0.9%)和在2010年的实际值(1.75%)未能达到科技发展目标值,但在清查年度2000年和2009年R&D经费/GDP增长速度明显大于其它年度,并且清查年度的R&D经费的增长速度远高于其它年度,似乎R&D资源清查工作为科技发展目标而展开。那么全国R&D资源清查工作是否可以安排在科技发展目标制定年度?根据R&D经费/GDP指标单序列的统计性态,结合我国“五年计划”和科技统计工作的特点,我们设计了一个循环预测模型并预测,若在2011-2020年间,我国未展开第三次R&D资源清查工作,2020年R&D经费/GDP目标值(2.5%)不大可能达到,甚至难于接近。那么2020年我国R&D经费/GDP目标值有必要调整么?

[1]刘树梅.我国科技统计发展概况[J].科技管理研究,2007(2):1-3.

[2]谭文华,曾国屏.R&D强度的“S”曲线与实现我国投入稳定增长的若干思考[J].中国软科学,2005(1):94-98.

[3]章刚勇,阮陆宁.科技统计研究回顾与展望[J].统计与决策,2010(9):161-162.

[4]成邦文,王娅丽,石林芬.科技规模指标的对数正态分布规律[J].科学学与科学技术管理,2000(9):9-11.

[5]成邦文,董丽娅,杨峻.研究与开发机构统计数据质量与异常点的对数正态分布检验与识别[J].统计研究,2000(1):42-45.

[6]D·F·韩德瑞,秦朵.动态经济计量学[M].上海:上海出版社,1998.

[7]施建军,张台秋.科技统计的发展:方向和思考[J],统计研究,2002(1):7-10.

[8]章刚勇,阮陆宁.基于Monte Carlo随机模拟的几种正态性检验方法的比较[J].统计与决策,2011(7):17-20.

[9]高敏雪.从外部监督入手解决统计数据质量问题的努力[J].统计研究,2009(8):50-52.

[10]杨贇,蔡艳梅.提高科技统计数据质量途径探索[J].河南科技,2006(9):9-10.

[11]郭红丽王华,宏观统计数据质量评估的研究范畴与基本范式[J],统计研究,2011(6):72-78.

[12]刘树梅.我国政府R&D经费投入状况研究[J].科技管理研究,2002(2):38-41.

[13]李子奈,周建.宏观经济统计数据结构变化分析及其对中国的实证[J],经济研究,2005(1):15-26.

[14]潘文卿,李子奈,刘强.中国产业间的溢出效应:基于35个工业部门的经验研究[J],经济研究,2011(11):18-29

[15]候相彬.科技统计数据质量不高的原因及提高途径[J],河南科技,2010(10):11-12.

猜你喜欢

正态正态分布检验
关于n维正态分布线性函数服从正态分布的证明*
利用二元对数正态丰度模型预测铀资源总量
直觉正态模糊数Choquet 积分算子及其决策应用
生活常态模式
抽样分布的若干反例
偏对称正态分布的若干性质
电梯检验中限速器检验的常见问题及解决对策探究
正态分布及其应用
关于锅炉检验的探讨
小议离子的检验与共存