国际创新评价指数比较分析及其对我国创新评价的启示
2022-02-18丁晓芹汤怡洁
丁晓芹,汤怡洁,徐 雯
(中国科学院武汉文献情报中心,湖北武汉 430071)
创新一直被视为实现经济增长和就业增长的最重要因素[1]。长期以来,国内外的经济学家一直致力于研究如何衡量经济体的创新水平。20 世纪初,经济学家熊彼特首次提出创新理论,该理论明确表明创新型国家的复杂环境和定性指标之间的相关性不可能用简单的方式来衡量[2]。创新具有多个维度,优势和劣势的组合可能导致不同的创新水平。尽管熊彼特对创新的定义并不是用数学术语给出的,但将科学、技术和创新的几个指标结合起来构建复合指标来评估创新水平已成为国际通用做法。目前,许多国际组织、学术机构和专家学者研究开发了多种创新评价指标体系,采用复合指标对各个国家的创新水平和竞争力进行了评价[3],为政府决策提供指导和参考[4]。在国外影响力较大的有《欧洲创新记分牌》《全球创新指数》《全球竞争力指数》《美国科学与工程指标以及世界竞争力年鉴》。从不同年份发布的报告内容来看,各个评价指标体系的评价结果并不完全相同,本文主要围绕各个评价指标体系的指数值,对指数的取值和统计单位等进行详细的比较分析,为正确认识和解读各个评价结果提供一些参考。
1 国际创新评价相关研究报告
1.1 《欧洲创新记分牌》
2000 年3 月欧盟成员国在里斯本举行特别首脑会议,达成并通过了一项关于欧盟十年经济发展的规划,即里斯本战略(Lisbon Strategy),该战略的目标是使欧盟在2010 年前成为以知识为基础的、世界上最有竞争力的经济体。《欧洲创新记分牌》(European Innovation Scoreboard,EIS)即是该战略的一部分,旨在评估欧盟成员国的创新绩效,发现各个国家的发展优势与劣势,帮助各个国家重点发展短板,提高创新水平。
EIS 是一个动态型的指标体系,通常会根据欧盟科技创新战略的变化进行调整,但其基本框架不变,根据创新流程划分为几大主要类别,并在各类别下设置创新维度,每个创新维度由多个指标组合而成。《2020 年欧洲创新记分牌》设计了框架条件、投资、创新活动、创新影响四个类别,框架条件包含人力资源、有吸引力的研究系统、创新环境3 个创新维度,投资包含资金支持、企业投资2 个创新维度,创新活动包含创新、联系、知识资产3 个创新维度,创新影响包含就业影响、经济效应2 个维度,每个创新维度下设2~3个具体指标,共有27个详细指标[5]。
《欧洲创新记分牌》主要分析欧盟成员国的研究和创新水平,为评估欧盟在全球经济中的创新地位,其评价对象还包括美国、日本、韩国、加拿大、金砖国家等在内的世界主要创新经济体以及欧盟几个邻近国家。
1.2 《全球创新指数》
2007 年世界知识产权组织、康奈尔大学、欧洲工商管理学院共同创立了《全球创新指数》(Global Innovation Index,GII)[6],该报告衡量全球范围内多个经济体创新能力的表现,并按照评价结果对经济体进行排名,为全球政策制定者、企业管理执行者等相关人员提供了重要基准工具。
GII 报告中包含全球创新指数、投入和产出次级指数,其中,全球创新指数由投入和产出次级指数的平均值计算而来,反映一个经济体的综合创新水平。除此之外,报告对每个经济体的每个指标进行了排名。2020 年9 月2 日,世界知识产权组织发布了最新一期报告《全球创新指数2020》,对全球131 个经济体进行了排名[7],中国排名第14 位[8]。
全球创新指数分为投入和产出两类指标,投入类指标包括制度、人力资本和研究、基础设施、市场成熟度以及商业成熟度五个参数,产出类指标包括知识和技术产出、创意产出两个参数。每个参数下有对应的子参数,子参数由单独的指标构成,2020 年最新报告显示有80 个具体指标。
1.3 《全球竞争力报告》
1979 年世界经济论坛开始发布《全球竞争力报告 》(Global Competitiveness Report),该报告每年都会评价各个国家的经济运行情况并进行排名。早期报告主要由两大指数构成,一个指数是增长竞争力指数(Growth Competitiveness Index),另一个是商业竞争力指数(Business Competitiveness Index)[9]。2004 年,为了完善评价指标体系,覆盖更多影响因素,世界经济论坛邀请了哥伦比亚大学的萨拉·伊·马丁教授设计全新的全球竞争力指数(Global Competitiveness Index,GCI)。目前,该评价指标体系已经成为世界上最具影响的国际竞争力评比成果之一。它通过对影响国民经济发展和繁荣的多种因素进行跨国比较并排名,显示各经济体的竞争力强项和弱势,为全球政策制定者和企业领导者提供了决策参考[10]。
2020 年受疫情影响,全球经济受到重挫,世界经济论坛停止发布全球竞争力排名,仅发布了《全球竞争力报告特别版》,对全球经济复苏提供了一些政策建议。因此,目前最新的数据为2019 年10月9 日发布的全球竞争力报告,对全球141 个经济体进行了排名,其中,中国排名第28 位[11]。
《全球竞争力报告》指标体系分为4 个维度[12],即赋能环境(enabling environment)、人力资本(human capital)、市场(markets)以及创新生态系统(innovation ecosystem),每个维度由多个支柱指标构成,政策环境维度包含制度、基础设施、信息通信技术的应用、宏观经济稳定性四个支柱指标;人力资本维度包含健康、技能两个支柱指标,市场维度包含产品市场、劳动力市场、金融体系、市场规模四个支柱指标,创新生态系统维度包含商业活力、创新能力两个支柱指标。每个支柱指标下设有子支柱指标和具体指标,2019 年GCI 共12 个支柱指标、23 个子支柱指标、103 个具体指标。
1.4 《美国科学与工程指标》
1993 年,美国国家科学基金会(National Science Foundation)的决策机构国家科学理事会(National Science Board,NSB)指导推出系列报告《科学与工程指标》(Science &Engineering Indicators,SEI),该报告由美国国家科学和工程统计中心编写,每两年发布一次[13]。报告以量化的指标和分析,反映美国在科学、技术、工程、科学工程类的教育和学术研究以及产业、经济领域的发展水平,并与其他经济体进行比较。报告不提供经济体之间的排名,主要以叙述性文字、数据表和图形方式,来阐明美国与其他经济体在各个领域之间的表现差异。
SEI 报告已经从一份复杂的大报告,转变为一系列精简的主题报告。2020 年美国国家科学理事会陆续发布了中小学数学与科学教育、理工科高等教育、科学与工程劳动力、研究与发展,美国趋势和国际比较、学术研究与发展、出版物,美国趋势和国际比较、知识和技术密集型产业的生产与贸易、科学与技术:公众的态度,知识和兴趣、发明,知识转移与创新9 份主题报告,每份主题报告提供了近期美国和全球主要经济体的主题相关数据[14]。
1.5 《世界竞争力年鉴》
1989 年瑞士国际管理发展学院(International Institute for Management Development,IMD)开 始发布《世界竞争力年鉴》(World Competitiveness Yearbook,WCY),对全球多个经济体进行了评价,该评价指标体系在全球范围内有较强的权威性和影响力。1994 年,IMD 将中国纳入评价范围,随着我国科技创新实力和综合国力的不断提升,我国现已成为IMD 重点关注国家。
WCY 主要为四大要素评价体系(见表1),四大要素分别为经济运行、政府效率、企业效率、基础设施,在每个主要要素下设置了多个子要素,如在基础设施要素下设置有基本基础设施、技术基础设施、科学基础设施、健康与环境、教育五个子要素,每个子要素设置有多个指标,共同构成《世界竞争力年鉴》的评价体系。《2020 年世界竞争力年鉴》对全球63 个经济体进行了排名,其中中国排名第20 位[15]。
表1 《世界竞争力年鉴》评价指标体系
2 国际创新指数比较
通过分析不同评价指标体系中指标的取值发现:不同评价指标体系的数据来源不一样;相同或类似指标的概念范围(分类)不同;描述相同创新要素的指标其统计单位存在差异;同一评价指标体系下,不同评价指标所采用的数据年限不同。为了便于比较,部分评价指标体系在获取原始数据之后,对指标值进行了标准化处理。
2.1 数据来源多样化
根据机构性质的不同,可以将数据来源分为五大类(见表2):第一类是从世界银行、联合国教科文组织、国际货币基金组织、经济合作和发展组织、世界知识产权组织等国际权威组织获得的数据;第二类是各个国家/组织官方数据,如欧盟统计局、欧洲专利局、中国国家统计局;第三类是从Scopus、Web of Science 等大型数据库商处获得的数据,此类数据以论文数据为主;第四类是调查数据,调查数据分两种:一种是由国际组织开展的调查,如世界经济论坛执行的意见调查,欧盟委员会创新调查;另一种是为进行评价而自行开展的调查,如《世界竞争力年鉴》为获取数据而开展的专家调查(IMD World Competitiveness Executive Opinion Survey);第五类是其他机构的研究数据,如EIS 中动机指数来自全球企业家调查报告(Global Entrepreneurship Monitor)。GCI 中科研机构知名度指标则是根据Scimago 世界机构排名数据计算而来。以GII 为例,其硬数据主要来自联合国教科文组织、联合国工业发展组织、世界知识产权组织、世界银行、欧盟委员会联合研究中心、普华永道、汤森路透、HIS Markit、维基媒体基金会以及AppAnnie,综合指数来自世界银行、联合国公共行政全球网络、耶鲁大学以及哥伦比亚大学,调查数据来自世界经济论坛执行意见调查。针对同一类型指标,不同指标体系的来源有所差异,以专利申请量为例,EIS(PCT 专利申请量/十亿购买力平价GDP)、GCI(每百万人口专利族申请量)等专利申请量数据来自经济合作与发展组织(OECD),SEI(本国专利申请量/千亿美元GDP)、GII(本国人专利申请量/十亿购买力平价美元GDP)、WCY(本国人专利申请量)等专利申请量数据来自世界知识产权组织(WIPO)。
表2 不同评价指标体系的数据来源
2.2 统计口径多样化
根据指标的获取方式可以将不同评价体系的指标划分为三种类型:硬数据(hard data)、调查数据(survey questions)、综合指数(composite indicator)。其中,硬数据一般为权威部门统计的客观数据,如WCY 中的国内生产总值(GDP)、SEI 中的国内研发支出总额等;调查数据主要是指从各种调查项目所获取的主观数据,如GII 中“高校/产业研究合作(university/industry research collaboration)”指标来自世界经济论坛执行意见调查,其问题是“在您的国家,企业和高校研发合作密切程度有多大?”。综合指数是指一些国际机构提供的综合类指数型数据,如GCI 指标体系中支柱指标“基础设施”下的“班轮运输连通性(Liner shipping connectivity)”指数即为一个综合类指数型数据,该指标来自联合国贸易和发展会议组织(UNCTAD),能够反映一个国家在全球班轮运输网络中地位。该指数采用标杆法,对标表现最佳的中国,围绕海运的五个组成部分对各个国家的班轮运输绩效进行计算,这五个组成部分是:船舶数量、集装箱承载能力、最大船舶尺寸、服务数量和在一国港口部署集装箱船的公司数量。从图1 可以看出,不同评价指标体系的数据类型份额存在差异,EIS 基本上以硬数据为主;GII 有少量调查数据;GCI 调查数据份额超过了硬数据份额;WCY 调查数据最多,但其份额少于硬数据份额;SEI 仅采用了一个调查数据。
图1 不同评价指标体系中的数据分布
根据统计单位的不同,可以进一步将所有硬数据划分为三类:总量指标、人均指标以及相对指标。总量指标是指该指标的实际值,不对该数值进行任何计算。人均指标包含不同级别的人均,如每百人、每千人。相对指标是指对指标进行了简单的数值计算,即采用十亿购买力平价美元GDP、千亿GDP(美元)、每百万GDP 对其数值进行分数计算。例如,同样是衡量本国人专利申请量,GII采用相对指标“本国人专利申请量/十亿购买力平价美元GDP”,而SEI 采用相对指标“本国人专利申请量/千亿GDP(美元)”。值得一提的是,《世界竞争力年鉴》在对部分创新要素进行评价时,对于同一创新要素,既采用了总量指标也采用了相对指标,例如,在国际贸易子要素下既有“产品出口总额”指标,又有“产品出口总额占GDP 的比重”指标。从表3 中可以看出,不同评价指标体系采用的人均指标和相对指标计算方式存在一定差异,人均指标的规模有百人级、千人级、十万级、百万级等,部分人均指标对年龄范围进行了限制。相对指标的计算方式更加多样化,除了常规的GDP 外,还有贸易总额、科技出版物、企业数量、发文总量等相关领域总额等。
表3 硬数据构成
2.3 概念范围不同
不同指标体系下,部分相同或类似指标的概念范围不同,主要表现为指标定义不同、指标范围不同、指标所描述的对象分类不同。不同评价指标体系均采用了ICT 相关指标来衡量不同国家的互联网基础设施水平,但采用的指标概念略有差异。GCI“移动宽带用户”是指每百人的活跃移动宽带安装数,WCY“移动宽带用户”是指3G 和4G 市场占移动市场的比重,两者的定义完全不一样。EIS“宽带普及率”是指宽带最大下载速度超过100Mb/s的企业比重。WCY“宽带用户”指标是指下载速度高于256kbps的专用网络连接的总数(每千居民)。因不同指标体系依据不同的高技术产品分类,GII 指标“高技术出口净额在贸易总额中的占比”、EIS 指标“中高技术产品出口额占商品出口总额的比重”、SEI 指标“中高研发密集型产品出口额”中对于高/中高技术产品、高/中高研发密集型产品的概念范围不同。EIS 指标体系中中高/高技术产品是根据国际贸易标准分类(第三版)(Standard International Trade Classification,SITC Rev.3)进行划分,具体是编号为266、267、512、513、525、533、54、553、554、562、57、58、591、593、597、598、629、653、671、672、679、71、72、731、733、737、74、751、752、759、76、77、78、79、812、87、88、891的产品,主要包括一些高研发密度的制造业产品。GII 报告中的高技术产品是指高研发密度的产品,这一分类基于国际贸易标准分类(第四版)(Standard International Trade Classification,SITC Rev.4)[16],具体涵盖:航空航天、计算机和办公设备;电子;电信;制药;科研仪器;电机设备;化学;非电力机械;武器装备,其涵盖的产品范围要比EIS 指标体系中的产品范围更具体。《美国科学与工程指标》中的高研发密集型产品包括OECD 分类目录下的航空航天、药品、计算机设备、电子设备和光学产品。WCY 关于高技术产品的指标数据来自世界发展指标(World Development Indicators),其高技术产品分类基于国际贸易标准分类(第三版),具体采用Thomas Hatzichronoglou[17]的工作报告中提到的高技术产品分类,与同样采用SITC Rev.3 的EIS 指标中的分类存在交叉关系。
2.4 数据时限存在差异
根据数据的可获得性,不同评价指标体系针对同一类型指标采用不同年份下的数据,且对于缺失数据的处理方法不一样。2020 年EIS 发布的最新报告中,27 个指标数据中有6 个为2016 年数据,6 个为2017 年数据,6 个为2018 年数据,9 个为2019年数据。2019 年GCI 报告显示103 个指标中42.7%的指标采用了2018~2019 年加权平均数据,21.4%的指标采用了2018 年数据,15.5%的指标采用了2017 年数据,3.9%的指标采用了2019 年数据,3.9%的指标采用了2018~2019 年平均数据,占比很小的其余数据来自更早的年份。GII 中针对同一指标,因为数据的可获得性,不同经济体采用的数据年份不一样,2020 年报告中指标数据采用最多的年份为2018 年,有41 个指标采用了2018 年数据,26 个指标采用了2019 年数据,11 个指标采用了2017 年数据,2 个指标采用了2016 年数据。2020 年SEI 中的数据以2018 年为主,部分指标数据可追溯到1990 年。在同一个表格中,不同国家因数据的可获得性,SEI采用的数据年份也不一样,如在对71 个经济体的研发投入和研发强度进行比较时,大部分经济体采用了2017 年数据,但尼日利亚(Nigeria)采用了2007年数据,摩洛哥(Morocco)与肯尼亚(Kenya)采用了2010 年数据,包含伊朗(Iran)在内的6 个国家采用的是2013 年数据,另外11 个经济体采用了2016 年数据,数据时限的差异增加了各个经济体之间的比较难度。2020 年WCY 中的指标也是根据数据的可获得性,采用了不同年份的数据。
另外,不同评价指标体系对缺失数据的处理方法不一样,EIS 采用8 年时间序列的数据,当序列最后年份数据缺失时,直接采用最近年份的数据补充;当序列中间年份数据缺失时,采用上一年的数据补充;当序列最早年份数据缺失时,采用下一年数据补充。GCI 对于缺失数据的处理有两种方式:一种是采用线性回归分析计算缺失值,一种是采用根据世界银行国家收入分类和国际货币基金组织区域分类划分的同一组别经济体的平均值。GII 对部分指标值进行了标准化处理,因此,当某一指标值空缺时仅标记为“n/a”,不进入排名计算。SEI 因不进行经济体排名,在描述不同经济体的指标表现时,尽可能选择指标数据可获取的经济体,因此在不同指标下,SEI 所采用的数据年份和评价对象均不一样。WCY 指标体系中的缺失值直接采用子要素现有数据的平均值进行填充。
2.5 数据标准化处理
从不同数据来源获得数据之后,部分评价指标体系为了规范数据,对原始数据值进行了标准化处理。
(1)欧洲创新记分牌全部采用相对比较值,即计算当前年份指标原始数值相对于基准年份对应数值的相对值作为最终的指标取值,这一计算方法能够反映各个国家相较于欧盟的比较值,方便比较各个国家的创新绩效。
(2)GII 报告提供了硬数据的原始值,综合指数和调查数据均为标准化数值。在计算子参数时GII采用离差标准化方式(min-max method)对原始数据进行处理,进而计算出投入次级指数、产出次级指数以及综合创新指数[18]。离差标准化过程中最大值是该指标中表现最好的经济体的原始值,最小值是该指标中表现最差的经济体的原始值。受数据标准化影响,当某一经济体指标数值缺失时,其他经济体的数值可能也会受到影响。其计算公式为:
(3)GCI 对其综合数据和硬数据采用了最小-最大规范法(min-max transformation)进行标准化处理,部分数据指标在标准化处理之前进行了对数转换,如2019 年GCI 在衡量一个国家的出版物数量和引用情况时,采用了2016~2018年H指数的平均值,并对其进行对数转换,再采用最小减最大规范法使指标值固定在0~100 之间。不同于GII 报告采用的最小-最大规范法,GCI 计算公式中的最小值是指该指标的最低可接受值,最大值是指该指标的最合适的取值。其计算公式为:
其中,valuei,c表示c国在i指标的原始值,wpi表示i指标的最低可接受值,frontieri表示i指标的最合适的取值。因此,GCI 指标数据标准化过程中最大值、最小值的取值对于指数最终的标准化值影响较大。具体到特定指标,其原始值大并不一定是表现最好的,越接近最合适取值的才是最好的。
(4)WCY 采用了硬数据和调查数据计算经济体的综合排名,并对每个指标进行标准化处理。WCY 采用标准差标准化方式(standard deviation method,SDM)对指标数据进行标准化处理[19],计算每个指标所有经济体的平均值,采用公式计算标准偏差。然后采用经济体的指标原始值减去所有经济体的平均值,将结果除以标准偏差,从而得到每个指标的标准值(standardized value,STD value)。
其中x表示经济体某一指标的原始值,表示该指标下所有经济体的平均值,N表示评价经济体的数量,S表示标准差。由此计算的标准化值在大多数情况下越大越好,例如,国内生产总值标准化值最高的经济体排名第一,标准化值最低的经济体排名最后。然而,对于某些指标,结果完全相反,其中最低值是最具竞争力的,例如,软件盗版。在这种情况下,使用反向排序:标准化值最高的经济体排在最后,标准化值最低的经济体排在第一。
(5)《美国科学与工程指标》不同于其他四个评价指标体系,没有明确的指标体系,仅用图表和文字描述的方式对世界主要国家和美国的创新绩效进行比较,因此未对数据进行标准化处理,而是保持原有数据格式,在不同时间范围内对各个经济体进行比较。
3 主要结论
3.1 主要评价静态竞争力水平
一个经济体的竞争能力不是静态的,而是不断发展变化的。EIS 和SEI 在一定程度上反映了一个经济体的动态发展情况。EIS 以8 年为一个评价时间段,对比分析评价国家在这8 年期间的相对变化情况,但该评价以欧盟国家为主,只选取了部分全球竞争力国家进行了国际比较,且只抽取了部分指标对国际领先的经济体的创新表现进行了比较。SEI 详细分析了一些经济体在数十年间的指标动态表现,如在“出版物:美国趋势和国际比较”主题报告中,对日本、印度、中国、美国、欧盟1996~2018 年科学与工程类论文量进行了比较。遗憾的是这两种评价指标体系并未对全球经济体进行综合比较分析,仅局限于少量具有影响力的国家。
GII、GCI 和WCY 指标数据均采用当前评价年份的最新数据,或者更早期的数据,反映的是各个经济体当前评价年份之前的竞争力表现,未来发展潜力和趋势无法从单一年份的综合排名中看出。
3.2 等权重设置对评价结果的负面影响
上述五个指标体系中,《全球创新指数》《全球竞争力指数》《世界竞争力年鉴》对全球经济体进行了排名。这三个指标体系的指标数量相较《欧洲创新记分牌》更多,全球创新指数80 个指标,全球竞争力指数103 个指标,世界竞争力年鉴338 个指标,三者在进行评价时对每个经济体采用了等权重方法[20],即认为每个指标对国家竞争力的影响力是一样的。但事实上,不同国家或地区的经济发展往往拥有各自的特色,其竞争优势存在较大差异,支持国家提升竞争力的宏观环境也不一致,因此,在同一的框架下对国家创新能力进行评价会导致其结果存在一定偏差。
尽管各个指标体系的数据来源和统计单位不一样,但科技论文发表、国家和企业R&D 投入、专利和商标申请等与科技创新密切相关的指标其数据值在多个指标体系中是保持一致的,最终经济体之间的排名与这些统计指标的排名差异较大,即受到了其他指标数据的影响。WCY 中技术基础设施子要素中信息通信技术相关指标占据了该子要素下总指标数的50%,GII 中信息通信技术相关的指标占到了总指标数的10%,评价指标向信息通信技术的应用情况高度倾斜,信息通信技术行业多为技术密集型企业,这对发展中国家参与国际比较有一定负面影响。
指标评价体系也没有考虑各个国家或地区在文化上的差异,如中国公民普遍采用百度等中国人创建的知识检索网站,而全球创新指数采用的是西方国家普遍使用的维基百科相关数据作为衡量创意产出的一个指标,中国在2019 年“维基百科每月编辑次数/百万人口15~69 岁”指标值仅为0.3,排名111 位。指标“移动应用开发”数据来自IOS 应用商店和Google play 商店,也不适用于中国,2019 年此项指标中国数据缺失,在一定程度上影响了中国在全球范围内的排名。
3.3 产品范围分类不同,对结果产生直接影响
因为指标概念范围、统计单位和数据标准化处理方式的不同,导致产品出口指标评价结果相悖。为保证数据年份一致,本文采用了2020 年GII、2019 年EIS、2020 年SEI 中产品出口相关指标进行比较(见表4)。2020 年GII 研究结果表明,中国的指数值大于日本;2019 年EIS 显示,中国的指数值小于日本,欧盟的指数小于日本(超过了100%);2020 年SEI 显示,欧盟的指数远超过日本,中国的指数超过日本。三个创新评价指标体系在这一指标上得出了完全相反的结论,而在计算经济体的综合竞争力时,指标体系直接采用这些指数值进行计算,由此计算而来的排名或者综合比较需要理性看待。
表4 不同创新评价指标体系的出口数据
3.4 相对指标过多,偏好规模小的经济体
通过对比分析各个评价指标体系的排名结果发现,一些小国或小的经济体的排名靠前。对全球经济影响较大的美国在GII 中排名第三、在GCI 中排名第二、在WCY 中排名第十(见表5)。国家综合创新能力通常被认为是一种体现国家创新能力的重要因素,总量指标才能反映一个国家的创新活动规模。相对指标过多,对规模较小的经济体有一定偏好,会导致一些综合创新实力较强的经济体排名受到影响[21]。排名靠前的瑞士、新加坡、荷兰在某些特定领域或特定行业的创新绩效表现优秀,但是其创新活动的规模和影响力远不及美国、日本和韩国。以“外商直接投资(FDI)净流入占GDP 比重”指标为例,2020 年GII 报告显示中国在该指标的具体值为1.5%,排名第100 位;美国为1.9%,排名第84 位。瑞士、瑞典该指标值分别为3.7%、2.9%,排名远高于中国和美国。而世界发展指标(World Development Indicators)显示中国外商直接投资净流入总额为1 920 亿美元[22]、美国为3 676 亿美元,远远超过瑞士的542 亿美元与瑞典的142 亿美元[23]。
表5 排名前10 的经济体及日韩、金砖国家排名情况
3.5 主观指标来自不同调查数据,影响评价结果
GII 和GCI 中的调查数据来自世界经济论坛执行意见调查,WCY 为获取数据开展了专家调查,EIS中的部分数据来自欧洲社区创新调查。调查样本的选取、样本范围和数量的大小、被调查者的专业性和主观判断以及问卷调查的回收率都会对评价结果产生直接影响。评价体系中包含的调查数据越多,对评价结果的影响就越大。同样采用了调查数据的GCI 和GII 两个评价指标体系,其所采用的调查数据并不完全一样,GCI 指标中共有48 个调查数据,占指标总数的46.6%,而GII 指标中只有4 个调查数据,仅占指标总数的5%。2019 年GCI 中中国排名28 位,同一年发布的GII 中中国排名14 位,中国在两个评价指标体系下的排名差异一定程度上受到调查数据的影响,如在具体指标选择上,GCI 采用了调查数据中的“工资确定的灵活性”指标,中国在该项指标中排名第100 位,对中国的综合排名造成了一定负面影响。
除此之外,不同的数据标准化方式对每个经济体的分值(score)会产生直接影响。不同评价指标体系因采用了不同的标准化方式,同一原始值会计算得出不同的分值,而所有的排名都是根据标准化后的分值(score)进行的,因此,要了解经济体在具体创新环节中的表现,简单地查看每个指标的排名以及分值具有片面性,而是需要进一步获取该经济体在相应指标的原始值。
4 对我国创新评价的启示
(1)谨慎选择指标,赋予不同指标不同权重
单一指标的局限性会导致评价结果的片面性,多指标综合评价已经成为国际创新评价的主流趋势。指标的选择并不是越多越好,在对某一创新维度进行测度时,有必要谨慎选择多样化的指标,反映不同的创新状态。在统一评价框架下,可以考虑根据不同类型经济体的经济发展特征和社会发展模式,结合指标的重要性和可靠性,对不同指标赋予不同的权重。
(2)合理设置总量指标和相对指标
规模大的经济体通常更有利于创新传播,形成更多创新产出,对于全球科技创新的贡献度也更高。因此,在对经济体进行创新评价时不能忽视总量规模的影响力。在指标设置时,要兼顾总量规模和相对规模,合理设置总量指标和相对指标,纳入一些反映创新影响力的总量指标,避免一些规模较小的经济体长期处于评价结果的领先位置,让评价结果更具合理性。
(3)注重潜力指标,瞄准创新动向
目前创新评价指标体系是对当前或过去创新状态的分析评价,可以考虑采用一些能够衡量未来发展潜力的指标,更好地反映一个国家的创新趋势和创新动向。科技创新的核心是人才,创新驱动本质上是人才驱动。关于教育投资、不同年龄阶段的受教育水平的相关指标,体现了国家的人才储备情况,反映了国家未来创新潜力,需要加以重视。目前我国在教育水平相关的指标上存在数据缺失现象,需要进一步完善。信息技术的快速发展和互联网的广泛应用,不但加快了科技创新的速度,还改变了企业盈利模式、人们生活方式和习惯,因此,重视互联网创新,加强对互联网创新指标的研究,对于衡量国家未来发展潜力极其重要。
(4)适当增加定性指标,使评价指标多样化
一些创新要素需要采用定性指标进行测度,例如创新环境,包括政策环境、市场环境等等。目前我国正在协同开展创新活动统计调查与创新能力监测和评价工作[24],在调查实践中的一些定性指标,能够为我国创新评价指标体系提供多样数据来源。在进行创新调查时,需要结合本国国情,参考不同评价指标体系调查数据的设置,客观、公正地设置调查问题、规范调查流程,让定性指标充分反映创新状态。同时,适度调整指标体系中调查数据的比重,将主观影响控制在合适范围。