数据赋能:政府数据开放的技术创新效应研究*
2021-07-20张双志吴珂旭张龙鹏
张双志 吴珂旭 张 睿 张龙鹏
(1.成都大学师范学院 成都 610106;2.电子科技大学公共管理学院 成都 611731)
0 引 言
资本与劳动力是驱动经济增长的重要生产要素。随着数字经济时代的到来,数据已成为与资本和劳动力并驾齐驱的核心生产要素。在数据生态系统中,政府、企业、居民均是数据的重要生产者与消费者,其中政府部门掌握着整个社会80%以上的数据[1]。政府数据蕴含着巨大的经济价值,但由于缺乏数据开放的相关立法,政府所掌握的高价值数据长期处于闲置状态,对经济发展的赋能作用有限。为了激活政府数据的经济价值,自2009年开始全球掀起了“开放政府数据”运动,中国也日益重视政府数据的开放与共享。2020年中共中央国务院颁布的《关于构建更加完善的要素市场化配置体制机制的意见》指出要“加快培育数据要素市场”,将数据视为与土地、劳动力、资本、技术同等重要的生产要素,其中推进政府数据开放共享是培育数据要素市场的重要内容之一。由此可见,中央期望通过政府数据开放共享,激活生产要素市场,为中国经济转型升级赋能。本文将从技术创新的角度实证检验政府数据开放的经济效应。提升国家技术创新能力是加快转变经济发展方式、保持中国经济持续健康发展的必然选择。虽然在部分技术领域中国已经接近世界前沿,甚至引领世界前沿,但在大多数关键核心技术上中国同国际先进水平差距仍较为悬殊,创新能力不够强。因此,本文探讨政府数据开放的技术创新效应对于推动中国政府数据开放和提升国家技术创新能力具有双重重要的现实意义。
现有的文献主要研究了政府数据开放的现状、问题与驱动路径,但对于政府数据开放经济社会绩效的探讨较少。从仅有的少数文献来看,杜振华[1]通过分析政府数据开放与经济增长的内在机理,指出只有政府数据充分开放和高效利用,方能实现经济的创新驱动发展。Mergel等[2]、Lee等[3]、Bedini等[4]等学者虽然把研究视角聚焦到了政府数据开放与创新之间的关系上,并认为政府数据开放对创新具有推动作用,但遗憾的是他们并未实证检验政府数据开放是否真的促进了技术创新,也未进一步探讨诸如政府数据开放的空间溢出效应等问题。除了在经济方面,也有研究发现政府数据开放在社会方面也具有积极的效应。郑燕和廖晓明[5]基于省级面板数据的研究发现,政府数据开放对于公职人员的腐败具有显著的抑制作用。与已有研究相比较,本文研究的边际贡献主要体现在三个方面:第一,文章利用城市层面的数据实证检验了政府数据开放对技术创新的影响,拓展了政府数据开放经济社会绩效评估的文献;第二,研究了政府数据开放的空间溢出效应,检验了一个地区的政府数据开放对其他地区所产生的经济效应;第三,从新型基础设施建设的角度研究如何驱动政府数据开放产生更好的经济社会绩效。
1 中国政府数据开放背景与理论分析
1.1中国政府数据开放背景从政府数据开放政策来看,中国有关政府数据开放的政策始于1994年国家测绘局发布的《行政法规、规章和我国重要地理信息数据发布办法》,对国家测绘局行政法规、规章和中国重要地理信息数据的发布办法做出了相关规定[6],在随后相当长一段时间内中国政府数据开放并没有取得实质性进展。随着互联网的快速发展和广泛应用,社会积累的数据呈爆发式增长,为充分发挥大数据的经济社会价值,2015年8月国务院出台了《促进大数据发展行动纲要》,这份文件提出将推进政府数据开放纳入建设数据强国的重点任务,这才掀起了中国政府数据开放的行动浪潮。随后各部门和各地方政府纷纷出台了一系列推动政府数据开放的政策措施。事实上,地方政府的实践要早于国家层面。在2012年6月,上海已经率先上线了政府数据服务网。北京、广州、武汉、贵阳、宁波、佛山等地也先后积极开展政府数据开放平台的建设。进一步,2020年4月中共中央国务院颁布了《关于构建更加完善的要素市场化配置体制机制的意见》,这份文件指出要加快培育数据要素市场,推进政府数据开放共享,这表明中国已经将政府数据视为生产要素,希望通过推进政府数据开放实现经济的创新发展。
图1 政府数据开放的地区分布
如图1,根据《中国地方政府互联网服务能力发展报告(2019)》的数据显示,中国地方政府数据开放程度的均值为0.007,占满分的比重为38.89%,平均而言中国政府数据开放程度偏低,尚未达到及格率。在334个地级行政区中,政府数据开放得分占满分的比重在60%以上的有173个,占比51.8%。虽然有一半以上的地级行政区得分率在60%以上,但均值得分率依然偏低,这说明地方政府之间的数据开放程度存在显著的差异性。从报告提供的数据来看,有38.32%的地级行政区数据开放得分为零。数据表明,中国政府数据开放还处于起步阶段,后续需要不断提升政府数据开放的规模和质量。
1.2理论分析与研究假设技术创新就是在原有的生产过程中加入新的生产要素和新的生产条件[1],产生新产品、新生产流程、新商业模式等,进而推动经济增长。为实现更高质量的技术创新,主流创新模式已从封闭式创新转向开放式创新[7]。这种创新范式转变的主要特征就是利用有目的的知识流入和流出,加速组织内部创新,并为创新的外部使用扩展市场。要想进行成功的创新,获得知识,创造新知识,并将这些知识传播给他人的能力非常重要[3]。在开放式创新过程中,外部数据将作为新的生产要素进入组织内部的生产体系,与其他生产要素再组合,产生新的化学反应。Thorhildur等[8]指出,当数据变得可用和可访问时,可以将当前知识与不同类型的开放数据进行合成,生成新知识,从而推动组织的技术创新。Erdman等[9]也认为,大数据的发展与应用将克服目前创新中遇到的困境,同时创造新的创新机会。政府作为大数据的主要拥有者,一旦开放其所掌握的数据,将会有更多的海量数据融入经济社会的生产体系,为经济的创新发展创造条件。Lee等[3]的实证研究发现,政府数据开放将有助于推动知识的吸收、创造和传播,进而促进以知识为基础的技术创新的发展。Bedini等[4]更是将政府开放的数据作为促进创新发展的基础设施,为企业(尤其是中小型企业)创造创新空间的工具。基于上述分析,可以得到本文的第一个研究假设:
假设1:政府数据开放具有显著的技术创新促进效应。
一旦政府部门通过互联网平台开放其所掌握的大数据,那就意味着数据将不再受地理空间的限制,任何需要政府大数据的创新主体都可以使用,不仅辖区内的创新主体可以使用,辖区外的创新主体也可以使用。因此,政府数据开放具有显著的空间溢出效应,这就有可能使得一个地区政府开放数据会促进其他地区技术创新水平的提升。此外,中国地方政府间存在明显的制度或政策创新的府际竞争[10]。一旦某个地区出现值得借鉴的公共政策或措施,其他地区将会跟踪、学习和模仿,使得这一公共政策或措施得以在一定区域范围扩散,发挥更大的政策效应。汤志伟等[10]的实证研究指出,邻里效应是影响地方政府互联网服务能力的重要因素之一,当其他地方政府不断提升互联网服务能力时,该地方也会加强自身的互联网服务能力建设。马亮[11]的实证研究也支持了区域扩散效应将对电子政务产生显著的正向影响。因此,当部分地方政府实施政府数据开放运动,并不断提升数据开放质量时,其他地方政府也会跟进,从而使得政府数据开放规模越来越大,质量越来越高,并通过空间溢出机制推动中国区域科技创新水平的整体提升。通过上述分析,本文的第二研究假设为:
假设2:政府数据开放将通过空间溢出机制促进技术创新水平的提升。
以云平台、大数据中心、5G、人工智能、工业互联网、物联网等为代表的新型基础设施已成为中国基础设施建设的新方向和重点内容。新型基础设施的建设一方面将会改变创新资源的组合与连接方式,降低创新过程中的交易、契约、代理与治理成本以及创新认知差异,进而促进技术创新[12];另一方面将会与政府数据开放产生互动效应,增强技术创新的促进效应。从新型基础设施建设与政府数据开放的互动来看,一方面新型基础设施建设是政府数据生产、收集、使用和转化实现的重要基础[13],有实证研究也证实了信息基础设施建设对政府数据开放具有显著的推动效应[13],因此随着新型基础设施建设工作的推进,将有助于政府数据的高质量开放,从而推动更高水平的技术创新。另一方面,新型基础设施的建设同样依赖于大数据。没有大数据的持续供给,新型基础设施的建设也将受到明显的制约。由于大部分关键的海量数据掌握在政府手里,如金融数据、交通数据、天气数据、政府投资数据等,因此如果政府部门能够实现高水平的政府数据开放,也将会推动新型基础设施的建设,进而促进技术创新水平的提升。基于上述分析,可以得到本文的第三个研究假设:
假设3:新型基础设施与政府数据开放具有显著的互动效应,两者将增强彼此对技术创新的促进作用。
2 研究设计
2.1数据来源本文的数据来源于三个方面。首先,政府数据开放的度量数据来自于中国社科院信息化研究中心和国脉互联智慧城市研究中心联合联合发布的2014-2016年“中国智慧城市发展水平评估报告”。由于中国政府数据开放仍处于探索阶段,评估报告每年会根据政府数据开放的实践调整评价内容,这就使得各年份的政府数据开放指数并不具有完全的可比性,因此本文主要使用分年份的截面数据进行实证研究,并以2016年的样本为主。2016年共评估了中国201个城市的智慧城市建设情况。其次,城市创新的度量来自于寇宗来和刘学悦[14]的研究报告。该研究报告汇报了338个城市2001-2016年的城市创新指数。最后,控制变量的数据来自于历年的中国科技统计年鉴。
2.2计量模型与变量说明本文构建如下所示的多元回归模型,利用城市层面数据实证检验政府数据开放对技术创新的影响。由于数据来源的限制,本文综合使用截面数据和混合数据进行实证研究,因此在使用截面数据时,计量模型中不包括时间维度,在使用混合数据时,包括时间维度,并控制相应的城市固定效应或时间固定效应。
Innovationit=α0+α1Datait+βCtrit+εit
(1)
其中,t表示年份,i代表城市,εit为随机误差项,其余变量的详细说明如下:
Innovation为被解释变量,代表技术创新。寇宗来和刘学悦[14]基于企业发明专利,通过专利更新模型计算了专利的价值,进而将每个专利的价值加总到城市层面,得到城市创新指数。由于企业创新形式的多样性,还通过新成立企业数据计算了城市创业指数。将创新指数与创业指数结合起来得到衡量城市技术创新能力的城市创新力指数。由此可见,寇宗来和刘学悦[14]构造的城市创新力指数不仅反映了城市技术创新的活力,更反映了企业技术创新的质量和价值。Popp[15]、蔡勇峰等[16]等人也使用了专利价值来衡量技术创新能力,只不过他们利用的是专利引文数量来度量专利价值,相比之下,本文的代理变量更为全面和准确。实证研究中,创新指数取自然对数。
Data为文章关注的核心解释变量,代表政府数据开放水平。政府数据开放的度量指数直接来源于“中国智慧城市发展水平评估报告”。该报告从数据开放平台服务渠道的建设情况和信息获取的便捷性等方面考察政府数据开放水平。
Ctr代表控制变量,用以缓解由遗漏重要解释变量所带来的内生性问题。参考于张龙鹏等[17]的研究,本文控制了以下城市层面的控制变量。a.人口密度。人口密度定义为每平方公里的常住人口数。b.财政支出。城市财政支出水平定义为财政支出占地区生产总值的比重。c.科技财政支出。利用科技财政支出占财政支出的比重来衡量城市的科技财政支出水平,同时也表征财政支出结构。d.对外开放。本文利用外商直接投资占地区生产总值的比重衡量城市的对外开放水平。e.人力资本。人力资本水平利用每万人在校大学生人数来度量。f.信息化水平。信息化水平利用每百人中移动电话用户数来度量。这里需要说明的是,截止到2016年中国每百人移动电话用户数为96.2,几乎人手一部移动电话,但本文依然选用该指标衡量城市信息化水平的理由有以下两点:一是在城市层面,收集其他度量信息化水平的指标数据较为困难,有些城市数据会缺失,带来样本量的减少;二是中国地区间存在显著的信息化差异,有些地区移动电话普及率还未达到100%,所以该指标能够在一定程度上反映城市间的信息化水平差异。
3 实证结果与分析
3.1基本回归结果虽然中国社科院信息化研究中心和国脉互联智慧城市研究中心分年度测算了主要城市的政府数据公开水平,但由于每年的测评标准有所变动,这就导致各年政府数据公开水平的测评值缺乏可比性,因此本文分各年样本探讨政府数据开放与技术创新之间的关系。根据公式(1)所示的计量模型,本文采用普通最小二乘法(OLS)和城市层面数据估计了政府数据公开对技术创新的影响,基本回归结果如表1所示。表1样本中,如第(1)列所示,在不添加任何控制变量的条件下,政府数据开放的估计系数在1%的显著性水平上为正,表明城市政府数据开放与技术创新之间存在显著的正相关关系。由于存在遗漏重要解释变量所带来的内生性问题,我们还需要进一步控制相关变量,才能得出可靠的因果关系。进一步,第(2)列加入了人口密度、财政支出、信息化水平等控制变量。在此情形下,政府数据开放的估计系数依然显著为正,这表明政府数据开放水平的提升具有显著的技术创新促进效应。在2015年和2014年样本中,无论是否加入控制变量,政府数据开放的估计系数依然为正,且通过了1%的显著性检验。基于第(2)列、第(4)列和第(6)列的估计结果,我们可以认为政府数据开放能够显著推动城市技术创新能力的提升,研究假设1成立。
表1 基本回归结果
3.2稳健性检验表1所示的分年份的回归已经基本表明政府数据公开具有显著的技术创新效应,但基本回归结果还受到一系列因素的影响,如时间因素、研究样本、指标度量等,因此本文将考虑这些影响因素,以检验研究结论的稳健性。
3.2.1 更改研究样本与度量指标 度量指标和研究样本的差异会影响研究结论的稳健性,因此本文将更改研究样本和度量指标以检验研究结论的稳健性。由电子科技大学智慧治理研究中心发布的《中国地方政府互联网服务能力发展报告(2018)》测算了中国334个地级行政区2017年的政府数据开放程度,因此本文利用该报告中的测算指标重新度量地区的政府数据开放,同时也扩充了研究样本。此外,本文还利用城市每万人申请的发明专利数重新度量技术创新水平。更改研究样本和度量指标后的回归结果如表2的第(1)列所示。回归结果显示,政府数据开放的估计系数在10%的显著性水平上为正,说明更换研究样本和度量指标后,政府数据开放促进技术创新的结论是稳健的。由于发明专利度量的是更高质量的技术创新,因此估计结果还表明政府数据开放有利于提升技术创新的质量。
3.2.2 内生性处理 遗漏重要解释变量导致的内生性处理。政府数据公开和城市技术创新能力都会受到时间因素的影响,如果遗漏这一重要的解释变量,可能会产生较为严重的内生性问题。为解决这一问题,本文将2014年与2015年的样本组成混合样本数据,重新估计政府数据公开对技术创新的影响。这主要是因为根据中国智慧城市发展水平评估报告,2014年与2015年政府数据公开的评估指标没有发生变化,可以构成两期混合数据。考虑时间因素的估计结果如表2的第(2)列所示。在回归中,本文进一步控制了年份固定效应。控制年份固定效应后,政府数据开放的估计系数在1%的显著性水平上为正,这表明基本回归的研究结论在考虑时间因素后依然成立。
表2 稳健性检验
双向因果关系导致的内生性处理。内生性来源的另一个重要渠道为双向因果关系,也即是有可能是技术创新水平高的城市更愿意提升政府数据开放程度。为排除双向因果关系导致的内生性问题,本文基于2016年的样本,利用2016年政府数据开放变量的滞后一期作为工具变量,然后使用两阶段最小二乘法(2SLS)重新估计政府数据开放对技术创新的影响,回归结果见表2的第(3)列。回归结果显示,采用工具变量回归后,政府数据开放的估计系数依然显著为正,城市的政府数据开放程度越高,技术创新水平也就越高。
4 进一步的分析
4.1政府数据开放、空间溢出效应与技术创新如果政府数据开放对技术创新影响的空间溢出机制是存在的,那么我们就应该看到其他城市的政府数据开放会对本城市的技术创新产生显著的影响。因此,参考Ling等[18]、余丽甜和詹宇波[19]的做法,本文计算了省内初本市外其他城市政府数据开放程度的均值来度量省内其他城市政府数据开放程度的情况,相应的回归结果如表3的第(1)列所示。回归结果显示,省内其他城市政府数据开放的估计系数为正,且通过了1%的显著性检验,这表明随着省内其他城市政府数据开放程度的上升,本城市的技术创新水平也将随之提高,政府数据开放将通过空间溢出机制促进技术创新水平的提升,研究假设2得以验证。此外,值得注意的是,省内其他城市政府数据开放的估计系数(11.4891)远大于本市政府数据开放的估计系数(0.2715),这说明政府数据开放需要地区之间形成协同开放态势,单靠一个地区的政府数据开放难以产生颠覆式的技术创新效应。
表3 进一步分析的回归结果
4.2新型基础设施建设、政府数据开放与技术创新2016年“中国智慧城市发展水平评估报告”中的“城市云平台应用情况”指标用来考察城市云基础设施建设及其集约化水平,因此本文利用该指标作为城市新型基础设施建设的代理变量,以探讨新型基础设施建设与政府数据开放的交互效应对技术创新的影响,基于2016年的回归结果如表3的第(2)列和第(3)列所示。在表3的第(2)列中,新型基础设施建设的估计系数在1%的显著性水平为正,说明以云平台建设为代表的新型基础设施建设确定推动了城市的技术创新。进一步,为了考察新型基础设施建设与政府数据开放对技术创新的影响,本文在表3的第(3)列中加入了新型基础设施建设与政府数据开放的交互项。回归结果显示,交互项的估计结果为正,且通过了1%的显著性检验,这表明新型基础设施建设有助于提升政府数据开放的技术创新促进效应,相应地,政府数据开放也有助于增强新型基础设施建设的技术创新促进效应,因而本文的第三个研究假设得以验证。
5 结论与政策启示
本文从技术创新的角度实证检验了政府数据开放的经济效应,将政府数据开放研究的文献从驱动路径研究往绩效评估方向推进。基于中国城市层面数据的经验研究表明,政府数据开放能够显著提升技术创新的质量和商业价值,加强政府数据开放有助于实现中国经济的创新驱动发展。经更换研究样本和度量指标、考虑遗漏重要解释变量、工具变量回归等稳健性检验,政府数据开放对技术创新的促进作用依然成立。此外,本文的研究还发现:政府数据开放的技术创新促进作用存在空间溢出效应,一个地区的政府数据开放将会推动其他地区技术创新水平的提升;新型基础设施建设与政府数据开放存在显著的互动效应,他们能够增强彼此的技术创新驱动效应。基于本文的研究结论,可以得到如下的政策启示。
第一,推动政府数据开放由数量型向质量型转变。复旦大学数字与移动治理实验室发布的“中国地方政府数据开放报告2019上半年”的数据显示,全国开放数据集总量从2017年的8398个增加到2019年的62801个,增幅近七倍。虽然地方政府向社会开放的数据量在不断增长,但开放的数据质量仍有待提升,许多具有更高创新价值的原始数据仍未向社会开放。各地需要进一步鼓励更多的职能部门参与到政府数据开放的进程中,这样有助于增加数据内容的多样性,同时要求各部门开放更高质量的原始大数据,而非处理后的碎片化低质量数据。
第二,推动地区间政府数据开放的协同发展。实证研究指出,相比本地区的政府数据开放,其他地区的政府数据开放更能推动该地区技术创新水平的提升,这也就意味着地区间政府数据开放的协同发展,将使得技术创新主体能够在更大的地理空间获得政府大数据资源,进而推动技术创新水平的提升。然而,本文的研究也发现,中国政府数据开放存在显著的地区差异,有相当多地级行政区的政府数据开放仍处于较低的水平。当前各主要城市已经开通了数据开放平台,主动开放政府所掌握的部分数据资源,但由各城市建设自己的数据开放平台,一方面并不利于缩小地区间的政府数据开放程度,另一方面也会带来平台建设资源的浪费,因此本文认为应在国家层面出台数据开放平台的建设标准,由省级政府统一建设数据开放平台,汇集各地区政府大数据,向社会开放高质量的政府大数据。
第三,积极推进新型基础设施建设。本文的研究发现加快新型基础设施建设将有助于扩大政府数据开放的规模和提升政府数据开放的质量,进而增强政府数据开放的技术创新促进效应,新型基础设施是数据驱动创新的重要基础,因此需要积极推进新型基础设施建设。新型基础设施的建设包括两个层面:一个层面是加快5G、人工智能、区块链、大数据中心、云平台等新型基础设施的建设;另一个层面是推动新一代信息技术与传统基础设施的深度融合,发展工业物联网、车联网、城市感知设施等传统基础设施的升级版。