政府数据开放何以赋能企业创新?※
2024-04-09张吉昌龙静
张吉昌 龙静
内容提要:公共数据具有技术创新和公共资源的双重属性,政府数据开放是推进数字经济战略和数字政府建设的重大举措。以省级政府建立公共数据开放平台为准自然实验,基于2007-2021年中国沪深A股上市公司数据,利用多时点双重差分法实证检验政府数据开放对企业创新的影响。研究发现,政府数据开放显著正向影响企业创新,其作用机制在于通过提升企业营运效率、推动企业数字化转型、缓解企业融资约束来提升企业创新水平;政府数据开放对企业创新的积极作用在市场公平竞争环境较好的地区、经济发展水平相对落后的地区、国有企业以及大规模企业中更加明显;进一步研究表明,政府开放数据质量维度中的政策保障力度与开放数据质量显著正向影响企业创新,而平台建设质量对企业创新的影响还未凸显。鉴于此,企业应该实时关注政府建设的开放数据平台,充分高效利用政府开放的公共数据提升企业创新水平;政府应该积极建设公共数据开放平台,重视公共数据开放对不同地区与不同企业的异质性影响,赋能企业开展高质量创新。
一、 引 言
2019年中共十九届四中全会首次将数据列为生产要素。数据被视为数字经济时代背景下的“新石油”“金矿”,其能有效连接现有生产要素(谢康等,2020),为微观企业的产品和服务开发提供肥沃的土壤,对提升企业创新水平具有重要意义(徐翔等,2023;Mergel等,2018)。中国各级政府部门在履行公共职责的过程中,掌握了大量关键性、基础性、权威性信息数据资源,这类公众数据具有“技术创新”和“公共资源”的双重属性,会对市场主体创新发挥引领和激活作用(方锦程等,2023)。市场对公共数据开放的需求日益强烈,中国也高度重视政府开放数据对创新的推动作用。2017年12月9日,习近平总书记在主持中共中央政治局第二次集体学习时强调,要坚持数据开放、市场主导,以数据为纽带促进产学研深度融合,形成数据驱动型创新体系和发展模式。2022年12月2日,中共中央国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》,提出合理降低市场主体获取数据的门槛,增强数据要素共享性、普惠性,激励创新创业创造。在国家政策引领下,各级政府不断开通政府数据开放平台,将公开数据整理为常用格式,归类上传至平台并设置数据调用接口,供社会公众免费浏览、查询与下载(彭远怀,2023)。众多企业利用政府开放的公共数据创造了优质的创新成果(张莉和林安然,2023),例如浙江省的人人巴士与高德地图(停车场板块),贵州省的货车帮、贵健康、慧停车,广东省的腾讯乘车码、小区罗盘、智慧通勤。在此背景下,如何评估和解释政府数据开放对企业创新的赋能作用,成为学术研究、企业实践与政策制定等领域共同关注的重大现实问题。
学术界对政府数据开放的探讨由来已久,早期文献主要以定性研究为主,主要是基于理论思辨的视角研究政府数据开放的概念内涵、决定因素、治理体系与制度基础(Conradie和Choenni,2014;Attard等,2015;Yang等,2015)。近年来,随着政府数据开放实践不断推进,部分学者开始定量检验政府数据开放的经济效应。相关实证研究表明,政府数据开放在促进区域协调(方锦程等,2023)、提高经济高质量发展(张莉和林安然,2023)、提升企业全要素生产率(彭远怀,2023)与企业绩效(Zhou等,2023)、赋能数字化创业(Zhang等,2022)等方面发挥了积极正向作用。然而,有关政府数据开放对企业创新的影响以及作用机制,国内外现有文献并未给予充分关注(Mergel等,2018)。鉴于此,本文以2007-2021年中国沪深两市A股上市企业为样本,将政府数据开放平台开通视为外生冲击,采用多时点双重差分法实证检验政府数据开放对企业创新的影响效应、作用机制以及边界条件。
本文的研究贡献主要包括以下四个方面:第一,本文从政府数据开放视角为企业创新的影响因素研究提供新的实证证据和文献补充。以往研究主要从企业本身拥有的数据要素出发,探讨数据与企业创新的关系。第二,本文从企业创新视角拓展了政府数据开放的影响效应研究。评估政府数据开放的经济效应是学术研究、企业实践与政策制定等领域共同关心的重大现实问题。方锦程等(2023)呼吁后续学者从企业层面深入探讨政府数据开放如何赋能实体经济发展,Mergel等(2018)更是具体地强调后续研究应该探讨政府数据开放引发的创新效应,本文是对上述研究呼吁的有力回应。第三,本文提出并验证了政府数据开放通过提升企业营运效率、推动企业数字化转型与缓解企业融资约束来促进企业创新,厘清了政府数据开放影响企业创新的作用机理。第四,本文从地区环境与企业属性层面拓展了政府数据开放与企业创新的边界条件研究。
二、 制度背景与文献综述
1. 中国政府数据开放的发展历史及现状
随着大数据时代的到来,中国高度重视数据要素在市场中的流通和供给。2015年9月,《国务院关于印发促进大数据发展行动纲要的通知》指出,政府通过推动公共数据开放不仅可以带动以企业为主的市场主体进行数据采集和开放,而且可以有效缓解数据要素在市场中的供给不足问题。早在2012年,《上海市政府工作报告》即提出推进政府部门向社会公众开放经济社会发展数据与各类基础政务数据。同年,上海市建立上海公共数据开放平台,向社会公众免费提供城市建设、民生服务、经济建设、教育科技、资源环境、卫生健康、公共安全、文化休闲、道路交通、信用服务、机构团体、社会发展等原始数据,这是国内开通的第一个省级政府公共数据开放平台。随后,北京市、浙江省、贵州省、广东省等省级政府陆续开通数据开放平台。截至2021年,中国已有24个省级政府开通政府数据开放平台。社会主体可以以极低的成本和非常便捷的获取渠道来采集基础性、权威性、关键性公共数据。社会主体也可以将规范的数据集上传至数据开放平台,通过平台审核后可以对外开放,进一步丰富公共数据。从政府数据开放平台的实践来看,浙江省、贵州省等省级数据开放平台都开通了数据利用反馈渠道,鼓励社会主体提交基于政府开放数据打造的成果。政府对外展示这类创新成果,会对社会主体产生极强的激励作用,吸引更多社会主体基于自身需要挖掘公共数据价值。因此,政府开放的公共数据为市场主体注入了丰富的数据生产要素,预计会对企业成长、产业转型以及经济高质量发展产生重要的推动作用(方锦程等,2023)。综上可知,数据开放平台产生的经济效应不仅是学术研究关注的理论问题,同时也是政府部门关注的重要议题。
2. 文献综述
(1) 数据要素与企业创新的关系。熊彼特认为创新是“组合的艺术”,即把生产资料以不同方式进行组合,形成新产品、新生产方式、新市场、新生产资料与新组织形式的行为。数据作为新型生产要素,可以与劳动、土地、资本等传统生产要素进行组合,对创新起到倍增、叠加效应(谢康等,2020)。根据数据要素的来源,可以将现有关于数据要素与企业创新的文献划分为两类。第一类文献探讨了企业层面的数据要素对企业创新的影响。肖静华等(2018)发现,企业通过采集和利用消费者大数据,将企业的研发决策逻辑从依靠人的经验判断转变为依靠人与数据的结合,从而实现企业创新。Bessen等(2022)发现,拥有专有数据的人工智能初创企业,其投入的可模仿性和不完全替代性较低,可以创造出弹性较小、差异化较大的产品。徐翔等(2023)发现大型企业由于拥有庞大的用户基础,可以通过滚雪球的方式积累和利用用户数据,开展迭代式创新。宋炜等(2023)基于中国工业企业数据,实证研究发现数据要素会提升企业创新绩效。第二类文献探讨了政府层面的数据要素对企业创新的影响。Jetzek等(2014)从理论思辨视角探讨了政府数据对企业创新的赋能作用。Beraja等(2023)研究发现,人工智能企业创新和国家监管水平相辅相成,政府为了提高国家治安水平会更多地采购面部识别类人工智能产品,而这些产品的采购以及政府数据的供给能够进一步促进人工智能企业的创新。
(2) 政府数据开放的影响效果。政府数据开放是指政府通过向社会提供公共数据来增强信息透明度、问责机制和价值创造的一项政策(Zhou等,2023)。政府的职能部门在履职过程中会产生和积累大量的数据和信息。政府通过向社会开放公共数据,可以让公民感受到政府部门的透明和负责,还可以促进商业创造和以公民为中心的服务创新。学术界对于政府数据开放研究由来已久。早期研究主要是从理论思辨和案例分析的视角来探讨政府数据开放的经济价值。例如,Ahmadi等(2016)探讨了政府数据开放对经济增长的贡献。在各国大力倡导共享数据资源的背景下,越来越多的政府开始主动对外开放数据(Zhang等,2022),这为政府数据开放的影响效应研究提供了数据支持,相关定量研究也不断涌现。本文将这类定量研究文献分为两类。第一类文献聚焦于政府数据开放的宏观经济效应,检验政府数据开放对区域发展的影响。方锦程等(2023)发现,公共数据开放会打破区域信息壁垒、缩小区域资源禀赋差距,从而促进区域协调发展。张莉和林安然(2023)发现,政府数据开放会降低信息不对称程度、减少企业的创新成本,从而促进经济高质量发展。第二类文献聚焦于政府数据开放引致的微观经济效应,检验政府数据开放对企业行为和绩效的影响。彭远怀(2023)发现,政府数据开放通过优化营商环境、增强企业能力、促进高质量创新,从而提升企业全要素生产率。戴魁早等(2023)发现,政府数据开放可以通过优化要素资源配置、降低交易成本、提高管理效率,从而提升企业生产效率。Zhang等(2022)指出政府数据开放与外部环境以及创业基础的匹配会产生数字驱动型创业。Zhou等(2023)提出政府数据开放政策可以显著提升企业绩效。
基于上述文献分析,本文发现现有文献还存在以下研究不足。第一,现有文献主要聚焦于企业层面的数据要素对企业创新的赋能作用(徐翔等,2023),较少关注政府开放的公共数据对企业创新的影响。第二,政府数据开放的经济价值是当前学术研究的热点(Ahmadi等,2016),相比于探讨政府为何要开放数据,关注政府数据开放的价值创造作用可能更为重要(Conradie和Choenni,2014),但政府数据开放的定量研究才刚刚起步,只有少数学者定量评估了政府数据开放的经济效应(方锦程等,2023;张莉和林安然,2023;彭远怀,2023),鲜有研究评估政府数据开放对企业创新的影响效应、作用机制与边界条件。Mergel等(2018)进一步强调政府数据开放可以引发大量有价值的创新,并指出需要在这方面开展进一步研究,以拓宽和加强现有知识。为弥补上述研究缺口,本文将政府数据开放的行为视为外生事件,定量评估政府数据开放对企业创新的赋能效应、作用机制与边界条件。
三、 理论分析与研究假设
1. 基准效应分析
在数字经济蓬勃发展的时代背景下,数据已成为新型生产要素,是企业不可或缺的生产资料。与传统基础资源不同,数据要素具有可复制性、共享性和非稀缺性等优势。数据在现代经济中的重要作用虽然得到普遍认可,但是能够获得的数据才可以被利用,才能发挥数据价值。政府数据开放是推进数字经济战略和数字政府建设的重大举措,不仅是一项数据共享措施,更是推动企业创新、经济增长的新引擎,被公认为能创造可观的社会经济价值(韩啸和吴金鹏,2020)。这种理念的核心在于将政府数据置于各类市场主体的可访问权限之内,企业能够借助这些数据创新产品与服务,为客户提供全新、高效的解决方案,进而实现价值创造。企业获得更多开放数据在一定程度上象征其拥有更多的新型生产要素,通过与传统生产要素进行融合,可以最大程度激发数据价值和企业创新活力(谢康等,2020;史丹和孙光林,2022)。第一,政府数据开放促使企业基于数据开展创新决策(Jetzek等,2014)。政府数据的类型多样、信息含量丰富,可以成为企业创新决策的基础。从现有开放的数据平台来看,数据类型大致有生产资料数据、产品市场数据、政府政务公开数据、经济社会统计数据等。生产资料数据和产品市场数据有助于企业把控产品质量和了解行业发展状况,政务数据和统计数据有利于企业分析行业前景和市场需求动向。企业可以快速响应市场变化与新兴趋势,调整其创新战略和运营策略,在动态的市场环境中实现敏捷式创新。第二,政府数据开放有利于降低企业获取外部知识的创新成本(张莉和林安然,2023)。在政府未建立数据开放平台之前,企业想要获取公共数据的难度和成本较大,一般需要建立专业团队或者求助第三方数据收集机构来获取部分公共数据。相对于数据方案供应商,政府以更低的成本和更简便的获取方式提供真实、完整和稀缺的公共数据,降低企业获取外部知识的创新成本,能加速产品和服务的创新。第三,政府数据开放会激活企业的创新创业精神(Huber等,2022)。开放政府数据拓宽了企业可以进入的业务领域,为有抱负的企业家和初创企业提供有价值的信息来验证商业想法,从而激活企业的创新创业精神(Huber等,2022)。企业可以利用公共数据来发现新的市场机会、制定商业计划和开发创新解决方案。同时,开放政府数据促进了政府和企业之间的合作,政府鼓励创新者利用其提供的数据资源推出创新项目来解决社会公众难题(Jetzek等,2014)。例如,政府通过采购面部识别类人工智能产品并为人工智能企业提供人口统计数据的做法显著促进了人工智能企业的产品研发和创新(Beraja等,2023)。基于上述分析,本文提出假设:
H1:政府数据开放正向影响企业创新。
2. 影响机制分析
(1) 提升企业营运效率。政府数据开放能够提升企业营运效率,进而提升企业创新水平。首先,政府数据开放可以有效提升企业营运效率。企业可以将自身数据资产与政府开放数据进行融合使用,创建面向市场和行业的全方位数据资源,优化企业决策。政府提供的经济调查、人口统计和社会发展数据可以为企业提供有价值的市场洞察和趋势预测。企业可以利用这些数据识别新的市场机会、了解行业潜在的客户需求,发现尚未满足的市场空白(Magalhaes和Roseira,2020),在合作伙伴寻找、工厂和仓库选址、产品开发、市场进入和整体业务规划等方面作出快速和有效的决策,从而提高运营效率(陈剑等,2020)。同时,企业可以分析公共数据中的监管变化、经济指标和环境条件等因素,以识别和降低潜在运营风险,确保更稳定、更高效的运营(Jetzek等,2014)。其次,营运效率的提高有利于增强企业创新能力。营运效率的提高可以帮助企业降低经营成本、提高生产效率,从而为创新提供更多的资源支持,如增加研发投资、更新设备技术与优化人力资本结构(彭远怀,2023)。营运效率高的企业可以更快地获取市场信息并快速调整生产和销售策略,以更好地满足消费者需求,从而提高市场占有率和创新积极性。此外,营运效率的提高还可以帮助企业更好地识别和应对市场风险、信用风险等,企业可以更好适应不断变化的商业环境,从而降低创新失败风险,增加创新成功率。基于上述分析,本文提出假设:
H2:政府数据开放能够提升企业营运效率,进而正向影响企业创新。
(2) 推动企业数字化转型。政府数据开放能够推动企业数字化转型,进而提升企业创新水平。首先,政府数据开放会积极影响企业数字化转型。政府数据开放本身也是政府数字化转型的一种表现,会对企业数字化转型起到倒逼和引领作用。政府数据开放对企业认知过程中的信息扫描、诊断和选择产生重要影响,促使企业将注意力转向数字技术应用与数字创新(Wang等,2023),增强企业对数字化资源的投入和利用。企业通过采集、存储、计算内外部数据,将数据用于预测和决策,逐步实现能力升级,从而改变生产制造模式或者管理模式,做到数字化感知、决策与进化。其次,数字化转型会积极影响企业创新水平。数字化转型拉近了企业与消费者的距离,增强了企业识别和感知市场创新机会的能力。企业可以利用机器学习、大数据技术深入挖掘和分析市场数据、消费者反馈和竞争信息,吸收数据中隐含的信息和知识,有助于开发新产品、服务或市场领域,支撑业务决策和创新业务开展。企业通过建立数字化研发平台,可以将以往需要在物理世界开展试验的项目转移到数字化空间,以较低的成本和高效率来测试、开发、验证创新过程,提升创新效率(张吉昌和龙静,2022)。基于上述分析,本文提出假设:
H3:政府数据开放能够推动企业数字化转型,进而正向影响企业创新。
(3) 缓解企业融资约束。政府数据开放能够缓解企业融资约束,进而提升企业创新水平。首先,政府数据开放会缓解企业融资约束。政府部门在履行职责的过程中掌握了有关企业真实经营状况的原始信息,政府数据开放平台通过整合与企业经营行为相关的原始信息构建数据库,可以与金融机构建立企业信用信息共享机制。金融机构基于信用信息共享机制对企业信用进行精准画像,能更加全面地了解企业的经营状况和信用水平,极大地降低金融部门与企业主体之间的信息不对称程度,推动数字金融的快速发展(张莉和林安然,2023)。政府数据公开政策鼓励征信机构提供基于企业运营数据等多种数据要素的多样化和个性化的征信服务与融资方案,可以支持实体经济企业特别是中小企业开展信用融资。例如,2019年上海市与浙江省为银行发放贷款提供政府数据支持,均在数据开放平台推出众多普惠金融应用。其次,融资约束的缓解有利于企业创新。由于企业创新具有较高的不确定性、风险性,因此需要更多的资金来支持探索行为和承担创新成本。企业在资金充足的前提下,会更愿意研究与开发具有竞争优势的技术与产品。充足的财务资源使企业能够招聘技术人才、购买研发设备,能有效支持企业尝试新想法、开发新产品与新服务以及开拓新市场(李晓龙和冉光和,2021)。基于上述分析,本文提出假设:
H4:政府数据开放能够缓解企业融资约束,进而正向影响企业创新。
3. 调节效应分析
政府数据开放对企业创新的赋能效应受到内外部情境的影响(张莉和林安然,2023;Huber等,2022;Zhou等,2023)。本文从区域环境异质性与企业属性异质性出发,研究市场公平竞争环境、地区经济发展水平、企业性质与企业规模对政府数据开放与企业创新的调节效应。
从获取和利用公共数据的外部情境来看,不同区域环境中的企业对获取和利用公共数据的动力和效果存在差异。一方面,政府希望吸引更多社会主体基于自身需要挖掘公共数据价值。因此,在市场竞争环境更加公平的地区,所有企业都能公平、公正地在市场中开展竞争,企业会更有动力获取和利用公共数据资源来开展创新以提升市场竞争力。另一方面,政府数据开放的目的是让社会主体共享数据红利,但是不同经济发展水平地区的数字经济发展存在“数字鸿沟”,即经济发展水平较差地区的数据要素禀赋较弱。因此,政府数据开放对不同经济发展水平地区的企业的创新赋能效应存在差异。类似地,Huber等(2022)讨论了制度环境对政府数据开放与创业的调节作用。因此,本文探讨市场竞争环境和地区经济发展水平两个外部环境变量对政府数据开放与企业创新的调节作用。
从获取和利用公共数据的内部情境来看,不同属性的企业对获取和利用公共数据的动力与能力存在差异。一方面,相对于民营企业,国有企业对政府政策的响应程度更强。因此,国有企业更有动力响应政府数据开放政策,且目前的开放数据类型更契合国有企业的业务范畴。另一方面,企业规模越大,越有资源和能力对庞大的公共数据集进行挖掘和利用,赋能产品和服务创新。张莉和林安然(2023)、Zhou等(2023)讨论了企业性质与企业规模对政府数据开放的经济后果的调节作用。因此,本文探讨企业性质与企业规模两个内部情境变量对政府数据开放与企业创新的调节作用。
(1) 市场公平竞争环境。相对于市场公平竞争环境较差地区的企业,政府数据开放对市场公平竞争环境较好地区的企业的创新促进作用更大。市场公平竞争环境会影响区域经济主体的发展活力和企业家的投资选择。良好的市场公平竞争环境会增强企业整合和配置资源的动力(牛志伟等,2023),使企业更愿意增加研发投入对公共数据进行收集、整理和分析,以期获得新的商业价值、创造新的产品和服务来实现差异化优势。此外,当企业处于公平、公正的竞争环境中,初创企业或中小型企业有动力利用公共数据资源将创新理念付诸实施,同大型企业开展市场竞争。基于上述分析,本文提出假设:
H5:市场公平竞争环境正向调节政府数据开放对企业创新的影响。
(2) 地区经济发展水平。相对于经济发展水平较高地区的企业,政府数据开放对经济发展水平较低地区的企业的创新促进作用更大。中国幅员辽阔,各地区的资源禀赋、路径依赖与发展阶段存在差异,地区经济发展存在不均衡现象。经济发展水平较高地区,无论是产业数字化还是数字产业化水平都走在全国前列,完善的数字基础设施、成熟的数字服务提供商、庞大的数字消费群体为企业创新提供了丰富的数据资源。相反,经济发展水平相对落后地区的企业难以获取大量的消费者、市场等数据要素资源,如果政府能够建立数据开放平台,将一些关键性、基础性和权威性的公共数据对企业免费开放,会极大地充实这类企业可利用的数据要素。企业通过将数字化资源融入设计、研发、生产过程中,能产生更大的创新边际效应。基于上述分析,本文提出假设:
H6:地区经济发展水平负向调节政府数据开放对企业创新的影响。
(3) 企业性质。与民营企业相比,政府数据开放对国有企业创新的影响更强。一方面,从国有企业与民营企业对政府数据开放政策的响应行为来看。政府实施数据开放政策的行为可以看作是对企业发出的信号,即希望公共数据的商业价值能够被社会主体充分挖掘和应用。当企业接收到这个信号时,会增强对公共数据资源的注意力,通过投入数字化人才、技术等资源对公共数据进行整理和分析以获得创新效益(Wang等,2023)。国有企业与政府关系较为密切,其经营行为带有一定的政治目的,当政府开通公共数据开放平台时,会积极响应政府数据开放政策,自觉和主动地利用公共数据进行产品和服务创新(张莉和林安然,2023)。另一方面,国有企业的经营范围更多集中在能源、交通、基础设施等民生领域,民营企业的经营范围更多集中在饮食、服务、修理和科技咨询等领域。从目前政府公开的数据类型来看,主要包括城市建设、民生服务、经济建设、教育科技、资源环境、卫生健康、公共安全、文化休闲、道路交通、信用服务、机构团体、社会发展等原始数据。相对来说,这些原始数据类型更契合国有企业的经营范围(张莉和林安然,2023),其可以更有效地利用这类数据来开发新产品和新服务。基于上述分析,本文提出假设:
H7:与民营企业相比,政府数据开放对国有企业创新的影响更明显。
(4) 企业规模。与中小型企业相比,政府数据开放对大型企业创新的影响更强。一方面,大型企业在经营过程中积累了庞大的用户基础,用户数据资源较为丰富,通过将外部公共数据与内部特征数据进行融合,能更好地对数据的商业价值进行挖掘,帮助企业进行研发决策,创造有价值、独特的产品(Zhou等,2023),发挥数据资源的创新赋能效应。例如,徐翔等(2023)发现大型企业由于拥有庞大的用户基础,可以通过滚雪球的方式积累和利用用户数据,开展迭代式创新。另一方面,大型企业的资金、人才等资源更加丰富,在利用公共数据时,大型企业在资本和风险承担能力方面更能应对市场变化,从而可以更快、更合理地调整决策。此外,大型企业拥有更强大的IT能力和先进的数据管理系统,更有能力发现公共数据隐藏的商业价值(Zhou等,2023)。基于上述分析,本文提出假设:
H8:企业规模正向调节政府数据开放对企业创新的影响。
四、 研究设计
1. 样本选择与数据来源
考虑到2012年上海市首次开通政府数据开放平台,本文将时间窗口设定为2007-2021年。研究的初始样本设定为中国沪深A股全部上市企业。本文对数据进行以下处理:剔除金融保险类企业;剔除ST、*ST和PT的企业;剔除关键数据缺失严重的企业;剔除当年上市的企业;为规避异常值对回归结果的影响,对连续变量进行缩尾调整,缩尾对象为上下1%的观测值。共得到“企业-年度”结构的36243个观测值。专利数据来自CCER数据库;政府数据平台上线数据与中国开放数林指数来自复旦大学数字与移动治理实验室;其余数据来源于CSMAR数据库。
2. 变量定义
(1) 被解释变量企业创新。本文借鉴以往文献的做法(彭远怀,2023),采用专利申请量的自然对数衡量企业创新水平(Innovation)。
(2) 解释变量政府数据开放。政府数据开放(OGD)为虚拟变量。当企业所在省份开通政府数据开放平台之后,将OGD编码为1,否则编码为0。
(3) 控制变量。借鉴以往的相关研究,从企业基本特征层面、财务特征层面、治理结构层面、宏观环境层面选取可能对企业创新产生影响的变量作为控制变量。
以上变量详见表1。
表1 变量的选取与测量
3. 模型设定与实证策略
为检验基准假设,本文设定多时点双重差分法模型,如下所示:
Inovationi,t=β0+β1OGDi,t+∑βkControli,t+∑Firmi,t+∑Yeari,t+∑Industryi,t+εi,t
(1)
其中,i表示企业,t表示时间,Innovation表示企业创新,OGD表示政府数据开放,Firm为企业虚拟变量,Year为时间虚拟变量,Industry为行业虚拟变量,Control为控制变量,ε为模型随机误差项。
五、 实证研究结果与分析
1. 描述性统计
表2列示了主要变量的描述性统计结果。企业创新(Innovation)的最小值为0,最大值为4.505,标准差为1.032,表明样本企业在专利申请数量方面表现出较大差异。政府数据开放(OGD)的均值为0.368,表明36.8%的样本企业所在省份开通了政府数据开放平台,这与彭远怀等(2023)的估算结果较为接近。其余变量均在合理范围内,不再赘述。
表2 描述性统计
2. 基准回归
本文采用递进式回归策略对基准假设进行检验,表3报告了政府数据开放对企业创新的回归结果。可以发现,在不同回归模型设定下,政府数据开放系数均在1%的统计水平上显著为正。从经济显著性来看,政府数据开放平台开通后,企业创新水平平均上升9.103%(1)经济显著性的计算公式为:解释变量的回归系数/被解释变量平均值,即0.068/0.747×100%=9.103%。。因此,本文的假设H1得到验证,政府数据开放能显著提升企业创新水平。
表3 基准效应回归结果
3. 稳健性检验
(1) 平行趋势检验。图1为平行趋势检验结果,政府数据开放平台上线的前几年,处理组与对照组的企业创新没有显著差异,在政府数据开放平台上线后的几年里,处理组与对照组的企业创新产生了显著差异,说明政府数据开放对企业创新的影响具有持续性。此外,回归系数值在政府数据开放平台上线后呈现先增大后减小的趋势,表明政府数据开放对企业创新的影响存在动态变化。这说明政府数据开放提高企业创新水平的因果关系并非由事前趋势导致。
(2) 安慰剂检验。为验证政府数据开放对企业创新的影响并非由其他随机因素所导致,本文对回归结果进行安慰剂检验。本文在地区层面对政府数据开放进行500次随机抽样,构建伪政策虚拟变量,并基于模型(1)重新回归,检验政府数据开放的回归系数与对应的t值的分布情况。安慰剂检验结果如图2所示,回归系数呈正态分布,均值为-0.003,远小于表3列(4)的真实回归系数0.068;t统计量同样呈正态分布,均值为-0.127,远小于表3列(4)的真实t统计量4
图2 安慰剂检验
真实t统计量的计算公式为:回归系数/回归系数的标准误,即0.068/0.017=4。。以上结果表明政府数据开放对企业创新的影响并非由其他随机因素所导致。
(3) 政府数据开放平台上线的外生性检验。为了进一步排除政府数据开放平台上线相对企业创新的非外生性担忧,本文直接验证政府数据开放平台上线相对企业创新是否外生,即考察地区企业创新水平是否会影响政府数据开放平台上线时间。若结果显示地区企业创新水平不会影响政府数据开放平台上线时间,则表明政府数据开放平台上线相对企业创新是外生的。具体检验模型设定如下:
OGDTp,t=β0+β1InnovationMp,t+∑βkControlp,t+∑Provincep,t+∑Yearp,t+εp,t
(2)
其中,p表示地区,t表示时间;OGDT表示政府数据开放平台上线的预期时间,用政府数据开放年份减去观测年份的差值的自然对数衡量,若某地区在时间区间内一直没有上线政府数据开放平台,则用结束年份减去观测年份的差值的自然对数衡量,OGDT值越大,说明政府数据开放平台上线的预期时间越长;InnovationM为地区企业创新水平;Province为省份虚拟变量,Year为年份虚拟变量;Control表示控制变量,包括人口数量(People)、教育资源(Edu)、经济发展水平(GDP)。
外生性检验结果如表4所示,列(1)为只控制地区固定效应与时间固定效应的回归结果,列(2)为在列(1)基础上纳入控制变量的回归结果,InnovationM的回归系数均不显著,表明地区企业创新水平不会影响政府数据开放平台上线时间,政府数据开放相对于地区企业创新水平而言具有较强的外生性。
表4 外生性检验结果
(4) 控制遗漏变量。本文通过以下两种方式处理遗漏变量问题。第一,采用对内生性控制更为严格的回归模型进行检验,即同时控制企业固定效应与时间-行业固定效应;二是添加同时影响政府数据开放与企业创新的控制变量政府干预与政策不确定性。结果如表5所示,基准假设再次得到验证。
表5 控制遗漏变量检验结果
(5) 倾向得分匹配法与熵平衡匹配法。为缓解自选择偏差带来的影响,本文采用两类匹配方法为处理组匹配对照样本,再对匹配后的样本进行回归分析。一是倾向得分匹配法。本文基于上述控制变量以及行业给处理组进行一对一匹配、核匹配与半径匹配,匹配后的回归结果如表6列(1)至列(3)所示,基准假设再次得到验证。二是熵平衡匹配法。倾向得分匹配法容易造成样本损失,而熵平衡匹配法通过矩估计可以很好地弥补这一缺陷。利用熵平衡匹配法匹配后的回归结果对应表6列(4),基准假设再次得到验证。
表6 倾向得分匹配法与熵平衡匹配法检验结果
(6) 替换变量测度。为避免行业创新水平的影响,本文对样本企业创新进行去除行业均值处理,具体是采用样本企业创新水平减去同年同行业企业创新水平均值;另外采用企业申请的产品专利数量衡量企业创新水平。回归结果见表7,基准假设再次得到验证。
表7 替换企业创新检验结果
(7) 替换样本区间。考虑到2008年全球金融危机与2020年爆发的全球新冠肺炎疫情对企业经营行为的重大影响,本文截取2009-2019年数据进行回归。另外,上海市在2012年开通中国第一个省级政府数据开放平台,而在此之前鲜有对政府数据开放平台的探讨,因此本文剔除2012年之前的样本进行回归。回归结果见表8,基准假设再次得到验证。
表8 替换样本区间检验结果
(8) 替换聚类方式。本文分别采用行业层面、省份层面、时间-行业层面、时间-省份层面、行业-省份层面、企业-行业层面、企业-省份层面、企业-时间层面的聚类方式进行回归。回归结果见表9,基准假设再次得到验证。
表9 替换聚类方式检验结果
(9) 考虑影响的滞后性。考虑到政府数据开放对企业创新可能存在滞后性,本文检验政府数据开放对t+1期、t+2期企业创新的影响。回归结果见表10,基准假设再次得到验证。
表10 考虑影响滞后性检验结果
4. 影响机制检验
基于前文的机制作用分析,本文设计模型(3)检验政府数据开放影响企业创新的作用机制。
Mediatori,t=β0+β1OGDi,t+∑βkControli,t+∑Firm+∑Year+∑Industry+εi,t
(3)
其中,Mediator表示机制变量,包括营运效率、数字化转型与融资约束;其余参数的含义同模型(1)。
(1) 提升营运效率。本文参考黄勃等(2023)的做法,采用资产周转率衡量企业营运效率,具体是以营业收入与平均资产总额之比衡量,该指标值越大,表示企业营运效率越高。表11列(1)显示政府数据开放显著正向影响企业营运效率。结合前文的理论分析,这表明政府数据开放可以通过提高企业营运效率进而提升创新水平,假设H2得到验证。
表11 机制检验结果
(2) 推动数字化转型。本文参考蔡宏波等(2023)的做法,采用数字化资产占无形资产的比重衡量企业数字化转型程度,该指标值越大,表示企业数字化转型程度越高。表11列(2)显示政府数据开放显著正向影响数字化转型程度。结合前文的理论分析,这表明政府数据开放可以通过推动企业数字化转型进而提升企业创新水平,假设H3得到验证。
(3) 缓解融资约束。本文参考Kaplan和Zingales(1997)的做法,采用KZ指数测度企业融资约束程度,该指标值越小,表示企业融资约束程度越弱。表11列(3)显示政府数据开放显著负向影响企业融资约束。结合前文的理论分析,这表明政府数据开放可以通过缓解企业融资约束进而提升企业创新水平,假设H4得到验证。
5. 调节效应检验
为检验市场公平竞争环境、地区经济发展水平、企业性质、企业规模对政府数据开放与企业创新的调节效应,本文设定如下模型:
Innovationi,t=β0+β1Moderator×OGDi,t+β2Moderatori,t+β3OGDi,t+∑βkControli,t+∑Firm+∑Year+∑Industry+εi,t
(4)
其中,Moderator表示调节变量,分别为市场公平竞争环境、地区经济发展水平、企业性质与企业规模;其余参数的含义同模型(1)。
(1) 市场公平竞争环境。本文参考牛志伟等(2023)的做法,基于地区上市企业营业收入,采用赫芬达尔指数计算市场公平竞争程度表征市场公平竞争环境(HHI)。计算公式如下所示:
HHI=1-1/∑(Xi/X)2
(5)
其中,Xi表示企业营业收入,X表示企业所属地区的营业收入总额。HHI值越大表示市场公平竞争程度越大。
表12列(1)显示交互项OGD×HHI的回归系数显著为正,表明市场公平竞争环境增强了政府数据开放对企业创新的促进作用,假设H5得到验证。
表12 异质性检验结果
(2) 地区经济发展水平。本文采用人均国内生产总值的自然对数衡量地区经济发展水平(GDP)。表12列(2)显示交互项OGD×GDP的回归系数显著为负,表明地区经济发展水平削弱了政府数据开放对企业创新的促进作用,假设H6得到验证。
(3) 企业性质。本文将国有企业样本编码为1,民营企业样本编码为0,得到衡量产权性质的虚拟变量(SOE)。表12列(3)显示交互项OGD×SOE的回归系数显著为正,表明企业国有属性显著增强了政府数据开放对企业创新的促进作用,假设H7得到验证。
(4) 企业规模。本文采用企业期末总资产额的自然对数衡量企业规模(Size)。表12列(4)显示交互项OGD×Size的回归系数显著为正,表明企业规模显著增强了政府数据开放对企业创新的促进作用,假设H8得到验证。
六、 进一步分析:政府数据开放质量对企业创新的影响
前文虽然通过双重差分方法验证了政府数据开放对企业创新的促进作用,但是并没有深入探讨政府数据开放质量对企业创新的影响。本文进一步基于复旦大学数字与移动治理实验室构建的中国开放数林指数检验政府数据开放质量对企业创新的影响。中国开放数林指数从2017年开始对政府开放数据质量进行评估,主要分为4个维度:一是用于评价政策保障力度的准备层指数,如法规政策、标准规范等;二是用于评价平台建设质量的平台层指数,如使用体验、互动渠道等;三是用于评价数据开放质量的数据层指数,如数据数量、开放范围等;四是用于评价数据开放成效的利用层指数,如成果数量、成果质量、成果价值等。由于企业创新属于利用层指数的衡量范畴,故本文主要检验政策保障力度(Policy)、平台建设质量(Platform)、数据开放质量(Quality)对企业创新的影响。
本文认为政策保障力度、平台建设质量与数据开放质量会对企业创新起到显著的正向影响。第一,政策保障力度是数据开放的基础。政府通过制定完备的数据开放法规政策和开放利用要求,设立专职数据管理部门,拟定年度工作计划与方案,能保证数据开放的及时性、连续性和规范性(Attard等,2015)。明确和宽松的数据使用许可条款鼓励企业在没有法律障碍的情况下以创新的方式使用政府数据,营造了一个有利于企业创新的环境。企业可以持续地将外部公共数据与内部经营数据进行融合,保障创新活动的连贯性。企业通过及时访问政府开放数据平台对于紧跟市场趋势并作出有效的创新决策至关重要。相关公共数据更新得越及时,企业就越能敏捷地应对新出现的机遇或挑战,及时调整和优化创新策略。第二,平台建设质量是数据开放的枢纽。高质量的数据开放平台不仅可以保证平台数据供给的稳定性,还可以通过订阅推送、深度搜索、数据集预览、开放目录及时更新、数据纠错、意见建议等功能提升企业用户在数据发现与数据获取过程中的实际体验。用户友好的访问界面和标准化格式会增强企业发现和获取公共数据的动力,更愿意在平台搜索与企业业务相关的数据资源,使企业能够更有效地将数据资源集成到创新流程中。第三,数据开放质量是数据开放的核心。部分政府数据开放平台存在数据开放范围窄、数据数量规模小等问题,这不利于发挥开放数据的价值创造效应(彭远怀,2023)。政府通过开放多部门来源、多主题的数据,可以激励不同行业的企业参与到公共数据的使用中来。当政府开放数据遵循一致的标准并对数据进行必要的描述和说明时,可以降低企业数据集成的复杂性,从而有利于企业在创新流程中实现更高效地数据利用。高质量的开放数据蕴含的企业生存和发展机会也更丰富,数据所传达的信息也更为精准,企业通过分析和挖掘高质量的开放数据能提高创新决策的准确性,更能发现新的市场机会,提升企业创新质量。
回归结果如表13所示,政策保障力度与开放数据质量均在10%的统计水平上显著正向影响企业创新,但平台建设质量对企业创新的影响不显著。平台建设质量未能显著正向影响企业创新的原因可能在于:第一,数据开放平台建设质量有待提高。各级政府数据开放网站尚处于建设阶段,主要是为用户在获取数据过程中提供订阅推送、深度搜索、意见反馈等增值服务,虽然能为企业提供更加便捷和个性化的数据服务,但是主要集中在数据获取,而较少涉及数据集规模、质量和利用。第二,企业使用数据开放平台的意识较为欠缺。正如前文所述,相较于国有企业,民营企业对政府政策的了解程度较低,缺乏对政府开放数据的认知,利用政府数据开放平台开展创新的意识较弱(张莉和林安然,2023)。此外,由于缺乏多方参与的评价激励机制,企业作为最主要的数据使用方没有深度参与到数据平台的建设,难以深入了解平台数据的创新价值。第三,企业与数据开放平台的对接机制不完善。现有平台还没有形成为企业提供一站式、便捷化、全口径的公共数据开放服务能力,企业难以在数据平台实现公共数据与内部数据的融合。
表13 政府数据开放质量维度对企业创新的影响检验结果
七、 研究结论、启示及展望
1. 研究结论
本文以中国省级政府建立公共数据开放平台为准自然实验,基于2007-2021年中国沪深A股上市公司数据,利用多时点双重差分法实证检验政府数据开放对企业创新的影响,得到如下结论:政府数据开放显著正向影响企业创新,该结论在经过一系列稳健性检验后依旧成立;政府数据开放提升企业营运效率、推动企业数字化转型与缓解融资约束,进而提升企业创新水平;政府数据开放对企业创新的积极作用在市场公平竞争环境较好的地区、经济发展水平相对落后的地区、国有企业以及大规模企业中更加明显;进一步研究表明,政府开放数据质量维度中的政策保障力度与开放数据质量显著正向影响企业创新,而平台建设质量对企业创新的影响还未凸显。
2. 研究启示
本文的研究结论对加快推进政府数据开放,提升企业创新能力具有重要的启示。
第一,企业应该实时关注政府建设的开放数据平台,充分高效利用政府开放的公共数据,提升企业创新水平。企业可以雇用专职人员或使用订阅推送功能及时关注政府数据开放平台上线的数据,丰富企业的数据要素资源。政府数据蕴含丰富的外部信息与知识,企业应该积极主动地挖掘并应用所在地区以及相关地区政府主导公开的数据,将其与企业数据进行深度融合,提升营运效率与数字化水平,从而促进企业创新。
第二,政府应该积极建设公共数据开放平台,保障该政策实施的持续度并开放高质量的数据集,赋能企业开展高质量创新。政府应制定完备的数据开放法规政策和开放利用要求,设立专职数据管理部门,加强对数据开放平台的建设,以确保提供多样化和高质量的数据,激发企业创新活力。在后续的运行过程中,政府还应确保数据开放平台在数据供给上具有稳定性、可持续性和多样性,以吸引更多社会主体基于自身需要挖掘公共数据价值。此外,政府应积极与银行、信贷等金融机构开展合作,为其提供关于企业与市场的数据,降低企业与金融机构的信息不对称程度,让企业享受到金融机构提供的个性化和多样化信贷服务,缓解企业融资约束。
第三,政府应该重视公共数据开放对不同地区与不同企业的异质性影响。政府应该打造良好的营商环境,形成公平竞争的市场环境,充分激活市场主体的创新创业活力,鼓励各类企业参与到公共数据的使用中来,从而实现公共数据的创新赋能效应。经济发展水平较低的地区应该积极参与建设政府数据开放平台,为区域内企业提供更丰富的数据资源,让更多经济发展落后地区市场主体公平享受数据要素红利,提升企业创新水平。同时,政府可以有侧重地开放与民营企业经营领域密切相关的数据集,并作好数据利用成果的宣传,引领和号召民营企业利用公共数据开展创新。鉴于中小企业的资源与能力限制,政府可以考虑在数据开放平台添加更多智能化数据分析功能和外部数据接口,让中小企业可以直接在数据开放平台中根据自身需求便捷地实现数据分析和挖掘,赋能企业创新。
3. 研究局限与展望
虽然本文通过丰富的识别策略与严谨的实证设计验证了政府数据开放与企业创新的关系,但仍然存在一些研究局限,有待未来进一步完善。第一,囿于数据可得性,本文目前只能获取政府数据开放平台的开通时间,无法获得政府数据开放平台在不同时期的数据质量、数据量以及数据类别等信息。第二,本文评估了政府数据开放平台开通的创新效应,但没有细致地评估不同种类数据要素的创新效应,未来可进一步评估个人数据、企业数据、平台数据等数据要素的创新效应。第三,本文从较为精细的企业层面探讨了政府数据开放的创新效应,未来可进一步探讨政府数据开放对企业高质量创新、绿色创新、突破式创新等其他创新行为的影响。