作为生产要素的数据如何参与分配?
2019-12-14赵雪雅朱胜豪
赵雪雅 朱胜豪
2017年12月,习近平总书记强调推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国。2018年4月,值首届数字中国建设峰会开幕之际,习近平总书记发来贺信:“信息技术创新日新月异,数字化、网络化、智能化深入发展,在推动经济社会发展、促进国家治理体系和治理能力现代化、满足人民日益增长的美好生活需要方面发挥着越来越重要的作用。”2019年11月1日,在中共十九届四中全会新闻发布会上,中央财经委员会办公室在介绍坚持和完善社会主义基本经济制度的有关情况时指出:“要鼓励勤劳致富,健全劳动、资本、土地、知识、技术、管理和數据等生产要素按贡献参与分配的机制……”这是中央首次在公开场合提出数据可作为生产要素按贡献参与分配。
很多国家和国际组织都将数据视作战略资源。目前,美国数字经济占GDP总量33%,并设立了数字经济顾问委员会;英国数字经济占GDP总量的7%,出台《数字经济战略》;德国发布《数字战略2025》,全面实施工业4.0;日本提出建设“超智能社会”,将网络与现实空间融合发展。
据国际数据公司(International Data Corporation)的《数据时代2025》报告预测,到2025年全球每年产生的数据将高达175ZB,相当于每天产生491EB的数据。2018年,微信官方的微信数据报告提到,每天有450亿次信息发送。据Facebook统计,Facebook每天产生4PB的数据,包含100亿条消息,以及3.5亿张照片和1亿小时的视频浏览。此外,在Instagram上,用户每天要分享9500万张照片和视频,Twitter用户每天要发送5亿条信息。
如何解决作为现代经济活动不可或缺的数据收费和现金流问题?笔者认为,应通过提供适当的激励,促进数据基础设施的投资,合理引导数据平台建设。这样做的目的是解决好数据供给来源,满足经济社会活动对数据的需求,发挥数据资源的公共产品优势,改进社会福利。这个过程的复杂之处在于,非竞争性导致价格机制不能完全发挥资源配置的作用,其它的激励机制可能在现实中也存在,比如数据平台虽然提供公共的数据不直接收费,但是数据平台得到了免费的数据流量作为它们搭建数据平台的成本的补偿。
笔者建议政府成立专门机构,由其根据一定时期的社会经济目标来调整数据的收益问题。此种收益可以是数据平台的现金收益,也可以是非现金收益或准入许可。政府在对数据应该得到的收益制定标准的时候要考虑到私人部门对数据基础设施和平台的初期投资成本、数据本身的社会经济效益和要素分配的公平性。如果数据本身产生的收益不足以弥补基础设施的成本,政府还要考虑是否由公共财政弥补一部分私人投资的成本,以实现数据本身的社会效益。
数据的内涵
笔者将数据界定为公共产品,理由如下。在计算机科学中,数据是指所有能输入到计算机并被计算机程序处理的符号的介质的总称,是用于输入电子计算机进行处理,具有一定意义的数字、字母、符号和模拟量等的通称,它还可以是图形、图像、视频、音频等,也是客观事物的属性、数量、位置及其相互关系的抽象表示。Paul A. Samuelson (1954)将公共产品定义为所有成员集体享用的集体消费品,社会全体成员可以同时享用该产品,而每个人对该产品的消费都不会减少其他社会成员对该产品的消费。公共产品具有受益的非排他性,即这个公共产品带来的收益不能为部分人专享,其他人亦可以享用,且无需支付费用;同时具有消费的非竞争性,一旦这个公共产品被提供,任何人都可以消费它,且增加或减少一个人的消费都不会影响其他消费者的收益,也不会增加社会成本,比如国防。公共产品又分为两类,一类是纯公共产品,由Musgrave(1969)提出,他认为其应兼具非竞争性和非排他性;一类是准公共产品,仅具有非排他性或者非竞争性之一,或者对非排他性和非竞争性的体现加以限制。
笔者将数据界定为公共产品,其符合以上的定义,进一步地,笔者认为其是准公共产品。数据产生以后,使用者数目的增加并不会增加数据的边际成本。作为公共产品,数据具有以下三个特征。
一是初始投资大,产权不明晰。数据的产生,收集,传输,处理和储存需要整个后端计算支持系统的基础设施建设,2019年中央经济工作会议将“新型基础设施”定义为5G、人工智能、工业互联网及物联网的建设,并将其列为2019年重点工作任务之一。从通信基站的建设,通信传输层面的光纤通道搭建到设备终端运行,以及数据分析平台的搭建无一不需要前期大量资金的投入,像Netflix和亚马逊这样的工业巨头依靠基于云的框架来处理AI任务和需要全面分析和计算的服务。十八届三中全会指出:“经济体制改革是全面深化改革的重点,核心问题是处理好政府和市场的关系,使市场在资源配置中起决定性作用和更好发挥政府作用”。 初始基础设施建设的投入可以由政府和企业共同完成,但厘清政府与市场的边界,充分尊重和发挥市场机制自身的力量至关重要。
就数据基础设施来说,政府的投入成本和私企的投入成本的边界在哪里也需要探讨。据Smart insight估计,目前全球每天有50亿次搜索,其中35亿次搜索来自谷歌,占全球搜索量的70%,谷歌平台虽由私企搭建,但每个人皆可免费使用。微信亦是,据微信官方发布的《2018年微信数据报告》显示,截至2018年9月,微信月活跃账户数达10.82亿,它成为了当今中国人的主要交流方式。这些私企提供的平台和软件的运行无不依赖于前期基础设施的投入。
二是边际成本为零。数据一旦产生并被收集打包,若不加以限制,每个人可以使用它,且不会增加额外成本。虽然数据的边际成本为零,具有消费的非竞争性,在不加限制的情况下却存在先行者优势现象。以宇通客车公司为例,其开发的宇通新能源移动应用可以为用户提供一个智能远程监控和诊断的系统移动平台,帮助客户快速查看车辆状态、地理位置、能耗等关键信息,查看行车轨迹、起始点、终点和行驶里程,越多的客户使用宇通新能源移动应用不仅不会增加成本,反而会扩充数据量,且数据越多,越能帮助宇通客车公司精准定位,生产更符合客户需求的新能源汽车,实现正向反馈循环,继而快速占据新能源汽车市场,其他公司若想通过研发此类移动应用的方式收集数据已晚矣。
值得注意的是,通胀和收益率的相关性在2015年后正在逐步减弱。
三是存在外部性, James(1962)提出外部性是指某些个人或企业的经济行为影响了其他人或企业,却没有为之承担应有的成本费用或没有获得应有的报酬的现象。外部性一词起源于Marshall(1890)发表《Principles of Economics》的“外部经济”的概念,随后由Pigou(1912)发表《Wealth and Welfare》,1920年修订为《The Economics of Welfare》出版,在Marshall的“外部經济”的基础上扩充了“外部不经济”,系统地研究了外部性问题。外部性分为正外部性和负外部性,所谓正外部性是指由生产者在生产时会给其他人带来收益,而生产者无法对收益索取补偿。从数据角度来说,“云教育”是一个很好的例子,慕课(MOOC)的产生使得边远地区得到了高质量的教育机会;而负外部性正好相反,生产者在生产时会给其他人带来成本,但其出于自身利润最大化的考虑,并不会顾及其带来的外部性成本,第三方也无权因增加成本而索要补偿。以数据为例,负的外部性主要集中于数据安全问题,一旦数据被不法分子利用,则会造成隐私泄露之类的伦理问题。
数据参与分配的三种方式
上文提出数据主要存在的以下三个问题:1. 产权不明晰;2.具有先行者优势,易造成垄断;3.数据具有外部性。针对以上三个问题,我们有三种数据作为要素参与分配的方式去试图解决。
一是通过市场化。公共产品市场化会存在市场失灵现象,公共产品的非排他性和非竞争性导致市场不能自发有效地调节其供应数量,与此同时,由于没有外部性交易市场,无论存在正外部性还是负外部性都会扭曲资源的最优配置效率。公共产品存在很明显的自然垄断现象,生产经营规模越大,效益越高,例如公用事业行业。然而,垄断会造成市场效率低下,自由定价的权利允许其在价格高于边际成本处生产,从而达不到最优供给量,进而影响社会福利。垄断还会造成寻租,所以反垄断立法至关重要。
以滴滴打车为例,滴滴公司搭建打车平台,开发了滴滴打车移动应用,滴滴公司收集的用户日常出行数据,汽车运动轨迹数据等可以为自己所用,滴滴公司拥有对这些数据的所有权,这些数据会产生正外部性,比如人们的日常出行轨迹数据也可以作为政府做城市规划的参考和其他公司选址的参考,最终数据的共享会提升整个社会的福利。若产权明晰,则政府和其他公司需向滴滴公司付费,滴滴公司在不产生额外成本的情况下,可以得到额外收益。滴滴公司也可将这一部分收益用于研发更适合消费者的数据处理系统,从而吸引更多的客户,形成正向循环,最终处于垄断地位,其他公司若想进入打车平台建设市场就会很难。
二是通过政府规制。市场化机制本身的缺陷很难靠市场化本身调节,为了弥补公共产品的市场失灵,需要借助政府部门的介入进行政府规制。Viscusi et al. (2005)认为,规制是政府以制裁手段,对个人或组织的自由决策的一种强制性限制。政府的主要资源是强制力,管制就是以限制经济主体的决策为目的而运用这种强制力。值草益(1992)提出政府部门可以利用法律权限,通过特别许可、注册、申报的方式对企业的进入、退出、价格、标准、服务的数量和质量方面实行管制。数据有产生、收集、传输、分析、储存等不同阶段,随着互联网、传感器和数字化设备终端的普及,我们无时无刻不在产生数据。各大公司通过移动设备终端的应用软件收集数据,经由中国电信、中国移动以及中国联通三大巨头传输,最终至公司自己的数据分析平台,用户移动设备终端会与数据分析平台发生交互关系。若要实行政府规制,则应从以上这些阶段入手,限制相关企业进入,制定收费和服务标准。由政府组织公共部门提供公共产品,公共部门有助于将外部性内部化:当外部性效应为负时对外部性生产者征收庇古税;若因数据泄露的负外部性影响社会福利,则可对泄露数据的企业征收罚款;当外部性效应为正时,给予外部性生产者补贴,譬如企业将公用数据进行共享,方便他人使用,政府可给予补贴;或者通过立法强行管制,直接禁止外部性溢出,譬如涉及国家安全的数据直接使用内部网络,若泄露则会以违法论处。
三是依靠机制设计。市场缺陷和政府缺陷并存使得我们需要考虑从机制设计的角度来探讨数据作为生产要素参与收入分配的方式。企业的目标是利润最大化,政府的目标是社会福利最大化,个人的目标是效用最大化,三个主体的目标兼容匹配达到激励相容的效果,以上述原则设计机制可达到三方福利增进的效果。好的机制设计需要兼顾效率与社会公平,并权衡好它们各自的权重。效率即帕累托效率,是指在一种资源的分配状态下,没有人可以在不损失其他人的利益下而变得更好。那何为社会公平,黄恒学等(2009)认为有以下四种社会公平观,一是平均主义公平观;二是等级主义公平观;三是资产阶级公平观;四是马克思主义公平观。在实践操作中我们可以试用不同的公平观,选出现阶段社会接受度比较高的公平观标准。
机制设计兼顾效率与公平,一方面要采撷市场化带来的帕累托效率;另一方面要从社会公平出发,将“看不见的手”和“看得见的手”结合起来。数据作为生产要素,企业利用数据是为了利润最大化,在合法的情况下开发互联网产品,满足人们的日常所需,从而增加消费者的效用,与此同时将收集到的数据进行分析和处理,进一步改善自身的互联网产品,形成正反馈。数据依赖的基础设施需要大量的资本投入,单个私人企业不一定能承担这些投资成本,需要政府从公共品提供角度加大投入。通过建立兼顾公平和效率的社会目标函数,建立以最优化社会福利函数为目标的要素分配方式,是这个分配机制设计最核心的内容。同时基于一定的社会目标,这一机制设计要达到企业、政府和个人三方的激励相容,达到调动各方积极性的目的。基于此机制设计,政府动用手中掌握的政策工具,制订相应的行业服务标准,规制企业的道德底线。在尽可能提升效率的同时兼顾公平。当然,效率和公平的权重具体分配问题有待进一步探讨。
数据作为生产要素参与分配的方式,笔者更偏向于第三种,即机制设计,它兼顾效率与公平,但需注意权重的分配。理顺要素分配关系,实现激励相容和优化资源配置。数据作为要素参与分配是对社会福利的一种改进,合理规划数据收益分配可以打通不同部门之间的数据壁垒,实现数据共享和各利益相关方的共赢局面。
本研究受到国家自然科学基金资助,项目71873034