APP下载

人工智能时代的数据垄断与反垄断治理

2020-02-25徐瑞萍

关键词:主体人工智能时代

徐瑞萍,戚 潇

(1.佛山科学技术学院法学与知识产权学院,广东佛山528000;2.北京工业大学文法学部,北京100124)

人工智能时代,数据、算法与算力是推动人工智能快速发展的“三驾马车”。其中,数据是第一驾马车,也是最具决定性的力量。如果失去这驾马车,剩下的两驾马车将会失去生机和活力。从人工智能的第三次崛起的历史背景来看,大数据技术的迅猛发展为其提供了数据条件,“多源异构”数据的广泛累积,源源不断地为智能技术输送能源和动力。所以,以数据为“饲料”的人工智能才得以快速生长,数据的价值日渐凸显。在这样的背景下,数据的多寡成为各领域竞争的优先战略,众多的市场争夺战便开始围绕数据而展开,数据垄断问题也日益成为一个需要研究的重要问题。

一、数据争夺战:人工智能时代数据垄断问题的萌生

自2016年人工智能再次崛起之后,关于智能的相关战略布局引发了社会的强烈关注,从政府、企业乃至个人,都开始研究与智能相关的服务与应用,极大地推动了人工智能的发展进程,从概念到实践的落地,彻底地将人工智能技术与黎民百姓的生活挂上钩。但与此同时,也出现了多种无形的竞争关系,尤其是围绕数据而展开的“拉锯战”,更是异常激烈。

人工智能时代的数据资源是智能应用与服务的战略性资源,可谓“得数据者得天下”。所以,数据资源的争夺战便成为各领域的聚焦点。从某种程度上来说,在数据争夺战的背后,反映的是数据作为资源和资产价值的不可替代性。

人工智能的发展,核心在于数据的支撑,缺乏数据的人工智能等于判了“死刑”,会直接导致人工智能的发展与应用缺乏后期的创新能力。换言之,人工智能技术的迅猛发展,需要源源不断地从“多源异构”的大数据中汲取能量,而这些数据又是源于具体的服务与应用领域的共享与数据开放。由于在人工智能时代之前收集的数据的“非及时性”和不完整性,导致智能技术的发展需要从智能应用中重新收集和反馈及时的数据,以便于为新一轮的智能应用与创新提供必要的及时性数据条件,这样的创新对于用户而言才具有价值。基于此,各大领域围绕数据而展开的争夺战的激烈程度就不言而喻了。

2017年6月,顺丰与菜鸟这两家公司的数据之争拉开序幕。在整个数据争夺战之中,两家公司都在以自己的方式表达立场,但并没有直接提到两家之间的商战是围绕数据而展开。然而,从根本上来说,两家公司争斗的最终动因还是围绕数据而展开的。所以,人工智能时代,数据必然是各大企业最为重视的资源,数据的拥有与获得意味着与他们未来的生存和发展有着密切的联系。与之类似,腾讯和华为两家领头公司之间,也存在数据之争的情况。2017年8月,根据《华尔街日报》报道,腾讯公司以华为的荣耀Magic智能手机侵犯微信用户隐私为由进行指控,指控理由是华为公司正在通过收集微信用户的数据信息,严重侵犯用户的隐私数据,并向国家政府部门提出介入请求。最后,华为对此做出积极回应称:“他们是在用户同意的情况下进行的数据收集活动,且这些用户的数据既不属于腾讯,也不属于华为,而是属于用户。”

总的来说,无论是腾讯与华为的数据之争,还是顺丰与菜鸟的数据之争,都是围绕“数据”而进行的,都从客观上反映了人工智能时代“数据”的重要性。正因如此,一种更为广泛的数据采集活动,正在将数据朝着特定的渠道进行汇聚,已开始形成数据垄断之势。已有现象表明,数据的汇聚正在打破原有的商业竞争格局,并呈现出商业垄断的特征。因此,有必要重新认识数据垄断问题,包括数据垄断的概念、特征、危害和成因,以及与之相关的反垄断治理。

二、数据垄断:人工智能时代垄断的新形态

垄断是一个经济学术语,最早是指市场参与者的操纵行为,后来延伸为独自把控市场和指挥市场,具有独占和限制他人参与竞争之意。通常情况下,这种垄断局势的形成与权力和利益直接相关,基于市场垄断的市场参与者,往往能够从中获取非垄断条件下无法获得的巨额利润。所以,自由市场的发展走向,很容易走向垄断。因此,市场的宏观调控显得尤为重要。这就是“有形的手”与“无形的手”必须结合起来的现实要求。

历史地看,自垄断形态出现以来,不同的历史时期表现出不同的形态,分别有特权垄断,资源垄断等,而这些垄断的终极表现都仅仅是市场垄断的一种。在西方世界,垄断最为严峻的时期便是工业革命以来的资源垄断,包括石油、煤矿、天然气、电力、电信网络等资源的垄断,如美国洛克菲勒家族、罗斯柴尔德家族、摩根家族等,都是在垄断经营方面获利较大的家族财团的典型代表,导致很多中小企业被吞并,对自由市场造成恶劣影响。从目前来看,垄断的历史正在出现新的形态,从古代的盐、铁、茶、丝绸等的垄断,过渡到石油、天然气、电力等的垄断,再到信息通讯、电子技术、网络等的垄断,慢慢地开始发展到如今的新一轮资源争夺战——数据垄断。

数据垄断是一种新形式的垄断。数据垄断可从数据拥有、数据控制、数据流通、信息保护、数据收益等各角度进行“垄断”,一般是少数几家公司可持有并控制大量数据。这些少数公司被称为数据寡头,他们具有较大的市场竞争优势,以及潜在的滥用市场支配地位的可能性[1]。所以,在我们看来,数据垄断主要是指将数据作为目标对象的绝对控制和绝对占有,包括对数据采集、存储和使用等各个环节的占有,集中表现使用环节的价值占有,可以理解为市场参与主体对数据的统治地位。而这些能够获得统治地位的主体,一般包括超级智能平台和企业组织两大主体。同时,从已有的垄断形态来看,目前的数据垄断具有隐蔽性、覆盖性与服务排他性等特征。

第一,隐蔽性。相较于其他时代,智能时代的数据垄断更具有隐蔽性特征,很多的垄断都是在“不经意间”就已形成。不像前几次的工业革命时代,在垄断的前期会出现激烈的竞争,不管这种竞争是围绕什么而展开,都具有显在的外在属性,让人一眼便能洞察。然而,人工智能时代的数据垄断,却是通过另外一种形式——平台,达到垄断的目的。人工智能时代以“平台”为手段的数据垄断,显著地区别于“以资本为手段”的传统垄断,这种垄断通常发生在人们“被迫自愿让渡数据主权和使用权”以换取服务的任何时刻,让人看起来很“合情合理”,也不见得在竞争的过程中出现“流血和牺牲”。换言之,人工智能时代的数据垄断,是相关的智能服务平台用服务换来的垄断地位,一旦平台形成服务优势,便会将众多的用户数据导向某几个单一的服务平台,并迅速集成数据垄断优势,后来者将很难再超越。

第二,覆盖性。数据垄断的覆盖性,也可以称为重叠性,市场上所有的数据资源都可以为众主体所共有,最容易被形成数据垄断优势的数据对象,多数是缺乏明确数据主权的数据,或者是“用服务兑换所有权”而得到的数据,又或者是游离于各大虚拟空间的碎片化数据等。由于这些数据本身不具有对抗性,而是呈现出非对抗性特征,这就间接地决定了数据垄断的覆盖性特征,即相同的数据很有可能为多个主体同时共同占有。但在占有的同时,因为数据采集主体本身的“实力”有别,便出现这样一种现象:各个小的数据采集主体所具有的数据,某个别数据采集主体都有,且这些个别数据采集主体还掌握了很多不被其他数据采集主体所能掌握的数据,从而形成人工智能时代的数据垄断的覆盖性特征。

第三,服务排他性。数据垄断的服务排他性,是指各数据垄断主体所采集的数据之间存在“覆盖性”,那些能够掌握更多数据的主体,自然能够用这些数据训练出更好的智能服务产品,从而由数据垄断优势衍生出市场垄断的现实情境。譬如,某款服饰的各大销售商,在刚开始都是销售相同的款式,但随着最初的销售量的变化,后继而来的消费者便不再信任销售量低的销售平台,从而形成细分领域的销售垄断,本质上就是前期销售数据的垄断导致后继的市场垄断现象的发生。

三、“三宗罪”:数据垄断的现实危害

人工智能时代,与以往时代不同的是,人类的整个历史空间不再仅仅止于物理空间,而是不断地向“虚拟空间”和“孪生空间”延伸,物理空间、虚拟空间与孪生空间的并存,将整个人类的历史连接方式带入了新时代——“以数据为基础”的智能时代。换言之,在智能时代,谁能获得更多的数据控制权,谁将拥有更多地与不同世界对话的权利。因此,便催生了世界各参与者对数据的倾慕之情,更有甚者,还出现了极端的数据崇拜,从而不断地驱使人们无休止地进行数据的采集与汇总工作,最终导致数据垄断的出现。

人工智能时代的数据垄断,本质上是服务“权力”与“利益”的垄断,存在诸多社会危害,包括对智能服务对象的危害、智能服务参与者的危害,以及对市场秩序的扰乱等。

第一,数据垄断对服务对象的危害。一是服务对象将要花费更高的价格才能换取相应的服务,导致生活成本增高,整个消费网络的边际成本会上升,从而影响人们的生活质量和水平;二是滥用市场支配地位侵犯服务对象的隐私权,如果长期存在数据垄断的情况,将会导致数据垄断企业一家独大的局面,很多类似的服务型企业无法再参与其中,各大企业之间的那种相互监督的约束机制消失,从而会致使垄断主体“膨胀”,缺乏同行相互监督的它们往往会毫无顾忌地滥用服务对象的隐私。因为数据集中可能产生的封锁效果、数据集中可能导致隐私保护水平降低[2];三是服务对象所获得的服务质量会下降,缺乏竞争的市场环境,往往会导致服务提供商形成以“利益”为中心的服务链条,服务对象被边缘化;四是社会的就业岗位会变少,工作缺乏多样性,不利于个人发展和社会稳定。

第二,数据垄断对服务参与者的危害。人工智能时代的数据垄断,由于具有覆盖性的垄断特征,虽然在显在的层面并未形成垄断优势,但在其“隐蔽性”特征的庇护下,逐渐演化为市场的覆盖性特征,从而导致众多市场参与主体被迫退出竞争舞台。通常情况下,数据控制者基于“数据优势”拥有强大的市场力量,为了维护这项竞争优势,可能会滋生限制竞争行为[3]。而对于非数据垄断主体而言,这种打击是毁灭性的,意味着迎接他们的将是两种命运:要么宣布破产,要么被并购和吞并。就数据垄断主体而言,他们除了获得丰厚的利益外并无其他益处,一旦本质暴露,他们将“置自身于不义”的环境之中,面临的将是各种反垄断条文的针锋相对,以及相关市场监督机构的封锁和调查,最终耗费垄断主体绝大多数的财富,以致他们没有更多的时间和精力投身于研发和创新,导致整个企业的运营陷入死循环。

更有甚者,消费者的反馈对于他们而言,将变成“我们是全国乃至全世界的第一供应商,在目前并不能解决你们反馈的这个问题”的一句套话,这或许成为他们最强劲的“借口”。未来,谁掌握了行业大数据的控制权,谁就占据了行业的统治地位,这也是跨界打劫的数据基础[4]。智能时代的数据垄断之危害,正如“跨界打劫”这个表述一语中的。因为数据垄断的开始,是源于某种特定细分领域的数据垄断。但是,如果这种垄断的数据逐渐变成垄断大数据,数据垄断主体将会获得社会全员的“多源异构”的需求数据,服务对象的各种服务需求都将被某一家服务提供商“一网打尽”。

第三,数据垄断对市场秩序的危害。人工智能时代的数据垄断,是基于“平台”的隐蔽性垄断,当相关的服务平台达到一定的服务规模之后,数据的集结便会产生极大的创新价值优势,从而为数据服务主体带来更多满足服务对象的创新契机。自然而然,服务对象便会形成对平台的依赖,最终导致平台的自然垄断的产生。特别是规模较大的平台很容易实现某种程度上的“自然垄断”,而传统的竞争法规却很难对其实施有效监管。简而言之,智能时代的垄断更容易,反垄断更难。但其危害和传统的垄断行为一样,都会损害市场竞争秩序、阻碍创新,扭曲资源配置,造成极大的不公平,从根本上损害社会利益、消费者福利[5]。

同时,还需要注意的是,智能时代的企业的数据垄断,往往会因为“政企”合作而巩固相关企业的数据垄断地位,这就加大了对数据垄断的反垄断难度,从而形成顽固不化的垄断集团。就市场秩序而言,“平等交换”和“公平竞争”是其最为基本的构成要素,那么,智能时代的数据垄断,因为“智能服务参与主体的逐渐退出”和“垄断价格的不断形成”这两种现象交叉出现,可以很显然地看出,这两个基本的构成要素正在因为数据垄断问题的出现而丢失,整个社会的运行已经存在潜在的“市场失灵”风险。

四、反垄断治理:数据垄断危害的消解

在人工智能时代,由于数据垄断所带来的价值巨大,因此引发很多企业开始规划垄断之策,由此而催生Google收购DoublgCBck、Microsoft收购LinkedIn、腾讯与华为、顺丰与菜鸟等数据垄断之争。正是数据的采集、存储与使用的过程涉嫌垄断行为,像Google、Facebook、Microsoft、Amazon等大型跨国公司,自然首当其冲,不得不接受相关的反数据垄断的调查。从构建一个“有功能的社会”的角度而言,人工智能服务主体的数据垄断行为,更多的是给服务对象和市场秩序造成阻碍作用。所以,亟须考虑如何有效进行反垄断治理,以减少因数据垄断而酿成的社会危害。

第一,严控市场头雁。智能时代的数据垄断之治理,应该着重从智能服务提供商的维度进行考量,正所谓“源头治理”。从数据垄断的特征来看,其隐蔽性特征在某种程度上反映出智能时代的企业垄断行为的双重属性:一是主观意愿层面的垄断行为;二是非主观意愿层面的垄断行为。对于前者而言,这些领头的企业一方面是需要认清数据垄断可能带来的危害,以及自身背负的社会责任和使命,并迅速纠正自身的垄断行为。至于后者,应该在意识层面积极关注自身优势的同时,要慎重考量自身的当前状态是否已构成垄断。如上两个方面,主要是从领头企业的主观层面进行的治理分析,行动的基础在于企业的责任使然。但是,仅此并不足以治理好数据垄断的行为与问题,具体还应从治理的奖惩与法律层面进行寻解,通过客观手段强制干预领头企业矫正自身的数据垄断行为,以免加大数据垄断的社会危害。

第二,完善市场机制。市场是一个相互协调运行的竞争机制,数据垄断的形成主要源于智能服务参与主体的破产退出,进而破坏市场运行的自由竞争环境。因此,完善市场机制方面应该采取三个措施进行治理:首先,是加强国家的宏观调控能力,加大社会政策对垄断企业的潜在竞争对手的支持力度,以增强市场的竞争活力;其次,是孵化更多新型创新创业企业,从新的服务领域抢占智能服务细分领域的制高点,从而形成新兴市场竞争力量,分解数据垄断主体的垄断地位;再次,是鼓励不同领域的领头企业之间的相互监督与跨界创新,营造新的市场竞争格局;最后,是完善市场监督机制,提升社会各界对相关智能服务商的监督和反馈,从而达到督促和责令智能服务商放弃垄断数据的权益。

第三,建立监督平台。建立专门化的数据垄断监督平台,主要是从负责人、监督条件、监督与评估制度、奖惩机制等四个方面进行考虑。首先,在建立监督平台时,需要注意平台负责人的资质和水平,关键看其是否具有完成相关监督任务的能力,包括带领团队的能力、干预数据垄断主体的能力、建立评估垄断指标的能力等;其次,在监督条件方面,需要考虑软件和硬件设施,以及可以用于完成监督任务的人力资源和物力资源等,如运行监督平台的人,至少应该能够熟练地掌握相关智能业务的具体操作内容,以免错过发现很多数据垄断的行为和数据的采集机会;再次,制定监督与评估制度,这是平台最为基础的任务,也是最为艰巨的任务,需要平台根据相关的法律法规和现实条件,制定一整套能够指挥平台运行的制度章程,以及制定能够有效评估某项智能服务主体是否存在数据垄断的量表,进而从量化维度明确“反数据垄断反的是数据垄断行为[6]”,而不是其他;最后,完善奖惩机制,不仅要激励平台员工积极投身各大运行平台的监督工作,而且还要有严格的员工守则,出现违规行为时要受到相应的惩罚。

第四,加强立法工作。数据垄断的一个重要因素在于法律漏洞,使很多大型智能平台服务商有可乘之机。因此,智能时代的数据垄断问题的治理,需要着重思考法律层面的治理策略。智能时代,是一个“以数据为驱动”的时代,数据的生产者、数据的管理者、数据的监管者、数据的服务对象等参与主体,共同塑造了数据的“全生命周期”,不同的阶段存在不同的受益人。数据生产者即数据主体,却不是数据的最大受益人,更有甚者,他们反而成为数据垄断的最大受害者。更为确切地说,是数据管理者用数据主体的隐私数据来达到数据垄断的目的。因此,从法律维度进行数据垄断的治理,要考虑三个方面的具体策略:数据确权、数据利益反馈与共享、责任追踪。

首先,数据确权。通过法律给予数据确权,以期将数据所有权和数据使用权进行明确界定。从当下来讲,需要借助区块链技术建立数据的溯源代码,让每一份数据的产生都具有明确的数据主权,在技术确权的条件下,用法律的形式将之合法化,进而保证运行于市场上的数据的获利与数据生产主体直接相关。并且,他们能够就此进行时间层面的限定,比如某个数据生产主体在购买某次服务时,如果不同意数据管理者将自己的数据运用于其他途径时,管理者将不能再将之进行分析和采集,而只能用在与本次相关的一次性服务中。另外,数据生产主体若要将数据进行出售,他还可以限定数据的用途和时限,确保数据的正确价值导向,而不至于被用于建构某些具有歧视的算法模型。

其次,数据利益反馈与共享。数据垄断主要是源于利益的驱动,如果能从法律的维度建立有效的利益反馈与共享机制,能够将垄断行为缩减到最小。或者说,这是另外一种社会分配制度,全社会成员都将成为从数据服务产品中获益的人。借助区块链进行数据确权,能够将数据产生的价值进行有效的分配,进而有力地制约数据采集主体的行为,以至于他们每次在采集数据时,都需要衡量一下自身的利与弊,而不是像之前那样“恣意妄为”。当然,在此基础上还应该通过特定的法律规制,保护合法的数据利益反馈与共享行为,同时也要实现“对于经营者以数据专享为名实施排除、限制市场竞争的行为,影响数据共享的,则应予以规制[7]。”所以,有效的数据利益反馈与共享机制,本身就能起到法律监督的作用,只是它将制定平台的监督责任划分到了每一位社会成员手中。

最后,责任追踪。从责任维度来看,立法者需要考量数据垄断的相关责任,包括因垄断过程中造成的市场秩序混乱的责任、数据主体的隐私被侵犯的责任等。同时,还要将数据管理者和数据监督者进行法律层面的分离,目前很多的数据管理者身份与数据监督者的身份是重合在一起的,这不利于数据本身的正向价值的发挥,而且无法保证发生数据垄断行为时能够得到及时地制止。所以,需要对二者进行明确的划分,不能将两者混淆在一起,否则,很容易导致数据滥用的行为发生。另外,政府和企业也需要进行明确的责任划分。目前的政府服务外包,为很多与政府合作的企业开通了整合数据的“方便之门”,他们不仅能够拿到自身的服务数据,而且还能从政府的手中拿到政府平台的公民数据,从而形成一个全方位覆盖公民的数据采集网络,彻底将公民置于一个裸露的环境中。所以,政府和企业都应该在合作的过程中为公民的隐私被侵犯问题负责。在一些特定的情形中,即使是明确了数据所有权,但是由于一些数据属于保密型数据,与个人隐私有关,所以也是不能进行交易[8]。并且,政府不应该成为企业数据垄断的“助推手”,而是应该要继续延伸“政企分离”的时代内涵,“它不仅仅是服务的分离,更应该是责任的共担”。

猜你喜欢

主体人工智能时代
论自然人破产法的适用主体
2019:人工智能
人工智能与就业
HANDS OFF THE WHEEL
数读人工智能
e时代
e时代
e时代
下一幕,人工智能!
关于遗产保护主体的思考