数据治理的底层逻辑与基础构架
2023-02-25张文魁
文/张文魁
随着数字经济的快速发展和经济社会的数智化演进,特别是随着人工智能渗透力的不断增强,数据的重要性及问题日益凸显。但是应该认识到,关于数据议题,不仅仅需要引入政府的规制政策,还需要在探索中逐步形成良好的数据治理,这两者并不完全是一回事。2022年12月颁发的《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》,就提出了“数据要素治理结构”和“数据要素治理制度”的命题,2023年9月开始实施的《欧盟数据治理法》(Data Governance Act,DGA)则引起了全球广泛关注。要形成良好的数据治理,首先应该把握底层逻辑,并在此基础上讨论数据治理的基础构架,否则有可能陷入逻辑混乱和政策失据。这其实就是“扣好第一粒纽扣”。
一 正确理解数据和数据权利
如果对数据和数据权利不能形成正确理解,就无法把握数据治理的底层逻辑。首先应该认识到,数据的本质在于,它是关于事物状态的信息,即“状其物”,是人类状物,这其中包括人类的理解、分析以及判断,并延伸到思考、想象甚至情感;因此,“状”也许比较准确、客观,也许并非如此,或者还包含一些“状其情”。也就是说,数据是客观世界在人类认知上的投射。所以,数据不是新东西,也不是神秘的东西;不过,当人类有了身体器官之外的先进器具和方法去采集各种状态信息,并且有需求去加工和利用这些信息,数据体量就可以无穷无尽地膨胀。信息通信、人工智能等技术的不断突破,使得数据的采集、流转、加工、使用进入了大数据时代。毫无疑问,大数据正在成为经济社会发展中越来越重要的投入品。
更重要的是,数据会涉及到非常复杂的权、责、利关系。在大数据时代,原始数据和加工数据有了各种各样的用途,这些用途在很多时候并不为数据投射物,或者数据投射物的拥有者所知晓、所愿意、所同意。这里的投射物,以及投射物的拥有者或管理者,很多时候是人或者人的团体。即使不是如此,大数据的用途也是直接或者间接针对人或者人的团体。也就是说,数据会牵扯到人和人的团体,因此自然就会导致人的权、责、利问题。数据权责利与劳动有很大不同,劳动对应的是人的个体,权责利相对容易界定,数据显然不是如此;而且,劳动最终需要个人的同意才能付出,而数据完全可以在没有获得人的同意的情况下就得以形成和使用。因此,人或者人的团体的数据权利,以及有关利益和责任,就成了一个基础性问题。
而数据权责利的源头和基石,应该是数据采集。采集使得“状其物”“状其情”第一次与人相关联,或者说使状态变成了人类所认知的信息和数据。此后的数据转移、加工、使用,都基于采集,所以与转移、加工、使用有关的权责利都由采集的权责利所延展和衍生,尽管链条愈长,与采集的关联愈小。而且,正因为数据采集很容易不为数据投射物或其拥有者和管理者所知晓、所愿意、所同意,投射物或其拥有者、管理者的权利很容易被忽视和侵犯。
对数据和数据权利有了这些认识,就不难理解,为什么需要建立数据治理,而不仅仅是加强政府对数据的管理。第一,在一些情况下,数据投射物或其拥有者、管理者与数据采集者之间,以及后续的转移者和加工者、利用者之间,可以较好地达成自愿契约,以大致界定数据的权责利。这是一种典型的自治逻辑。第二,即使如此,后续的数据转移、加工、利用场景,可能超出当初形成契约时的想象,甚至数智化进程本身就会使数据的权责利不断超出此前的想象,所以演进式的基本法律和政府规制仍然十分有用,这就需要一个能够鼓励和引导探索、包容和接纳演进的治理框架。第三,数据不断转移、加工、利用,会使衍生数据与原始数据之间的关联性越来越弱,甚至人工智能等技术会对数据进行自动化的再创造,从而使数据之间,以及不同权责利主体之间的关系越来越复杂,并难以辨清,甚至难以提前预知数据的使用场景和所生利益;显然,给主体多变、关系复杂的数据场景以自我探索、自我协调的空间,有极大的必要性。第四,不管数据场景如何变幻,国家甚至国际社会,应该预置一些基本原则,譬如必要的透明度和诚实性,以及必要的相互制衡,对于人类最基本权利和尊严的尊重——譬如为处于权利链条低端的个体和团体提供适度保护,等等,都属于人类进步的基本共识,应该体现在数据世界的实际当中。总之,数据治理注定将是一项极为重大的议题。此外,国与国之间也会存在数据权责利的分歧和纷争,从而需要国家之间进行协调,也就是说,全球数据治理也有必要纳入我们的视野。
不过,构建数据治理也将是一项极为艰难和晦涩的工作。这主要是因为,作为数据治理基石的数据权利,至少在相当长时间里,很难获得有基本共识的清晰界定。申卫星在对数据权利文献的相关争论进行了综合分析之后,指出了数据确权之难,并认为这个难度主要是因为数据非常特殊,不同于传统意义上的财产,并且涉及个体隐私等。[1]申卫星的看法很有代表性,因为“数据确权难”在国内外几乎是一种共识。不过申卫星仍然强调了数据确权的重要性,许多学者也持类似立场。但从数据世界的十分复杂的实际情形来看,很有可能的进路,将是基于具体场景来大致分配数据的权责利。美国学者Nissenbaum可以算是这种进路的代表,他强调,对于数据而言,只能在“对场景的尊重”中,实现数据的“场景性正直”(contextual integrity)。[2]这个进路有两个关键元素,第一是场景,即数据权责利在不同的具体场景中可能大不相同;第二是正直,也可以理解为正义,即不管在什么样的场景下,数据会被怎样地采集和转移、加工、利用,必须遵循正直、正义。另一位学者Waldman也认为,数据权利边界需要根据其在具体场景中的合理期待来确定。[3]
可以预料,在数智化时代,各种数字场景将超出目前的想象,使正直和正义面临许多从未考虑过的场景挑战,从而令数据治理与其他领域的治理有着显著不同。唯其如此,为数据治理寻找和确定底层逻辑,才尤为关键。
二 数据治理的底层逻辑
(一)底层逻辑之一:超越生产要素和财产的数据基本权利
数据正在成为经济社会发展中越来越重要的投入品,但从治理角度来考虑、从权利角度来审视,数据显然超越了生产要素,即使从经济学框架来看也是如此,因为所谓的生产要素具有高度概括性和抽象性,劳动、资本等生产要素的投入量都可以进行价值度量和经济增长贡献核算。数据难以被这样对待和作这些处理。劳动和资本等生产要素也会在使用中被消耗掉。而且,数据的权责利绝对不仅仅限于被当作生产要素的权责利,即使数据没有进入生产过程,没有滋生经济价值,它仍然可能涉及人的基本权利,譬如人格权、隐私权,以及由此衍生的关于个体安全、个体尊严、个体独特性、个体自主性方面的关切,等等。这些基本权利和关切,很难或不能、不应像财产、资产那样进行标价和交易,也不可能像所有权、产权那样进行界定。我国的民法典,对人格权的阐述与对所有权、质权的阐述就是完全分开的,其中明确规定人格权包含生命权、身体权、隐私权和个人信息保护,明列了私人生活安宁、私人空间不愿为他人知晓的正当权利。因此,简单地把数据视为生产要素,以及资产、财产,并在此基础上进行数据资产的产权界定和资产交易,根本不能全部覆盖数据权责利的所有方面,甚至可能导致荒谬的思维和思路。试想,在人工智能环境中,数据政策如果仅仅盯着数据是否能够产生最大化的经济价值,以及如何分配这些价值,这样的政策至少是不健全的,甚至是舍本逐末的。
目前,已经有许多学者对数据权利、责任、利益等进行了大量讨论,为下一步厘清数据基本权利、构建数据治理底层逻辑提供了有益探索。时建中就强调,数据是信息载体,被数据承载的信息,或许关于个人,或许关于企业、国家,同时又指出数据变成了生产要素;从而认为,数据作为信息载体,构建数据制度的优先目标是维护数据安全,而数据作为生产要素,构建数据制度的优先目标则是开发利用,这两个目标虽然不一致但必须统一起来。不过他也认为,对数据权利无法也不能作出类似所有权那样的权利安排。[4]许可则聚焦于数据的财产属性,从财产权利的角度来构思数据权利,认为把数据权利分解为数据资源持有权、数据加工使用权、数据产品经营权,有调整改进的空间;并指出,个人数据、企业数据、公共数据实际上处于相互糅杂状态,很难截然分清。[5]易继明和钱子瑜则提到,个人数据权利保护事关个人财产和人格尊严的实现,而国家数据制度还涉及社会治理和国家战略,但他们主要还是论述数据的“财产性权利”,把数据权利视为一种新兴财产权;不过他们也意识到,数据与信息之间存在一种特殊的紧密关系,并指出了信息层面的在先权利无法对数据形成直接的支配关系;他们还提出了数据信息权的概念,但把数据信息权窄化为对结构化数据的权利界定和保护,从而将数据信息权视为新型知识产权,也就是说,终究是一种财产权利。[6]其他许多对数据权利进行分析的文献,还对数据资产、数据交易进行了讨论,但几乎都倾向于,以及局限于,把数据作为财产,把数据权利指向数据产权。
如果把数据权利局限于产权,很可能是一种错误的逻辑,很可能难以构建正确的数据治理。在无节制的数据采集中,即使对隐私权受到侵犯的人,给予经济补偿,也不能认为隐私权是一种产权,因为这种经济补偿不应该视为产权收益,恰如对凶杀案受害者家属给予经济补偿,不能将这笔金钱视为死者出售生命所得。因此,超越财产权利逻辑,才能找到数据治理的正确的首要底层逻辑。好在已经有一些研究意识到了这一点。譬如,刘清生和黄文杰就强调了数据利益的特殊性,即其蕴含着人格利益和财产利益,明确指出了人格利益需要纳入数据利益的谱系;不过,他们又认为,在数据的集合利用中,又发展出数据的社会利益,从而引申出数据社会权的概念,但却缺乏充分且必要的陈述。[7]在现实当中,数据权利的争端,更是大量地涉及人格权,特别是隐私权;不管是国内还是国外,有关法律法规也含有这方面内容,只不过得到有效施行的程度并不是很高,而且不时处于争论和摸索之中。
正因为存在这方面的争论和摸索,才给数据治理带来极端必要性和极大空间。在超越生产要素的数据基本权利逻辑中,数据治理思维,就是要使那些初始的基本权利,得到尊重和保护。确立了这个底层逻辑,数据治理的其他底层逻辑,以及数据治理的基础构架乃至具体制度,都将应运而生。
(二)底层逻辑之二:数据采集者与数据投射物或其拥有者、管理者之间的契约
作为信息载体的数据,在数智化环境中将会延展为长远的数据链条,而最容易把握,也最应该得到尊重的初始基本权利,就是数据采集环节的知情权和同意权。不管数据是在怎样的场景中得到采集,也不管初始采集的数据将得到怎样的加工和转移,数据投射物或其拥有者、管理者,都应该在知情和同意的前提下才可以被采集数据,并且可以选择数据不被采集。进一步而言,数据投射物或其拥有者、管理者,应该基本理解数据采集对其意味着什么。尽管在目前的实际当中,要使这些权利得到保障似乎有些“奢侈”,甚至许多个体并不在乎这些权利,但数据治理必须秉持这样的思维,从而政府可以沿着这样的思维来确定一些基础性的简明规制政策,以便把数据规制融合于数据治理框架之中。
如何实现这个知情权、同意权?如何帮助数据投射物或其所有者、管理者获得对采集意义的理解?合乎逻辑的方式,就是建立简洁明了的契约,哪怕是自动契约。一些学者对实现数据权利的方式进行了探讨,其中就涉及到契约的建立。康宁就指出,数据持有、使用、交易的权利在实际中引发了大量争议,但传统理论和制度对数据确权存在解释力不足的问题,并认为整体确权有很大局限性且在实际中难于推行,所以应该实行进程确权,而进程确权则应引入合约逻辑。[8]他虽然在总体上仍然没有摆脱产权思维,但其基于具体场景、承认数据链条的权利观应该是正确的,特别是其中的合约逻辑,即在不同场景的讨价还价中建立合约,应该是可行的进路。在现实当中,许多做法正是如此,尽管采集合约还很原始,甚至故意把合约内容设计得模糊隐晦,特别是以自动化的方式,譬如默认、勾选等方式,来淡化合约的存在。在我国,尤其是政府机构在对公民进行管理和服务时,常常采集公民个人数据,就存在一个很大的灰色空间。
不过从治理视角而言,不管数据采集的知情权、同意权被设计得如何隐蔽,引入初始契约的意义是毫无疑问的;不管如何掩饰,合约的重点应该是知情和同意的问题,然后才会有利益的分配、私人信息的使用,以及数据的私人信息含量等问题。当然,契约最好还应该包含数据投射物或其拥有者、管理者的数据访问权、删除要求权等内容。而要增强知情和同意的力量,就应该在具有操作性的法律中,强化知情和同意的契约性质,譬如欧盟于2023年9月开始实施的《数据治理法》,就明确了数据共享行为的合约基础,即强调需要通过协议来促进个体直接或者通过数据中介向数据使用者提供数据,这无疑就强化了契约的地位。
需澄清的是,这样的初始契约,并不完全是关于财产权利的界定和利益的分配。此时,数据还不是资产、财产,而是被采集者的状态信息,或者所延伸的思维、情感等信息。这也就解释了为什么采集契约的重点,就是数据投射物或其所有者、管理者知晓哪些信息将被采集,这些信息对隐私、人格、安全以及社会关系和经济利益等会有什么影响,以及数据可能会有哪些用途或不会有哪些用途。当然,知情权、同意权并不排斥经济鼓励或补偿,但并不应该被视为这是在行使财产权利。而且,由于采集后的数据使用场景更加复杂,数据使用所能带来的经济利益也很难预知和预算,所以最初契约的重点并不是经济利益分配。如果最初契约对数据使用承诺了足够的脱敏措施,很可能不会涉及到第二次、第三次及更多次的经济利益分配,这将使最初契约摆脱此后数据链条延长时所引致的利益分配纠纷,也有利于促进初始契约的标准化、规制化、法治化,譬如由政府统一设定默认的初始契约,由数据采集者单方面主动实施并担负履约责任。
当然,在采集环节的初始契约之后,每个环节都可以有各自契约。为了使数据加工、转移、使用的链条能够延伸得尽量长并产生更多的有益用途,国家应该大力发展数据脱敏、隐私计算等技术,并推行广受信任、广被接受的数据脱敏标准,使之成为数据治理的基础性技术之一。国家也应鼓励一些探索性的数据模式与生态,譬如数据信托。在这样的基础上,初次采集者可以免于承担后续的数据转移、加工、使用可能带来的连带责任,从而构造比较合理的责任链条,使契约关系更加简洁和易于操作,使数据治理更加灵活化、多元化。
(三)底层逻辑之三:对数据利他主义的鼓励与引导
毫无疑问,数据治理的底层逻辑不应止于超越生产要素和财产的数据基本权利,而且这些基本权利也不限于数据采集环节的知情和同意权。在采集之后,加工、转移、使用的场景将更加纷繁复杂,数据权责利结构,也即所涉及的个人和团体将远远超出采集之时,从而使数据治理进一步复杂化。同时,数据脱密、数据合成等技术方法的发展,也可能使后续数据与最初的数据投射者之间的关系模糊化,从而改变权责利结构。不过这并不值得过分担忧,也不需要在数智化时代刚刚起步的今天就设计得一清二楚、完备健全,恰如在工业化刚刚起步的十七八世纪,哪个国家都难以设想和设计未来高度发达工业化时代的产权和民权体系到底是什么样。只要我们对治理抱有信心,它就会向前演进。
因此,顺理成章的逻辑就是,如何使采集后的数据得到更多的加工、转移、使用,强化数据提供和再利用程度。在数智化时代,数据具有强大的驱动力,而且这个驱动力与被使用的数据体量,也与数据的被使用次数,成正比。为了促进这种局面的出现,除了可以给予被采集者以一些经济补偿之外,还应该大力鼓励数据利他主义。这是因为,利他主义的盛行实际上最终可以利己,即更加发达的数智化也会使自己的生活、工作变得更加便利、繁荣和美好。鼓励数据利他主义,可以借鉴对献血和捐献器官的鼓励方法,即献血者、签订器官捐献协议者,在自己需要血液和器官移植的时候,有输血和移植器官的优先权。我们应该大力探索和发展数据利他主义制度,只要加入这样协议、从事这样的行为,个人和团体就可以获得数智化接入、数智化服务的某些优先权或便利权。
事实上,欧盟于2023年9月开始实施的《数据治理法》,一个重要内容就是引入数据利他主义,即为了增进公共利益和经济社会发展,而鼓励公共部门和团体对数据进行释放和公开,从而促进数据的进一步转移、加工、使用;同时也规定了保护隐私和秘密、防止数据不当利用的措施。该法对欧盟认可的数据利他主义组织如何注册、如何管理也提出了具体标准和合规性监管要求。我国一些学者也开始关注欧盟的数据利他主义制度。唐鸿宇就分析了欧盟《数据治理法草案》所存在数据利他逻辑和数据共享模式,并分析了这种双重逻辑的优缺点。[9]张韬略、熊艺琳认为,欧盟的数据利他主义的本质是数据持有人基于公共目的向公众和机构提供数据,但也暗含着数据主体对该行为同样有利于自身的期许。[10]从这些学者的分析来看,以及从该法的条款来看,欧盟的数据利他主义只是一个初步尝试,范围还比较有限。
我国其实可以探索和试行更加广泛的数据利他主义政策,并纳入数据治理逻辑。一方面,数据利他主义完全可以从公共数据领域向非公共数据领域延伸;另一方面,数据利他主义不应该完全是民间化、自治化的行为,政府必须进行一些基本引导和监管。这与政府鼓励人们签订器官捐献协议是一样的道理,即器官不允许买卖,因为这涉及人类的基本道义观、伦理观;如果任由社会把器官捐献协议扭曲为变相的器官买卖,而由市场定价来配置器官资源,这至少在目前阶段很难被大多数人所坦然接受。而由于数据涉及人格、隐私、安全等方面的关切,也不能任由民间社会把数据利他主义扭曲为变相的私密数据买卖行为。政府的引导和监管,除了应该防止借“利他主义”幌子实行不正当的数据收买和数据黑市交易,主要应该聚焦于数据用途,即对任何将数据用于明显的欺诈、造假、侵权等行为,都要进行惩处;特别是在人工智能时代,数据的后续使用极有可能与数据的最初来源失去关联,数据用途可能会涉及社会安全和人类伦理,所以在数据利他主义框架中,政府职能的引入,更应该着眼于数据用途。
(四)底层逻辑之四:对用途的匡正与问责
数据之所以被采集、转移、加工,最终目的还是被利用。数智化时代的本质特征之一,也恰恰是大数据的利用。因此,数据治理的底层逻辑,如果说第一条是数据的起点,即数据采集,那么最后一条无疑应该是数据的重点,即数据使用。
但遗憾的是,无论是研究文献,还是我国的构建数据基础制度等方面的文件,很少对数据使用环节,特别是其用途,给予足够关注。仅有少数学者触及了数据用途。譬如方燕提到了数据用途的多种多样,指出大数据和算法的竞争定性需要根据数据的具体用途而定。[11]虽然她只是从反垄断的角度来探讨数据用途,但是强调对用途的考察,是非常有意义的。从逻辑上来看,无论是数据规制,还是数据治理,在漫长的数据链条的中间环节,即加工、储存、交易、流动等环节,来施加影响和控制,比较困难;而从入口和出口,即数据采集和使用环节,来施加影响和控制,则容易得多。而出口在一定程度上比入口更具重要性。因为一方面,出口的可见度要高得多;另一方面,数据的价值最终还是使用,不管数据链条有多长、绕多少弯,或者链条多么隐秘,也不管数据得到利用时与最初被采集者之间的距离有多远、对应关系有多模糊,数据最终还是要使用,而使用就会显示其用途。
从人类的基本判断力来看,不管是什么用途,还是能够大致辨识正当和非正当。Nissenbaum所强调的数据“场景性正直”,最应该也最能够在用途中得以体现。因此必须对数据用途进行匡正。恰如在工业化时代,强大的工业机器、工业能源,不能用来随意拆除居民住宅、不能用来给人们施以酷刑一样;数智化时代的数据,不能用来更好地监控个人行为、窥探个人秘密,也不能用来刺激和放大人性弱点以实行诱使、欺诈、情绪控制等活动,当然也不能用来危害社会秩序与安全。如果数据用途涉及上述方面,政府和社会应该有一种自觉性和相应机制,来匡正用途。
同时,还应该对明显违背正当用途的行为进行问责。方燕和隆云涛评述了数据和算法的伦理责任问题,人工智能的剽窃和造假、对言论的诱导和干涉等问题,以及对不同个体的歧视性对待问题。[12]但从更广泛的视野来看,数据用途,以及算法用途,所涉及的责任,肯定不仅仅是伦理责任,因为在现实中,许多用途已经显性地触犯了已有法律规定的基本利益和基本秩序。除此之外,对数据和算法用途的问责,还应该延伸到新公害领域。张文魁就论述了数智化新公害,他指出,工业化时代的污染、生态破坏等传统公害已得到广泛重视和治理,而数智化时代的数据与算力、算法结合在一起,使人工智能等新兴技术和业务具有十分强大的威力,一方面会造福社会,另一方面也会出现很多在工业化时代不曾有过,或不曾引起广泛关注的新公害,譬如对数据和算法的利用,很可能会极大地刺激注意力经济和致瘾性行为,从而使经济社会竞争走向扭曲化、个体行为走向失控化,此外人工智能也很容易被用于偷窃、造假甚至暴力、杀戮。[13]显而易见,对新公害的防范、遏制和问责,应该作为数据治理底层逻辑中的十分重要的内容。
总而言之,无论对数据和算法以及其他数智化技术和技能的使用,有多么新颖,有多大创新,会多么有力地促进新兴战略性产业的发展,基本的问责机制十分必要。问责完全可以在相当程度上避免对创新精神的扼杀,因为对于明知故犯、恶意施害行为,不管是不是涉及数据和算法,仍然是可以识别;而对于创新中的无心之过、非恶之错,是可以宽容的。
三 数据治理的基础构架
(一)个体维权与利他通道
治理不等同于政府监管。治理最重要的机制之一,就是个体获得较强的权利意识和维权自觉性,并且有正常的、合理的维权通道。建立数据治理的基础构架,首先就是要建立并畅通个体维权通道。这里的个体,既包括个体自然人,也包括个体机构,企业当然也在其内。设立个体维权通道的目的显而易见,就是当个体得知数据被不知情、不同意地,或违背契约地采集、转移、使用时,不管数据是否产生经济利益,也不管个体自身是否受到任何伤害,都能有合适的通道来维权。这样的通道,当然包括接受诉讼的法庭,以及所凭借的法律。特别是应该鼓励数据维权方面的集体诉讼。欧盟在颁布《通用数据保护条例》(GDPR)之后,这方面的维权通道即比较畅通。在欧洲一些国家,这方面的集体诉讼已经开始,并且对数据侵权者带来很大的震慑作用。此外还应该发展公益诉讼,政府公共机构可以就当地的一些典型数据侵权现象代替老百姓提出公益诉讼。
同时,在目前数据法律还不太完善的情况下,应该由政府或半政府机构来受理非诉讼性质的投诉,譬如可以在消费者权益保护机制的基础上,发展数据权利保护机制,并鼓励地方成立此类权益保护协会。
当然,也需要构筑良好的数据利他主义通道。数据利他主义与数据维权是相辅相成的关系,更好的维权体系可以成就更好的数据利他主义。我国不但可以考虑在有关法律法规中引入这方面的条款,也可以建立社会化的数据利他主义平台,以发挥宣传、引导、认证、交流方面的作用。
(二)自治平台与生态体系
可以预料,数据治理在较大程度上依赖于探索和自治。在这个过程中,主要的数据采集者、加工者、转移者和利用者,与相对应的数据被采集群体之间,会有很多的协商、谈判以及争执、纠葛,因此,建立一些承担数据治理功能的平台,十分有益。这些自治性平台可以以目前的互联网公司——其中许多就是平台化的互联网企业,作为基础,但也不能是它们本身。当然这些互联网平台公司也要承担数据自律方面的责任。这样平台不会只有一个或几个,它们之间也可以进行竞争,最后由整个社会来选择路规和秩序,从而促成数智化社会中的良好数据治理实践。
数据自治平台应该把主要的数据采集、加工、转移、使用主体,以及有关的技术开发和标准拟订主体聚合起来,也应该把数据被采集者和数据用户聚合起来。在广泛聚合的基础上,自治性平台可以发挥数据社区功能,适时制订数据社区的路规,维护数据社区的秩序,促进数据社区的繁荣和发展。
也应该有一些重要的跨政府部门平台在数据治理基础构架中发挥作用。欧盟通过的《数据治理法》,授权欧盟委员会设立欧洲数据创新委员会,该委员会成员包括成员国数据管理部门代表,以及欧盟特定专业机构和特定行业代表、中小企业代表,不但为欧盟委员会建设欧洲共同数据空间提供咨询意见,而且推进成员国的最佳实践。我国也应该发展这样的平台。有了各种平台,这些平台又将数智化浪潮中的各个重要参与方联系起来,形成了互动与协商,就有利于形成良好的数智化生态体系。在这个生态体系中,还可以通过数智化技术手段来防范和整治数智化歪门邪道,譬如可以采取隐私增强技术和脱敏技术来减弱数据与特定个体的关联性,从而使数据的后续流转和使用少了很多障碍,促进数智化进程健康地向前推进。
(三)数据专门管理机构的职能及与其他部门之间的关系
新兴的数据治理体系,绝对不能只停留于自治,而需要引入政府规制,尽管政府规制与社会自治之间需要给彼此留下一定空间。这是因为,一方面,对于由数据引起的各种新兴的权责利,以及新兴权责利对经济健康发展和社会良好秩序的影响,政府并不容易一时看清楚;另一方面,一些最基本的原理和准则,特别是那些涉及人类基本文明和伦理道德的原理和准则,不管是在工业化时代,还是在数智化时代,都亘古不变。恰如在各种飞行器和航天器飞向天空和太空的时代,不应相撞、不应毁损,以及空间不能独占、机会遵循正义,等等,就是亘古不变的原理和准则。
因此,有必要建立政府专门的数据管理机构。目前,一些国家已经设立和拟议设立这样的机构。欧盟《数据治理法》就规定,成员国应设置专门的数据管理机构,该机构应该独立于数据中介服务提供商或数据利他组织;数据管理机构有权要求停止侵权行为。我国已经确定设立国家数据管理局,全社会都期待其发挥良好作用。
不过,数据专门管理机构的职能需要谨慎界定。这样的机构应该促进大数据的合理与深度使用、推进基于规则的数智化进程,而不是构筑层层叠叠的管控体系。要防止这样的机构成为数据规则的独家垄断者,甚至数据资源的独家分配者,以及数据行为的全过程审批者。在数据规制处于渐进演化的长时期里,这样的机构不应该有规则的垄断权和独家解释权,也不应该自设各种审批权和惩罚权。这样的专门机构最应该做的事情,是成为一个平台化的集成者、获信任的整合者,从而推进规则构建和规制到位。因此,仍然应该允许其他与数据有关的政府机构的存在,包括行业性的数据管理机构或机构中的专门司局的存在。但在这种情况下,如何打破数据流动的烟囱化、数据管理的分割化状态,如何使不同领域的数据摆脱本领域数据管理机构的束缚,就显得特别重要。譬如,消费、医疗、交通、工业等数据,各由不同部门来管理,而且各地政府也有相应的数据管理部门,就可能导致数据的条块分割。数据是天然的可冲破物理障碍和地域隔阂的投入品,如果连数据都被条块分割,那将是数智化时代最大的绊脚石。因此,未来中央政府的数据专门管理部门在形成数据路规、构建数据秩序的同时,如何促进各领域、各层级政府积极地释放和共享数据,是一件十分重要又十分艰巨的工作。
(四)立法与法院
最后,需要一些基本的数据法律。无论是工业化时代的治理,还是数智化时代的治理,法治化是最好的皈依。目前,世界上有不少国家都在推进数据方面的立法,我国也有不少进展。不过值得指出的是,推进数据领域的立法,可能需要更大程度地发挥司法体系在其中的作用,而不是把立法和司法截然分开。因为数智化和数据事务都是新生事物,处于快速的演进之中,非常需要通过最佳实践来提炼法律。这当然是法院的优势。这意味着,建立专门的数据法院,有一定的必要性。
在欧盟与美国签订的《跨大西洋数据隐私框架》中,就规定欧盟将设立独立的数据保护审查法院。设立这样的专门法院,有利于使其在实际判例中将司法与立法融合起来。数字技术、数字经济仍处于快速发展与变动之中,涉及数据的争执和纠纷,已有法律条文和司法判例都不能应对这些争执与纠纷,从而在如何判定上存在很大困惑甚至巨大争议,即便诉诸法庭也未必可以得出高度认可的判决,譬如国际上许多涉及数据的诉讼大多以和解方式了结争端。大量的此类情况,恰恰说明数据立法的不易,也恰恰反映了设立数据法院的重要性。
我国也可考虑尽快设立专门的数据法院。数据治理具有极强的专业性和新颖性,这个领域的法律细则制定和法官人才培养,应该在司法实践中推进。这也是探寻数据规则、积累数据判例、培养数据法官的好方法。我国若率先设立数据法院,可以在全球数字经济治理中谋得一定主动权。
四 结语:数据治理最佳实践与全球数据治理
即使有了上述的数据治理基础构架,也很难说就有了数智化发展的清晰路标。实际上,在上述的基础构架中,无论是个体维权与利他通道、自治平台与生态体系,还是数据专门管理机构的职能及与其他部门之间的关系,以及立法与法院,都存在很大的留白空间和试错逻辑,都需要数智化行为的当事者、规制者、立法者、司法者,以及生态系统中的各参与者和相关者,去协商、争论、判断以及接受、认可。也就是说,需要在数智化发展的丰富实践中去寻求合适、有效且能促进经济社会健康发展的数据治理。好在这样的过程,始终需要遵循本文所强调的那些底层逻辑,从而不会失去人类社会的基本正直和正义。也就是说,数据治理应该追寻并强化最佳实践。
数据治理最佳实践,实际上反映了人类社会的守正与创新之间的关系。在我国,一些重大的涉及数据的诉讼及其判决,以及一些重大的规制政策的实施,已经开始体现数据治理最佳实践的思维。其他一些国家也是如此。在美国,联邦贸易委员会、司法部和一些州,曾对脸书、谷歌、亚马逊等互联网公司的数据问题进行调查和起诉,后来绝大多数都以和解协议了结,既保护了数据隐私等正当权利,又引导和鼓励了互联网企业的健康发展;在欧洲一些国家,也有不少类似案例。而欧盟设立欧洲数据创新委员会的目的之一,就是要在成员国推行数据最佳实践。我国推行数据治理最佳实践需要继续向前大踏步迈进。我国已经施行《个人信息保护法》《数据安全法》等法律和一些法规、指南、指导意见,但其中的条文规定仍然较为宽泛,并不易得到清晰判断和严格执行。可以预料,数据和算法治理,在我国并不会随着几部法律法规和文件的颁布实施而万事大吉,而更需要通过最佳实践来追寻合适的、高效的数据治理。
同时,我国应该加强与其他国家和国际社会的良好数据实践交流、合作。数据天然地具有跨地域流动的特性,国与国之间物理边界很难阻碍其转移。即使可以通过断开物理网络联结的强硬方式来阻碍这样的转移,但那将使数据链条被割断,从而形成数据孤岛,并对数智化的规模经济性、范围经济性、网络经济性构成掣肘,造成自我束缚。但数据毕竟涉及隐私、秘密、安全,包括国家安全,同时数据规制和治理可能被认为是一种国家主权,因此数据治理的国与国冲突也就成为一个现实问题。事实上,即使数据治理理念和规则比较接近的国家之间,譬如美国与加拿大、日本、欧盟国家之间,也存在这方面的摩擦和争执。不过,它们仍然在努力通过协商和谈判来尽量获得治理协调上的进展。我国应该通过数据治理最佳实践的国际交流,来弥合数据治理的国际分歧,来为全球数据治理作出贡献。
从长远来看,数据治理将可以,而且有必要,建立一个全球范围的数权(data rights)体系,就如过去几百年里,在工业革命浪潮中,建立了一个包括物权、债权、股权等权利主张的产权体系一样。与数权体系相配套,可能还需要建立算责(algorithmic responsibilities)制度。数权和算责体系将告诉人们如何配置数据和算法的权责利。尽管这是人类历史上一个前所未有的新范畴,不可能一蹴而就,但重要的是,数据治理虽然不可能摆脱各国特色,但终将有一些基本的全球共同规则。