大数据与自由

2019-01-17蔡昱

中国医学伦理学 2019年1期

蔡昱

(云南财经大学商学院，云南昆明 650221，yucaicn@vip.sina.com)

当前，随着移动互联网和云计算技术的突飞猛进，大数据已被广泛应用到了医疗服务、电子商务、科学研究和国防安全等各个领域，并悄然改变着我们的生活方式和生产方式。那些无意识地被裹挟其中的人们会突然发觉：阿尔文·托夫勒[1]在20世纪80年代所预言的时代已经倏然而至了。与其他的高科技一样，大数据的应用为我们的生活带来了极大的便利和变革，但也伴随着极大的困惑与烦扰。例如，对个体的生理数据和基因数据的非法采集、泄露和滥用可能会威胁人的隐私在内的伦理安全，甚至威胁其生存安全。本质上，这限制了人的自由。本文主要探讨大数据作为一柄双刃剑，其应用可能对人类的自由带来的正面与负面的影响。

1 大数据概述

1.1 大数据的定义与特征

简单地说，“大数据”是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集[2]。大数据和海量数据具有根本的区别：如大数据与云计算技术是一体两面的，如果没有后者，就不可能有大数据；同时，大数据是在线可及的，即其数据是永远在线的，且是能随时调用和计算的。除此之外，公认的大数据的特征还包括：规模大、高速性、多样性和价值密度低等[3]。具体地说，所谓“规模大”，是指无论大数据的采集、存储还是计算，都具有海量的数据规模；所谓“高速性”，是指其数据流转非常快速；所谓“多样性”，是指它涵括了多样的数据类型，如网络日志、音频资料、手机通话记录、视频文件、社交媒体、数字资料、互联网搜索、生物传感器相关的数据等；所谓“价值密度低”是相对于大数据的庞大数据量而言的，它是指需要对大数据进行“价值提纯”，即专业化处理，才能挖掘出其价值。而这一价值提纯的专业化处理犹如“在黄沙中淘金”。

1.2 大数据应用的价值

在这一部分，我们将对大数据应用的价值进行讨论。其中包括大数据的应用可以实现“对现象的更具客观性的描摹”“对现象中的规律的更具客观性的描摹”和“对现象中的多维相关性的描摹”。

首先，大数据可以实现对现象的更具客观性的描摹。这是指大数据不采用传统的随机分析法对原始资料进行分析处理，而是采用全数据分析处理，大大提升了结论的客观性，降低了主观性。传统的随机分析法也称抽样调查法，是指在原始数据中随机抽取少量样本进行分析的方法，其可能的缺陷在于原始数据越大，则抽样调查，即随机分析的结果就越容易具有主观性，甚至任意性，因而对样本的随机抽取的科学性要求很高。而依托于云计算的大数据技术可以对所有的原始数据进行处理和分析，便规避了传统的随机分析中可能出现的主观性，实现了对现象的更为精准的描摹。

其次，大数据可以实现对现象中的规律的更具客观性的描摹。具体地说，大数据的应用可以被看作是“大数定理”的实现。所谓的“大数定理”是指在试验不变的条件下，重复试验多次，随机事件的频率近似于其出现的概率。以抛硬币为例，在抛的次数足够多的情况下，硬币的正面或反面出现的频率近似于其出现的概率，即二分之一；由于大数据所具有的“规模大”的特点，便可以通过“大数定理”的实现而对现象中的规律进行更为客观的描摹。

再次，大数据可以实现对现象中的多维相关性进行描摹。具体地说，传统的计量模型可以对现象中的相关性进行分析与描摹，但它能够处理的相关性的维数受到了很大的限制。与之不同，大数据对相关性的描摹不受维数的限制，即它可以实现对多维相关性的描摹。

1.3 大数据的本质——大数据仍是数据

如前所述，大数据相较于普通数据、随机抽样法、计量模型等传统的分析工具具有自身独具的价值，但大数据不是万能的。也就是说，依据大数据的本质，它的应用仍具有局限性。

具体地说，大数据的本质仍是数据，即是用数字对现象进行描摹和解释。因此，它和其他数据一样依赖于量器的测量。同时，也是更重要的，它(与其他数据一样)所描摹与分析的只是现象，即它只对现象中的规律与相关性进行较为客观的描摹。进而，当它应用于人类社会，它只对作为人类的生存境遇的社会现实做现象层面的描摹和解释，而不具有反思性和批判性。

1.4 大数据应用的局限性——对社会现实没有反思性和批判性，甚至反向加强

作为数据，大数据只对现象和现象中的因果关系和相关性进行描摹。因此，对于人类社会来说，它只与人类的历史性、地域性、文化性的生存境遇和其所参与塑造的人性[4]和人的行为相关(即它能描摹其中的因-果关系或手段-目的关系)，而与人之本性[4]是否得以呈现无关，即它对人类的生存境遇没有反思性和批判性，甚至会反向加强这些塑造人性和人类行为的境遇和机制。

首先，是大数据支持下的统计学对人类现实境遇的反向加强。近代以来，对与人的行为相关的数据进行处理的主要工具是统计学，而统计学的(非反思性和非批判性的)潜在假设是“大多数=正常”，即“少数=异常”。此处，“异常”的标签就暗示了一种“被排斥”的社会暴力，而其作用的结果表现为：①通过“少数=异常=被排斥”的胁迫与规训，更多的人回到了“大多数”的“怀抱”，由此实现了统计学对“偏差”的校准，即规训人们成为具有“标准的规范的行为模式”或具有“标准的单向度的欲望和需求”的“标准人”，否则就被认为是“反社会”的。由此，便实现了社会对人类个体的“去个体化”，实现了当代社会“削平一切”的要求；②当假设了“大多数=正常”，则反向承认了那些塑造了“大多数”的(构成了人类现实的生存境遇的)制度、文化和环境的合理性，也即它不但对人类现实没有反思性和批判性，还反向加强了它。

其次，是在大数据的应用中的因-果反向加强。因-果关系(或手段-目的关系)中此种情形发生的原因在于：①大数据的应用对结果的发生本身不具反思性和批判性；同时，②又非反思性和非批判性地假定原因或手段的“有效性=合理性”。例如，有人因看到了某网页上推送的某产品的广告而购买了该产品。之后，网站的后台立刻就发现了此人购买该产品这一作为广告推送结果的行为和广告推送的有效性，因①对作为结果的购买该产品行为的非反思性和非批判性；②非反思性和非批判性地假定产生此结果的原因，即广告推送行为的有效性就是合理的，则后台便加倍地向此人推送该产品的广告(即加强了作为原因的推送行为)。

再次，是在大数据的应用中的非反思性和非批评性地对人的偏好或欲望进行盲目加强。例如，当前，人的各种活动轨迹和关注痕迹都可以被数据化而被收集，再经过挖掘和分析便很容易捕捉到个人的偏好和欲望。而大数据只对这些偏好和欲望进行描述和解释，却不能做出反思和批判。如经过大数据的挖掘，发现某人每个月有几十次的某产品的消费记录，由此可以分析出其本人对该产品具有偏好。然而，大数据并不对此偏好是否成为一种嗜好的偏执从而劫持了他的目的做出反思和批判。不仅如此，当某个零售公司通过大数据掌握了此人的偏好，便可能派专人每月为他送大量不同型号的该产品，即盲目地加强此偏好。

2 自由概述

自由是人类最重要的价值，也是哲学探讨的最重要的问题。一般来说，哲学家对自由的理解与对人的理解是一致的。古代哲学家以人自身之外的“本原”来理解人，如德谟克利特认为世界与人都是由原子构成的，而原子只在虚空中遵循必然性作直线运动，于是，人类的自由就丧失了可能性。近代以来，不少西方哲学家将人作抽象的理解，即将人所具有的某种独特的属性作为人的本质，并将其表述为“人是……的动物”。总而言之，从唯理论、经验论、德国古典哲学对理性的片面追求，到叔本华和尼采以“意志”取代“理性”，他们都是以某种独特属性来片面地理解人；后来的弗洛姆、哈贝马斯，还有福柯以及其他一些后现代主义的思想家对建立在理性主体基础上的自由理论提出了质疑，但他们自身仍没有超越“人是……的动物”的思维逻辑；存在主义的代表人物萨特也是将人做抽象的理解，他的理论本质上是一种“意识的自由”。由于抽象的人不能对现实中的具体的人的真实状态做全面的理解，这些思想家或者夸大了人的自由，或者否认了人的自由。

与上述思想家不同，马克思是以符合人的生存方式和存在方式的思维逻辑来理解人的。人的生存方式和存在方式是实践，也即实践是理解人的根本的思维逻辑，实践也是理解人的自由的根本思维逻辑，由此便开启了马克思主义的实践哲学。同时，马克思将人作为具体的现实的人来理解，即从实践本性上看，人是自由的；但对于处在现实境遇中的人来说，本性的自由只是潜在的状态，即只是一种获得自由的可能性，而自由的现实性，即最终是否可以在现实中获得自由和可以获得多大程度的自由，则完全取决于他们在现实境遇中的实践。

2.1 什么是自由

本文中关于人之本性和人之自由的观点是在马克思主义实践哲学的基础上所做的发展。具体来说，人的使命就是自由而全面地发展自己的本质力量、能力和潜能，从而“成为自己”。因此，在马克思主义的实践观下，人的自由应是“实在的自由”，即它不仅包括选择的自由，也包括具有抵御生存性的恐惧而做出肯定自我肯定生命的选择的勇气和能力，即可以实现其自由。进一步讲，人的“实在的自由”就体现在他的本真的生命实践中[4]。

2.2 获得自由的条件——“手段的自由”与“目的的自由”

人们获得自由的条件应包括两个方面，即“具有选择自己的自我的外在可能性”和“具有选择自己的自我的勇气和能力”。

首先，“具有选择自己的自我的外在可能性”是指具有自愿选择的自由，即处于不受外在强制的自愿选择的状态或选择的空间不被外因压缩的状态。这可以被看作是一种外在的自由状态，我们称之为“手段的自由”。需要注意的是，作为手段自由的自愿选择只是一种表象上的自由，而选择的目的是否自由更为重要。

其次，“具有选择自己的自我的勇气和能力”则可以被看作是一种内在的自由状态，它可以使得人们的目的不被挟持，即处于目的的自由状态。因此，我们称之为“目的的自由”。

由此可见，人的真正的自由，即实在的自由，必须是兼具“手段的自由”和“目的的自由”的双重自由[5]。

2.3 限制自由的两个方面——“内在他性之力”和“外在他性之力”

如前所述，我们已经了解到，“实在的自由”的获得需要内在和外在的两个方面的条件。由此可知，对自由的限制也包括这两个方面，我们可以称之为“内在的他性之力”和“外在的他性之力”。其中，所谓的“他性”，其衡量的依据在于“是否符合人的内在目的和本真需要”[6]。

2.3.1 外在他性之力。

对人类自由的限制首先来自于“外在他性之力”。它是指由于强制、欺诈、胁迫、乘人之危等原因，使得人们选择的手段处于不自由的状态或选择的空间被压缩。这里，被先前的思想家忽略的一个方面是“庸俗大他者的凝视”，即由特定的制度、文化、环境等外界因素影响和塑造的“大众”(或“庸俗大他者”)以其所公认的价值追求对人们的选择的“凝视”(“凝视”指话语权)[7]。本质上，这种“凝视”以“大众认同的消费观”“大众认同的成功观”“大众认同的消费中体现的身份符码”等引导甚至“强制”了人的选择的自由[5]。

2.3.2 内在他性之力。

限制人类自由的另一方面的原因是“内在他性之力”(“内在他性之力”，尤其是它的可被制造性，同样是被先前的思想家忽略的)，它是指那些可以通过“生存性胁迫”从而引起了我们的“生存性的恐惧”(即“畏死的恐惧”)的因素。进而，以“畏死的恐惧”为中介，这些对我们进行“生存性胁迫”的因素可以实现对人的目的的劫持和扭曲，使得我们的目的不能自由。这种“内在他性之力”和我们人性的弱点相关，即人具有急切的自我保存的需要。正是因为这种生存性需要所具有的“急迫性”，使得“生存必须性”及其所引发的“畏死的恐惧”成为对人之自由的一种内在胁迫。

具体地说，人之弱点，即“生存性恐惧”和“畏死的恐惧”分为两个方面：

一方面，是物质性的生存必须性及其所引发的“对匮乏的恐惧”。具体地说，人是生物性存在，需要一定的物质以维持生存，否则就会灭亡，由此便形成了“对匮乏的恐惧”[4]。而如果某种机制制造了虚假的“匮乏”和真实匮乏感，便会引发“对匮乏的恐惧”，从而迫使人们盲目追求对虚假的“匮乏”的满足，因而挟持了人的目的，使得人们的目的不自由。最典型的通过制造“对匮乏的恐惧”而劫持人的目的机制就是广告对贪欲的制造[5]。

另一方面，是社会性的生存必须性及其所引发的“对不被社会或他人认同的恐惧”。具体地说，人是社会性存在，需要与他人在物质、情感和精神上形成关联，不可孤立生存，否则就会灭亡。由此就引发了“对被社会孤立的恐惧”，也即“对不被社会或他人认同的恐惧”[4]。而当如果某种机制引发了人们的“对不被社会或他人认同的恐惧”，便会劫持人的目的，即使得人的目的不自由。最典型的通过诱发“对被社会孤立的恐惧”而劫持人的目的的机制是前面提到的“庸俗大他者的凝视”。由此可见，“庸俗大他者的凝视”既是一种外在的他性之力，也是一种内在的他性之力。

3 大数据的应用对人类自由的限制

我们已知，对人类自由进行限制的因素可以分为两类，即“内在他性之力”和“外在他性之力”，因此，大数据的应用也可能从这两个方面对人类的自由进行限制，即“大数据的应用作为外在他性之力对人类自由的限制”和“大数据的应用作为内在他性之力对人类自由的限制”。同时，当大数据的采集和应用侵犯隐私权的时候，它既是作为一种外在他性之力限制人的自由，也是作为一种内在他性之力限制人的自由；另外，大数据应用中的信息保护和隐私安全也格外重要。因此，我们将大数据侵犯隐私权对自由的限制单独提出进行讨论。

3.1 作为外在他性之力对人类自由的限制

“大数据的应用作为外在他性之力对人类自由的限制”是指大数据的应用压缩了人的外在的选择空间的情形，而对人的选择空间的压缩通常是通过大数据所支持的欺诈、强制、胁迫、乘人之危、显失公平等的手段来达成的。

3.1.1 操纵与形塑人的生存境遇。

在现实中，大数据经常被用来制造那些脱离真相的虚假的人类境遇。需要注意的是，与人之本性不同，人性是被境遇塑造的。因此，操纵人的境遇，便可能操纵人的人性或操纵人的行为。对人的生存境遇的操纵和形塑主要发生在“个体化的网页推送”和“资本化的关键词搜索”中。下文就这两种情形分别举例说明。

当我们进入同一个网站，每个人所看到的网页并不相同，而这种个性化的网页推送是根据大数据所挖掘出的个体的搜索偏好来进行的。这里需要格外注意的是，这种个性化的网页推送本质上为个体制造了脱离真相的虚假的生活境遇。更具危险性的是，操纵了此人的生活境遇的资本或网络后台也由此而有能力塑造与操纵此人的人性和行为。总之，“个体化的网页推送”使得人们毫无觉知地生活在“楚门的世界”中。

2018年5月，当我们对2016年的魏则西事件还记忆犹新时，人们发现百度上的竞价医疗广告改头换面变换载体而又卷土重来。作家西乔愤怒地说：“百度控制着普通人接触信息时代的入口，却把路标指向邪恶欺骗的世界。它……加剧了信息占有乃至智识上的不平等。这种对弱势群体对普通大众的经年累月的作恶，是最深的恶。”[8]在此案例中，“资本化的关键词搜索”为我们捏造了虚假的信息和境遇，为资本的积累的目的而操纵了人们的行为。

3.1.2 作为一种新型资本垄断的数据垄断。

大数据本身具有巨大的商业价值，谁掌握了大数据，谁就占据了商业竞争中的优势。因此，本质上，当人们将原始资料数据化，便意味着将其资本化。进而和其他资本一样，大数据这一重要的资本具有走向垄断的趋势，也即数据垄断将成为资本垄断的新的方式，进而会引发对无能力掌握数据的人们所进行的胁迫和显失公平的行为，从而压缩了他们的选择空间。

3.1.3 对生存安全的胁迫。

我国《人类遗传资源管理暂行办法》第四条规定，国家对重要遗传家系和特定地区遗传资源实行申报登记制度；未经许可，任何单位和个人不得擅自采集、收集、买卖、出口、出境或以其他形式对外提供。此规定便是对种族生存安全的考量，即种族基因的独特特征对种族的生存与发展至关重要，一旦泄露，就会成为一柄达摩克里斯之剑，威胁着种族的生存安全，压缩了种族自由选择的空间。其实，个体的基因信息的泄露同样会压缩此人在就业、婚姻、甚至生存安全方面的自由选择的空间。

3.2 作为内在他性之力对人类自由的限制

“大数据的应用作为内在他性之力对人类自由的限制”主要指大数据支持下的广告的精准投放和某些精准服务挟持了人的目的，从而限制了人的自由。如前所述，广告的本质是通过制造虚假的匮乏而使人们产生真实的“匮乏感”，从而引发“对匮乏的恐惧”这种“物质生存性的畏死的恐惧”，进而迫使人们盲目追求对虚假的匮乏的满足，由此劫持了人的目的，即将人的生命力引向偏离本真需要的方向，从而虚耗并否定了自我的生命。同时，此种被制造的贪欲虽是内在的，其根本来源却是外在的，即它是广告这种贪欲生产机制的产物，其源头是投放广告者资本积累的欲望。因此，广告生产出的贪欲对于大众而言是一种内在的他性之力的奴役，即与人的自由与全面发展的内在目的背道而驰。同时，在科技进步的怂恿下，消费社会中的贪欲呈现出无限繁殖的趋势[6]。大数据通过对客户的偏好的挖掘和对客户区分等手段进行的广告的精准投放极大地增加了这种贪欲生产机制的有效性，它是技术进步参与对人类贪欲的制造，并煽动人类贪欲无限增殖的典型情形。最终，这些无限增殖的贪欲将人类的目的挟持并紧紧束缚于物欲，从而丧失了自由与全面发展的可能性。

3.3 大数据的采集和应用侵犯人之隐私权时对人类自由的限制

与大数据的应用所带来的便利和效益相伴随的最大隐患，是对人类隐私权的践踏。随着新的数据采集技术的成熟，之前需要刻意收集的数据可以被自动收集并存储，进而被分析和挖掘其价值并加以应用。当前，我们每个人的上网痕迹、生理指标、基因信息、聊天记录、位置轨迹、消费记录、关注偏好等都在不知不觉中被收集、数字化和分析，人们已经开始自嘲为“透明人”。然而，与这种人类对于数据采集者和应用者的透明状态形成强烈反差的，却是“透明人”对自己的各种数据被谁得到和如何被应用常常一无所知。显然，人类个体作为数据集的“透明”性本身就暗示了大数据的采集和应用中存在的(通过非法收集、泄露、滥用等方式)对隐私权侵犯的可能性，而数据的采集或应用的“暗箱性”无疑增加了这种风险。如远程医疗中就存在着患者隐私信息被暴露的伦理风险[9]。

3.3.1 隐私与人之“个体化”。

人类对隐私观念的认同具有悠久的历史，在《圣经》的《创世纪》中，亚当和夏娃偷吃了智慧树的果子后，以树叶编制衣服遮盖身体的行为就可以看成是人类对隐私的追求。然而，“隐私权”作为一种独立的权利被确立下来却是相当晚近的事，它始于1890年美国的沃伦和布兰迪斯在《哈佛法律评论》发表的《隐私权》一文。文章把库雷(Thomas M.Cooley)法官在财产权案件中的“不受干扰的权利”(right to be let alone)援引到人的精神生活方面[10]，文中两人倡言美国的普通法“历经几世纪来慢火的陶铸冶炼后”，已衍生出一项崭新的“不受打扰之权”——即所谓隐私权。他们认为侵犯隐私权的违法性在于此行为伤害了“个人自我唯一感”、阻碍了“个人独立”、侵犯了“个人尊严”和贬抑了“个人荣誉”[11]。

本质上，“伤害了个人自我唯一感”和“阻碍了个人独立性”所表达的是损害了人之“个体化”的能力和勇气。所谓“个体化”是人与动物的根本区别之一，是指与动物仅仅作为种群的成员而存在并仅仅分享种群的意义不同，人是作为个体而存在并因个体本身而有意义的。具体地说，人之存在具有两面性，即一方面，人不能弃绝与外界关联而孤立地存在，否则就会灭亡，即人具有社会性；但另一方面，人需要存在感。人与自然的其他部分不同，他具有自我意识，他的存在感、自我意识和个人同一感将自我与外界分开，即人必须在思维、情感、选择和行为中确证自己，也即人需要“个体化”。由此看来，人的社会性和动物的社会性具有根本的区别，即动物个体仅仅作为种群的成员而存在，即它仅仅分享种群的意义，而个体本身没有意义。人却不是这样。人的从生到死的生活故事，他的存在感、自我意识和个体同一感将他作为个体而凸显出来，即他是作为个体本身而有意义的，也即他的社会性是在人之“个体化”的基础之上的。

由此看来，侵犯隐私权的行为“伤害了个人自我唯一感”和“阻碍了个体独立”是指损害了人之“个体化”的能力和勇气，也即损害了人的“选择自己的自我的勇气和能力”，限制人的自由。

进而，保护隐私权这种“不受打扰之权”的目的则是为人类保留可以免除社会性生存胁迫的最低限度的私领域，也即为人类保留可以免除大众或他人“凝视”的最低限度的私人空间，从而保证人们在最低限度内具有“选择自己的自我的勇气和能力”。

3.3.2 大数据的应用侵犯隐私权作为外在他性之力对人的自由的限制。

保护隐私权的目的是为人类保留可以免除社会性生存胁迫的最低限度的私领域，从而保障人类的自由。由此，侵犯隐私权的本质就在于——它在人的私领域内直接或间接地引入了大众的凝视这种隐性的“强制力”，从而压缩了人的自由空间。

3.3.3 大数据的应用侵犯隐私权作为内在他性之力对人的自由的限制。

对隐私权的侵犯，即在私领域内直接或间接地引入大众的凝视，可以引发受害者的“对不被社会或他人承认的恐惧”这种社会性的生存性的畏死的恐惧，从而使得他们弱小恐惧而盲目屈从，即损害了他们的选择自己的自我的勇气和能力，也即损害了他们的个体化的能力。

4 大数据的应用对人类自由的提升

大数据作为一种新型的生产实践和生活实践，其应用可能为人类自由的实现提供新的平台。

首先，建立在网络和大数据基础上的普遍交往将有助于人的自由与全面发展。以建立在网络和大数据服务基础上的P to P(个人对个人)服务平台为例，它既可使个体生产者和服务者为他人提供符合自己天赋和兴趣的个性化的产品和服务，也可以使得个体消费者发布与获得符合自己个性化需要的产品和服务。由此看来，P to P服务平台可以成为人们实现互慈和创的双相承认关系的中介，即它满足了关系双方的本真需要，促进了关系双方的“个体化”和自由与全面发展。

其次，有助于实现“自由人的联合体”。如前所述，大数据基础上的普遍交往可以帮助人类个体实现个体化和实在的自由，也就是说，如P to P这样的服务于人们普遍交往的平台可以被看作是一个古希腊意义上的真正的“公共”领域，它将人们联结成伙伴关系的“共同体”，即“自由人的联合体”，在其中，人们在相互合作中协同创造和自我实现与自我创生，且每个人都可以以他的独一无二的业绩和成就证明自己，并显示他们真正是谁，从而彰显他的个性与卓越。

再次，可以实现资源的合理兼顾公平的配置。众所周知，资本主义市场被认为具有实现资源有效配置的优势，但已经证明，这只亚当·斯密的“看不见的手”必须在“完全竞争性的市场”和“作为理性人的生产者”的条件下才能发挥作用。然而，这两个条件在现实中都不可能存在，否则就不会有“将卖不出的牛奶倒掉”的经典案例了。同时，资本主义市场对资源进行配置所带来的是垄断和贫富分化的不断加剧，即产生了极大的“不公平”。然而，在网络和大数据的支持下，人类有望实现资源的合理兼顾公平的配置。

综上所述，如果我们想在大数据的应用中尽量提升人类的自由，同时，尽量避免对人类自由的限制，则必须厘清“大数据为谁服务”和“大数据服务于什么价值”的根本问题。