大数据与技术治理

2019-08-11刘永谋

民主与科学 2019年3期

刘永谋

数据当然是发现世界的一种方式，但不是惟一的方式。很多时候，不能在大数据中呈现的世界一样真实。如果我们把数据世界误认为惟一真实的世界，就会导致社会风险，如：权力过度集中、数据专家滥用权力、信息安全和隐私问题、精英主义弊端以及文化的单极化。

20年来，计算机、网络和信息社会等相关领域的哲学社会学问题研究，风向标变化得很快，比如最近10年，先热的是物联网，没几年开始流行大数据，2017年阿尔法狗火了，有人说人工智能（AI）元年又来了。但若仔细审视，过去10年信息社会发展真正有重要突破的，还是在数据方面，也就是说海量数据的涌现，深刻地影响了我们的生活。比如，最近两年我已经养成了看手机上天气预报的习惯，决定是否出门、穿什么衣服，大数据已经影响了个人的生活。而如果大数据影响了一群人的生活，这就进入公共事务领域，属于大数据治理的问题了。最近大家抱怨的“996”，刘强东的“兄弟论”、热帖“你不是世界首富贝佐斯的兄弟”，就属于这方面的例子。再往公共政治方面说，川普发推特背后有没有大数据支撑，他与希拉里竞选如何运用大数据技术，这些都属于大数据治理讨论的问题。

大数据技术已经广泛应用于出租车行业、企业人事管理、学校学生管理和政治竞选等，大数据治理的确就在我们身边，这就引出一个问题：如何看待大数据治理？它究竟是完美天使，还是残忍的恶魔？它究竟是无坚不破的利器，还是装模作样的南郭先生？

一、大数据治理在当代有何正面意义

我对大数据治理的讨论，是在一套理论框架下进行的，就是我所谓的技术治理理论。根据我的理论，首先看到的是大数据治理的正面价值。“数据人”的崛起实际上是更大背景即“科学人”崛起的一个表征，这从根本上意味着“作为治理对象的人”的浮现，这是技术治理的基础。我们这里稍微谈一点理论问题。

所谓技术治理（technical governance），其主旨就是将现代科技的成果用于社会公共事务当中，以提高整个社会运行的效率。显然，无论发达国家，还是发展中国家，技术治理已然成为社会运行领域以至全球范围的普遍现象，我称之为“当代政治的技术治理趋势”。在大数据和智能革命的背景下，这种趋势更是急速推进，日益突出，甚至可以称之为当代社会的根本性特征之一。换言之，在某种意义上，我们甚至可以说，当代社会是技术治理社会。在过去几年中，我一直尝试建构一套审度技术治理理论，以对技术治理现象予以某种框架性的诠释，以此为基础探讨将之引导到有益方向的可能性。在其中，大数据治理是一个很小的问题。

在我的理论中，技术治理不是只有一种模式，而是可以根据不同国情进行选择的。但是，不管哪一种技术治理制度安排，都坚持两个基本原则：其一，科学管理，即以科学原理和技术方法来治理社会;其二，专家政治，即以受过系统自然科学教育的专家掌握政治权力。统计与大数据学院如果参与到公共治理活动之中，也属于我讨论的专家的范围。为什么？因为当代社会科学主流是自然科学化的，所以才被称为科学。经济学家、管理学家、职业经理人、银行经济学家、统计学家、心理学家、精神治疗师、经济分析师乃至实证社会学家等，也是接受过系统的自然科学基础教育的，有人甚至认为，他们可以被称为社会工程师，他们掌握的知识可以被称为社会技术。世纪之交以来，社会工程师的权力正在超过科学工程师。

根据以往思想史和技术治理的实践经验，我归纳了技术治理最主要的七大战略。在每一种战略中，大数据技术都大有可为。（一）社会测量：对社会所有的物质和精神财富进行调查、统计和计算。这是技术治理的例行工作，是治理战略的基础。显然，大数据技术真正提供了全面社会测量的可能性。收集社会数据的想法可以追溯到很远，比如威廉?佩弟的《政治算术》。从某种意义上说，正是这种想法才推动了社会统计学的产生。（二）计劃体系：运用计划手段，既包括国家计划、社会计划，也包括企业计划，在相对较大的范围内尽可能地对生产和分配活动进行统一的配置和安排。在其中，大数据技术扮演重要角色，刘强东说可以实现数据共产主义。这个问题很复杂：第一，我不认为计划与市场是对立的;第二，计划体系也不等于毛泽东时代的计划经济;第三，我反对总体化的计划乌托邦;第四，我认为计划是程度问题，与市场可以互补。（三）智库体系：制度性地将政治权力的一部分通过智库方式交由专家掌管，实施一定程度、一定范围的专家政治。智库制度本质上是一种权力分配的安排，把部分政治权力尤其是建议权交给专家。当代专家的建议越来越多地基于大数据提供的支撑。（四）科学行政：政府运行的科学化。（五）科学管理：是企业、NGO组织等的理性化。（六）科学城市：科学地建设、运行和维护城市的各个方面。（七）综合性大工程，这种工程不仅涉及自然改造，还涉及人口、社会、文化和环境等诸多社会因素，既是自然过程，也是社会工程。

大数据技术在这些战略中大有可为，可以给技术治理以强大的技术支撑。反过来，这些技术治理战略的实施也推动了大数据技术的强力发展。有人说，中国大数据技术发展最大的推动力就来自政府和公共事业的需求。

举智慧城市为例。现在水电气供应都智能化，居民可以在手机上直接购买，任何故障、短缺的信息都即时反馈;智能交通方面，有大量的监控探头、测速装置;智能城市治安，安全监控设备、智能110等……每时每刻都产生大量的数据，为城市运行决策提供非常有力的技术支撑，极大地提高了城市运行效率。

安保监控也是大数据治理重要作用的突出例子。在重点场所如机场、车站、监狱，针对重点人群比如罪犯、精神病人的电子监控，非常有必要，保证了公共安全。中国治安大大改善，大数据治理功不可没。

二、大数据治理是完美的利器吗

那么，大数据治理真的无往不利吗？

先说“雪亮工程”。公安部雪亮工程到处装监控，说是可以不接触即能监测人的心跳，以及发现路人甲携带的敏感物品。可是，我对雪亮工程的效果并不看好。为什么？在这个世界上，一辈子24小时完全照着法律、规章、政策、治安管理条例、街道公约、公司章程、校纪校规活着的人有几个？违法不敢，可谁没有个违规的时候？人又不是机器人！比如，随地个痰，闯红灯，在不该吸烟的地儿抽烟，看个黄片，“翻墙”，逃个课，小黄车没有停到地儿，在公园刻个到此一游……把这些全部监控下来，都处理吗？那得多少警察！而那么多警察也要监控啊。

现代治理有一个基本的假设：所有人都是有问题的，都要被改造——目标不止于打击犯罪，而是要改造每一个人，我称之为“完美人梦想”。于是，社会就用法律、治安条例、公司规章、学校纪律直到父母的规定，将每个人约束起来，进行改造。显然，不能把所有的不完美都监控起来，都变得完美，这是不可能的。而且，哪里监控装得多，看起来结果就是哪里治安差一些——本来大家差不多，现在你被发现得更多而已。因此，理想的连续治理是不能付诸实施的，它只能是一个理想型（ideal type）或者方法论，当不得真的，用我的理论来说，这叫过度治理。也就是说，大数据治理要把握一个度，要区别治理与操控之间的界限。

实际上，公安部门也不是真的那么天真和理想主义。这里面有个我称之为“官僚主义智能化问题”。官僚机构对新技术情有独钟，尤其是技术治理的新技术，因为这些新技术的运用更能体现出官僚机构的强大力量。对于官僚机构来说，它最大的动力不是效率，而是组织的生存、扩大和发展。公安部门推行大数据治理，可以找政府要钱，可以设立新机构，可以招更多的警察。官僚主义智能化问题，实际是官僚主义对技术效率目标的偏离或异化问题。

对于公安部门来说，大数据治理对于治安效率有多大提高，就成了次要的，反正多少有点用。当然，检查起来，就要用统计数字证明给大家看看，说提高了多少百分点的破案率。这种情况在法院运用大数据技术建设智能法院的时候，也出现了。一些法院反映，效率提高并不明顯，甚至变麻烦了，比如一些例行审批交给智能系统，出了问题，责任都不知道找谁负。打着新科技的名义，说是最新技术治理手段，实际上并没有通过科学原理和技术方法指向效率的提高，我称之为“伪技术治理现象”。比如最近颇受关注的出生人口统计，有人说，放开二胎根本没有阻止中国人口数量下滑的趋势，从2018年开始中国人口开始负增长了。不过后面这些被删，统计局也出来辟谣，感觉这个事情成了一个谜。但要警惕的是，“科学统计证明二胎政策缓解了中国人口出生率下滑趋势，所以放开二胎政策好”，实际上变成了“二胎政策好，所以统计数字必须证明这一点”。最近看到一个帖子说，什么长寿乡，其实是有人鼓励大家虚报年龄的结果，因为成了长寿乡会带来经济利益。

显然，大数据治理有一个范围问题。正如有人评论的，机器的结果只是参考，需要人来检查其有效性，最终做出决定的仍然是人。例如，亚马逊将大数据治理用于人员雇佣和工作监督中，这是非常敏感和需要慎重的。显然，企业有社会责任，要提供员工福利，不能一味强调效率，否则就容易走向过度治理。实际上，很多社会参数是没有必要获取的，很多违纪违规行为应该交还道德领域，甚至要被社会所容忍。过度治理以及上面提到的官僚主义智能化、动因漂移等，在我的理论中都属于技术反治理问题。在我看来，技术治理过程必然伴随着技术反治理，后者是不可能也没有必要消除的。要想运转技术治理机制，就必须在两者间达到某种作用力与反作用力的平衡;试图完全铲除反治理，结果一定是技术治理系统的崩溃。

三、大数据治理有什么可能风险

关于大数据有一种说法：不再是随机样本，而是全体数据。大数据是全数据吗？世界上哪里有什么所谓的全数据，其实就是一个无穷大的集合。大数据相对于之前的数据来说，的确在数量级上发生了改变，这量变按照某些人认为的甚至导致了某种质变，但是它不是全数据。从根本上说，绝对无穷大的分母，无论分子数量级增加多少，仍然约等于零。因此，大数据所谓的“大”是实用意义上的“大”，是针对某个目的而言足够大了。比如智能交通调控，如果能掌握八成以上机动车辆的运行轨迹，就可以尝试以此为基础进行调控了。所以，这个大数据的意思是进行某个城市交通调控的数据足够了。

既然以实用目的来判断数据是不是够大，那么就意味着所谓大数据并不是客观的，而是存在价值预设。从这个意义上说，大数据没有讨论因果关系，而是发现相关关系，而相关关系的发现是在一定价值观指导之下的。例如，有人通过大数据提出这样的观点：空气污染与很多不良现象有关，其中包括判断力减退、心理健康问题、学习成绩不佳以及犯罪率上升。这样的大数据研究提出了什么新的治理结论？没有，它只是为控制空气污染提出了一个新的理由，显然是在反感空气污染指导之下的发现。这既说明了大数据的目的或价值属性，也说明了不是所有数据都有意义，我们并不需要全数据，并不是大数据越多越好。从理论上说，这叫数据超载问题。简言之，大数据的终极目标不是真理，而是行动。

在现代治理活动中，可计算原理和文牍中心是基础。可计算要求信息的数字化，文牍中心要让治理活动围绕各种文件来展开。人们治理的是纸上的、数字中的社会，实行数字管理，这与日常显示距离很大。这就出现了现代治理当中的意会知识和非正式知识的问题，这是技术治理中的一个很大问题。这就容易出现数据崇拜现象，比如我根据天气预报穿衣服，而不是在阳台上看一看别人穿什么，或者到室外感受一下。在大数据时代，数据崇拜转变成大数据崇拜，最新技术应用的背书增加了崇拜的程度，统计学和统计数字成了权威的来源。过头的数据崇拜是有问题的。

波兹曼批评了统计数字崇拜，他认为，运用统计数字进行论证的要害有三。一是抽象概念客观化，把某个发明出来的抽象概念转变成某个客观的可测量的事物，比如民意测验统计调查假定有个“舆论”或“民意”的客观事物，可以从民众身上抽取出来。但其实并没有一个实实在在的什么民意，人心是变动不居的，你现在杜撰一个民意，搞一套程序，好像有这么一个东西。二是排序，把每个人按照某种标准安放在某个序列之中，比如从极不喜欢到极其喜欢分为0到10，你选一个数字，5是中间值，这叫排序。好像很科学一样，其实很可能，被要求打分的人完全搞不清楚在讨论的是什么。三是忽略未经或不可数字化的问题，让客观化的东西数字化，有些不能数字化的东西，那就忽略不计。比如，所谓的智商测量，IQ能测数字能力、图形能力、逻辑推理等这些能力，可以量化，而想象力、联想能力、直觉这些不能量化的，那就不计入智商了。

对于统计学、数据和概率的哲学反思，并不是否认大数据治理的巨大价值。但我认为，大数据不是什么全数据之下的必然性，它的作用是有限的，我们必须要知道使用大数据是有边界的，否则就会误入歧途。而将大数据运用于社会运行策略当中，本质上是政治问题，而不是纯粹的技术问题，因为大数据并不能提供一个绝对真理的基础，可以把我们的行动从真理中推导出来。所以，关于大数据与计划经济的讨论，本质上是社会制度安排问题，而不是纯粹技术问题。进一步而言，即便我们知道了真理，也推导不出我们应该如何行动，这就是休谟著名的是与应当的二分。吸烟有害身体健康，但推导不出我不能吸烟，我可能觉得吸烟比我的健康更重要。在我的理论中，这称之为治理转译问题。

总之，数据当然是发现世界的一种方式，但不是惟一的方式，不是说只有數据世界才是真实世界，不可量化的世界就不存在。很多时候，不能在大数据中呈现的世界一样真实。如果我们把数据世界误认为惟一真实的世界，就会导致社会风险，如：权力过度集中、数据专家滥用权力、信息安全和隐私问题、精英主义弊端以及文化的单极化，等等。

四、可行的风险防范思路

大数据治理的风险防范，可以从各个方面想办法，防患于未然。我认为，结合国情，更可能落地的思路至少有两条。

一是制度主义的思路。我认为，技术治理最大的政治风险在于：专家权力过大，威胁民主和自由，极端情况下可能导致许多人所担心的机器乌托邦，即把整个社会变成大机器，而每个社会成员变成其中可以随时替换的小零件。机器乌托邦的典型意象，是好莱坞电影《黑客帝国》和《终结者》中的世界。所以，必须从制度上框定和限制大数据专家的权力，比如将其权力限制于政治上的建议权和实施权。社会权力除了政治权力，还有其他如经济权力、学术权力、宗教权力等，专家只是掌握政治权力的一部分，就会受到平衡和约束。这属于我所谓的技术治理的再治理问题。再治理除了限制数据专家权力之外，还要有制度上的纠错机制。总之，我们要在制度上进行精密的设计，要警惕工程师滥用权力。

二是工程师教育的思路。我认为，纯粹的伦理讨论不会有什么实质的约束力，伦理考量要与制度设计紧密结合起来，实际上，制度正是伦理、风俗、文化乃至民族性在历史情境中的结晶，也就是说，制度设计不能脱离具体的国情。在大数据治理方面，数据专家是更能在技术当中贯彻我们的价值理念的。也就是说，我们不是等到大数据治理出了事，再来追责，而是要把伦理考量、风险防范提前到工程师的技术设计之初。这就是新近兴起的所谓设计哲学、负责任创新和道德物化等理论的主旨。譬如，许多轿车在驾驶员系好安全带之前不会启动，或者发出噪音。驾驶员做出车该开多快的道德决定取决于途中的减速带，减速带设置的目的是：“在达到我之前，请减速”。拉图尔认为，此类轿车和减速带包含了道德，设计者赋予它们当驾驶员看到它们时就系安全带和不能开太快的责任。道德决定通常不是仅仅由人来做出的，而是由人与所使用的技术互相影响来形成的。这是拉图尔列举的著名例子，也就是说，工程师们在设计之初是可以把道德考量用技术形式加以体现的。显然，这种思路要求数据专家不仅懂技术，还要懂伦理和人文，这就需要对工程师进行伦理教育。当然，可以在设计阶段引入人文学者、伦理学者参与，但这毕竟不如将价值考量能力、风险防范意识直接灌输给数据专家。

（作者为中国人民大学哲学院教授）

责任编辑：尚国敏

民主与科学

2019年3期

大数据与技术治理

杂志排行

民主与科学的其它文章