大数据中的思维与社会变革要求
2015-10-15张康之张桐
张康之 张桐
〔摘要〕 在对大数据的认识上,有观点认为它是一种新的思维方式和社会变革力量,这种观点有点夸大其辞了。作为信息技术发展结果的大数据,应将其纳入科学的规范之中;大数据并不能引发思维方式的变革,我们需要在后工业化的场景中去思考思维方式的变革问题;在工业化社会中,大数据使得中心-边缘结构得到强化,这是与后工业社会去中心化的要求相逆而行的。因此,我们亟需为大数据这样的流行概念正名,力图将大数据这一技术工具引向增进人类福祉的方向。
〔关键词〕 大数据,思维变革,社会变革,中心-边缘结构
〔中图分类号〕C911 〔文献标识码〕A 〔文章编号〕1004-4175(2015)05-0005-10
近年来,“大数据”一词迅速流行起来,它不仅出现在各种媒体的显赫位置,也成了学术研究的对象,甚至引发出一些思想灵感。可以说,大数据已经成了一个妇孺皆知的流行词,甚至被许多人所滥用,一些人只要是在谈论与信息、数据或数字相关的话题,就会冠以大数据的名号。从历史上看,一个热词的流行往往预示着一门科学的出现,甚至会预示着一个社会领域的出现,然而,在此过程中,那个词的原义可能已经发生了变化,甚至其原本具有的内涵会全部流失。“大数据”一词原本是用来表示个别领域(如气象学和基因学等)里的数据量超过了现有技术的处理能力的概念,如今则被运用到了几乎所有的领域。我们应该看到,在一段时期内,在大数据视角和观念的确立过程中,对其加以夸大或作出过高评价也是难以避免的。在这种情况下,我们迫切需要理清大数据是否代表了一种新的思维方式,它能否呼唤出一种新的理论范式,或者能否彻底改变我们的社会?
我们认为,大数据引发社会变革是必然的,但社会变革的方向却是不确定的,或者说存在着多种可能。从当前的情况看,大数据依然属于工具的范畴,可以被应用于公共事业,为公众谋福祉;也可以服务于私人利益的谋划,或在“帮助”“援助”的名义下获取私人利益的更大化。更为重要的是,对于我们社会所拥有的中心-边缘结构而言,大数据并不能使之改变,在某种意义上,可以说大数据正是生成于中心-边缘结构之中的。不仅如此,大数据概念的传播也同样遵循着中心-边缘结构。“大数据”一词首先是在中心国得到追捧并流行起来的,然后才传播到了边缘国。但是,边缘国的人们一接触到这个概念,就表现出了比中心国更加强烈的热情,他们纷纷要求自己的国家也努力在这场有关新技术的竞争中抢占先机。也许是边缘国的人们在大数据的图景中看到了某种可以超越中心国的机遇,所以把赶超中心国的希望也押在了大数据上。另一方面,中心国发现通过政治和军事的手段去干涉边缘国的事务变得越来越困难,而且贸易保护主义也经常性地与边缘国的民族情感混杂在一起,利用大数据去敲开边缘国的国门却显得更加容易,所以,中心国也乐意看到边缘国的人们所表现出来的那种对大数据的狂热。
一、作为信息技术发展结果的大数据
2008年9月4日,《自然》(Nature)杂志刊出了一期以“Big Data”为题的专辑,邀请一些专家就大数据、大数据带来的挑战以及如何应对这些挑战等问题进行了探讨,这通常被认为是“大数据”一词得以流行的一个重要时间节点①。由此开始,关于大数据的讨论不断升温。2012年3月29日,奥巴马政府投资超过2亿美元启动所谓的“大数据研究与发展计划”(Big Data Research and Development Initiative),致力于发展大数据处理所必需的工具和技能,以提高政府获取、组织大规模数据并从中获得知识的能力,这也成了公共部门关注大数据的典型案例。麦塔集团(META Group)分析员道格·莱尼(Doug Laney)在一篇研究报告中提出了被人们普遍接受的大数据的“3V特征”,分别是:其一,反映了大数据数量级巨大的规模属性(Volume);其二,表示大数据包含数字、文本数据、位置信息、传感器数据、图片和视频等多种类型在内的多样性(Variety);其三,体现大数据产生和增长速度的高速性(Velocity) 〔1 〕。在此基础上,一些研究者又补充了第四个“V”,从而有了四“V”,即价值(Value)、变动性(Variability)、脆弱性(Vulnerability)、真实性(Veracity)等。除此之外,一些研究者还认为大数据应当包括复杂性、交互性、共享性、开放性等。
总体看来,正如普施曼(Cornelius Puschmann)和伯吉斯(Jean Burgess)在词源学的意义上考察大数据概念时所指出的那样,“大数据(big data)一词显然是从商业世界中走出来的。这一早期关于商业数据处理技术的词汇所反映的是这样的需求:寻求新的工具以帮助企业更快地传送搜索数据或以更低廉的成本存储更大量的客户数据,但在此后,这个词语的意思却发生了转变,它的核心变为了分析的目的——尤其为了预测建模——而使用收集到的信息” 〔2 〕。也就是说,“大数据”一词不再仅仅表示一些领域或组织的数据规模超出了現有的存储和计算能力,而是承载了比这一困境本身更多的内容和目的,那就是去关注大规模数据在被获取、存储和分析之后所能带来的结果。简言之,大数据的所指随着这个词语的流行而从一种难题或现象转变为一个基于某种目的(例如降低成本、增加收益、预测未来等)的工具、资源或策略。当越来越多的人把谈论大数据作为时尚时,也就开始从各个方面持续不断地去赋予这个词语以新意,从而使大数据有了作为一种革命性的工具甚至是某种革命性的思维的内涵②。
维克托·迈尔-舍恩伯格(Viktor Mayer-Schnberger)和肯尼思·库克耶(Kenneth Cukier)在《大数据时代:生活、工作与思维的大变革》一书中就表达了这样一种观点,即把大数据看作是社会革命和思维革命的标志。根据这两位作者的看法,大数据带来了“一场生活、工作与思维的大变革”,他们用了“更多”、“更杂”、“更好”三个词来标识大数据所引发的变革:“更多:不是随机样本,而是全体数据”,“更杂:不是精确性,而是混杂性”,“更好:不是因果关系,而是相关关系”。概括地说,两位作者认为:首先,我们要分析和处理的是更大量、更完整的数据,而不是少量数据,在这种情况下,我们不再依靠随机样本,而是需要通过分析全部数据来获取知识。之所以能够做到这一点,是因为不断更新的技术让我们有能力去储存、分析和共享大规模的数据,而且也正是得益于新技术,可以让我们随时随地地测量和收集大量和复杂的数据信息。其次,由于我们面对的是混杂的全样本数据,这就要求我们应当适度放弃对精确性的追求,而应把注意力转向对事物发展的大体方向的把握。也就是说,人类无需像过去那样苛求小样本数据的准确性和精确性,而是需要从宏观视角中根据全部数据去了解事物的全貌。最后,人类不必再煞费苦心地追寻事物发展背后的深层原因,即应该放弃对因果关系的追求,而转向通过分析大数据的全貌来把握相关性,因为大数据能够为我们提供足够的相关性,足以帮助我们去把握事物的发展趋势,并实现对未来的预测。总之,“大数据时代对我们的生活,以及与世界交流的方式都提出了挑战。最惊人的是,社会需要放弃它对因果关系的渴求,而仅需关注相关关系。也就是说,只需要知道是什么,而不需要知道为什么。这就推翻了自古以来的惯例,而我们做决定和理解现实的最基本方式也将受到挑战” 〔3 〕9 。
在一个大数据概念不断升温的时代,《大数据时代:生活、工作与思维的大变革》一书的出版恰逢其时,很快就被翻译成各种语言,得到了大范围的传播。就这本书而言,它确实有着新的立意,虽然许多判断因为缺乏必要的证明而显得过于武断,但基于大数据对人类社会的发展方向所进行的新的解读则反映出了作者的创新勇气。不仅是它的社会意义,即便是从学术的角度看,这本书也是具有一定价值的。因为,作者在这本书中表现出了为大数据概念得以成立去寻找现实依据的努力,也敏感地捕捉到了许多新的社会现象,而且也试图去分析现实中一切由大数据所引发的新变动。至少,这本书对“大数据”一词的流行——尤其是向其他国家的扩散——是作出了贡献的。在迅速涌现的谈论大数据论题的文献中,这本书的与众不同之处就在于,它不是把大数据仅仅理解为数据规模大、数据种类复杂和数据增长速度快超出了现有技术的应对能力,而是努力从这些表面现象中解读出思维方式的变革,认为大数据包含着思维上的革命性力量,因为“大数据是人们获得新的认识,创造新的价值的源泉。大数据还是改变市场、组织机构,以及政府与公民关系的方法。” 〔3 〕9
一些中国学者也认为,“在大数据时代,人类第一次从技术上实现了话语权的平等。由于这一革命性的跨越,以往被限制、曲解和埋没的人民群众的意见和认识突然迸发出来,排山倒海,势不可挡。从博客和微博的相继出现与并行存在,可以看到大数据时代,它是信息产生和传播的一个重要途径,从信息产生,到新闻、报道、舆论等等文化现象的形成,涵盖了知识和文化形成的全过程” 〔4 〕131。这虽然是对一个时代的描述,似乎与大数据这一工具的出现并无直接关联,但作者是把这个时代命名为“大数据时代”的,不管是否偷换了概念,都洋溢着对大数据的热情。2012年的世界经济论坛在一篇题为《大数据,大影响:国际发展的新可能》的报告中为大数据描绘了一个更加美好的未来。报告指出,由于移动设备每天都能够收集到大规模的数据,而发展中国家的民众又占有着大量的移动设备,这就要求我们通过对这些数据的分析去了解他们的需求,并在此基礎上为他们制定更好的政策。“这些由手机传送来的数据大有用途,这是因为,对于低收入人群来说,手机是他们唯一的联络工具,同时也是因为,我们能轻松地将手机产生的数据链接到个体。这些数据可以为我们描绘出个体使用者的需求和行为图景……就可以为那些生活在贫困中的人们提供健康、教育、金融和农业等方面的更好的服务。同时,利用这些手机产生的数据可以让我们更好地了解那些弱势人群,让政府对新情况的出现有更快的反应。” 〔5 〕
其实,大数据是在后工业化进程中出现的一种新的社会现象,也是信息技术发展的必然结果。我们看到,工业社会无论是在生产还是生活领域中,都有着强烈的标准化追求,在某种意义上,可以说标准化是工业社会的最基本特征。而在标准化追求背后则隐含着数字化,因为,一切可以标准化的都必须得到数字的支持,而一切能够数字化的都能达到标准化的要求,或者说,标准化离不开数字化,标准化是数字化的表象,而数字化则是标准化的内容。但是,在工业社会后期又呈现出了一种新的景象,那就是数字化不再从属于标准化,不再亦步亦趋地紧随标准化的脚步,而是走上了独自发展的道路,甚至开辟出了逆标准化的道路,那就是为社会的个性化提供了准备。总之,在社会的标准化止步的地方,数字化并未停歇下来,反而加快了前进的步伐。所以,在20世纪后期也有许多学者用“数字时代”一词来描绘这个社会。也就是说,人们试图用数字来标识社会生活中的一切,希望把各种社会构成要素都还原为数字。也许正是这一点促进了信息技术的发展,把人类引入了所谓的“信息社会”,并在新世纪把大数据呈现到了我们面前。
自20世纪后期开始,人类进入了后工业化进程,一方面,我们已经习惯于用数字去标识一切可以标识的事物,并发展出了诸多数字技术;另一方面,社会却呈现出了高度复杂性和高度不确定性的特征,在应用数字去标识事物时使得数据每日每时都呈几何级数增长,这就要求人类不断刷新数字技术,而人类却又总是感受到数字技术的发展滞后于数据的生产量。所以,“大数据”一词开始流行了起来,这反映了人们面对数据的增长和数字技术的滞后而感受到的无奈,其实也包含着人们要求根据大数据去重新建构思维方式、生活模式和社会行动模式的追求。至少,大数据代表了一个新的概念或提法,已经成了一个尽人皆知的流行语。不过,也正因为它是一个流行语,我们更应当谨慎地审视它,以求正确地评估它以及它所带来的和可能带来的影响,并将大数据的应用纳入到科学的规范之中。鲍曼曾经指出:“一切流行之词往往都具有相同的命运:它们试图透明化的经历越多,他们本身就会越晦涩难解。它们所排挤和取代的正统真理越众,他们就会越快地转化成不容置疑的标准。” 〔6 〕1这也同样适用于对“大数据”一词的审视。我们已经进入了高度复杂性和高度不确定性的社会,承认差异和包容个性正在成为这个时代的共识。在这种条件下,“大数据”一词是不应与某种话语霸权联系在一起的,既不应被用于加固既有的中心-边缘结构,也不应沿着抹平差异和排斥个性的方向去寻求建构路径,更不应被用于扩大任何意义上的数字鸿沟。
二、大数据是否带来了思维变革
“半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。信息总量的变化还导致了信息形态的变化——量变引起了质变。” 〔3 〕8大数据的确是在这种变化中出现的,也可以认为大数据的出现意味着人类社会的发展经历了工业社会数百年的积累而进入了质变的过程。但是,大数据的出现是否像舍恩伯格等人所认为的那样代表了一种新的革命性思维,却是一个尚待观察的问题,或者说,它取决于我们对它的建构。在《大数据时代:生活、工作与思维的大变革》中,舍恩伯格等人专门探讨了“大数据时代的思维变革”,认为大数据反映了一种新的思维,而且它正在“开启重大的时代转型”。果真如此的话,似乎我们就只需等待着去收获大数据这一变革的成果了,而不是去自觉地根据人类的基本价值实现的需要去加以建构了。其实,正像大数据赖以生成的源头——近代以来的科学技术——一样,大数据依然是社会生活的工具,它是可以被用于提高人的福祉的,但同时,它也可以被用于反人类的行动。如果是这样,就其杀伤力而言,我们甚至可将其与业已存在的大规模杀伤性武器相类比。
从目前人们认识和研究大数据的视角和观点来看,其中所包含的和反映的基本上仍然是在工业社会历史阶段中形成的线性思维。就大数据是一种工具而言,它虽然包含着某些突破线性思维的内涵,但思维方式的变革并不是大数据本身所能完成的,而且,也并不意味着人们必然会通过大数据和借助于大数据而实现思维方式的变革。现实情况是,人们正是在工业社会的一种延伸的意义上去解读大数据的,既没有像舍恩伯格等人所断言的那样带来了思维方式的变革,也没有根据大数据的要求去对我们社会的基本结构进行反思,更不用说有着打破既有的社会基本结构的自觉行动了。无论是在一国内部还是在国际社会中,我们现在所拥有的都是一个具有基础性意义的中心-边缘结构,如果说大数据能够引发思维方式的变革的话,显然会最终指向这一中心-边缘结构,会使大数据成为打破中心-边缘结构的利器。但是,在人们缺乏自觉性的情况下,这仅仅是一种可能性,如果大数据被一些人用于维护中心-边缘结构的话,那么,大数据就极有可能在未来成为被逐渐消解掉的一种暂时出现的社会现象。
上述可见,舍恩伯格等人概括出了大数据的三大特征,即“全体数据”、“混杂性”和“相关性”。从作出这种概括的出发点来看,显然是站在效率追求的视角中所看到的表象,而且,所概括出的这三大特征也明显包含着要求控制的目的,甚至我们看到,控制的动机是非常强烈的。我们说,人类自20世纪后期起逐渐呈现出高度复杂性和高度不确定性的特征,大数据也是产生于这一历史背景下的。表面看来,舍恩伯格等人笔下的大数据是承认社会的复杂性的,但是,我们在仔细观察中却发现,他们对大数据的研究是出于谋求相关性的目的,在實质上则是为了逃避复杂性,而不是应对复杂性。可以说,舍恩伯格等人所表达的其实依然是工业社会所具有的那种深植于人的思维之中的典型的“化简”追求。科学研究已经证明,在工业社会的历史阶段中,思维和行动遵循着两个最为基本的原则,那就是“化简原则”和“以不变应万变原则”。在工业社会的低度复杂性和低度不确定性条件下,面对复杂性的化简和面对不确定性的以不变应万变都是具有合目的性的,特别是得到了日益进步的科学技术的支持,依据这两项原则而开展的思维和实践活动基本上都是成功的,或者说,取得了令人惊叹的工业文明成就。然而,当人类社会呈现出高度复杂性和高度不确定性特征后,上述两项原则都无法再在思维和实践活动中显示其优势了,相反,却束缚了我们的思维和行动。舍恩伯格等人并未能担负起思维变革的任务,甚至可以说,他们并不知道思维变革应该在何种意义上和在哪个层面上展开,也不知道思维变革所要达到的目标是什么。
根据舍恩伯格等人的看法,只要我们从大规模数据中找到两个事物之间的相关性,并能够从这种关于相关性的知识中获益,就实现了对大数据的驾驭和利用,至于其余的问题都不再需要考虑。也就是说,人类无需再像现代科学那样去追求精确性。对此,他们是这样描述的:“我们要做的就是要接受这些纷繁的数据并从中受益,而不是以高昂的代价消除所有的不确定性……拥有更大数据量所能带来的商业利益远远超过增加一点精确性,所以通常我们不会再花大力气去提升数据的精确性。” 〔3 〕55-56这无疑是说,对于社会的复杂性和不确定性都可以置之不顾,只要在大数据中找到了相关性,并能够从中获得实际利益,就达到了数据处理的目的。这样一来,不仅科学的态度是多余的,而且是否有益于人类社会整体利益的问题也是无需考虑的了,只要找到有效的相关性,就可以使成本降低并使效益提升。总之,实用原则是面对大数据的最高原则。如果这就是大数据思维的核心特征的话,那么,所谓大数据思维岂不是与一切专注于眼前利益的鼠目寸光的人的感性思维一样?就此而言,舍恩伯格等人所说的思维变革和大数据思维甚至没有达到现代理性思维的科学水平,而是反映出了一种浅薄的实用主义利益观,它遵循了工业社会思维和实践的化简原则,但是,却退回到了闭目无视社会复杂性的地步,以为这样就可以使一切都变得无比简单了。
为了强调大数据的全样本(即总体数据)分析,舍恩伯格等人对传统的随机样本分析进行了批判。他们认为,传统的随机样本的做法是在人类无法获取和分析大数据的情况下而采取的权宜之计。也就是说,在大数据出现之前,人们无法获得大规模数据,也没有能力有效地分析大规模数据,因此,才退而求其次地选择了随机样本分析。大数据时代的人们具备了获取和分析全体数据的能力,也就不应再守着随机样本分析的老办法。这可以说是面对大数据而提出的一个建设性的意见。我们应当看到,随机样本分析在人类社会呈现出高度复杂性和高度不确定性的时候确实变得很不可靠,但是,大数据所谓的“全数据模式”是否可靠,依然是一个有待回答的问题。其一,在高度复杂性和高度不确定性条件下,无论人们有着多么先进和高超的大数据处理能力,即使我们确实收集了所有数据并用技术对其进行分析,人类事实上也只能把握点与点之间的相关性,或者把握局部的相关性。如果打算从中发现一般和普遍的话,那是不可想象的,如果我们自认为从所谓的全数据分析中获得了普遍规律和趋势,那只能是自欺欺人的。其二,就大数据是大规模数据而言,并不会停留在某个既定的状态中,而是处在不断增长中的,尽管人们处理数据的技术和能力在迅速提高,但与大规模数据的增长相比,总是滞后的,这就决定了全数据分析也总是落后于现实的。可见,当我们把大数据与社会的高度复杂性和高度不确定性联系在一起思考的时候,思维方式的变革并不是舍恩伯格等人所宣称的那些大数据的表象特征,而是需要我们基于大数据去进行研究的。也就是说,思维变革尚未发生,而是需要我们自觉地去探索和寻找出路。
在关于大数据的研究中,我们感受到一种非常固执的控制导向,其中,最为典型的表现就是研究者和实践者所表现出的强烈的“预测”渴望。舍恩伯格等人认为,“大数据的核心就是预测”。这是一个具有普遍性的看法,许多涉及大数据的作品中都包含着这样一种追求,甚至有些著作不厌其烦地向我们展示大数据的某些科幻版本,努力让我们相信大数据及其相关技术可以让我们实现对未来的全景预测。从历史上看,在每一次历史转型的时刻,都会涌现出一批空想主义者,为我们提供一些关于未来的诗意描绘。其实,很多观点都是在已经落后于时代的情景和思维中创造出来的。在从农业社会向工业社会转型的时刻,空想社会主义所提供的往往是经他们改造后的农业社会理想版本,并让人感到那是一些比工业社会更美好的乐园。同样,当我们正处在从工业社会向后工业社会转型的时刻,受到空想主义的纠缠也是难以避免的。就大数据是在后工业化进程中出现的新生事物而言,是在整个工业社会的发展进程中所没有遇到的。可是,工业社会的人们长期以来一直有着强烈的要求预测未来的冲动,而且他们相信有了科学而不是算命先生的相术,是能够实现对未来的科学预测的。正是由于这已经成为一种思维定式,当大数据出现后,再一次激发出了人们预测未来的热情,再一次让人们看到了让幻想成为现实的曙光。舍恩伯格等人在《大数据时代:生活、工作与思维的大变革》一书中讲述了许多关于预测的故事,诸如预测机票价格的变动趋势、预测流感的爆发与传播、预测个人的支付能力和消费行为、预测人体和其他系统的异常情况等等。不过,舍恩伯格等人又一再强调,这种预测只是要了解趋势,是为了获得采取行动的依据,至于趋势背后的原因以及基于趋势所做的预测是否可靠,都无需知道,而且也很难知道。“这个预测系统并不能说明原因,只能推测会发生什么。也就是说,它不知道是哪些因素导致了机票价格的波动……这个系统只知道利用其他航班的数据来预测未来机票价格的走势。‘买还是不买,这是一个问题” 〔3 〕6 ,这不恰恰是工业社会商业世界运行的逻辑吗?即只关注形式而不求知晓形式背后的原因。
总的说来,舍恩伯格等人的《大数据时代:生活、工作与思维的大变革》所反映出来的依然是一种线性思维。这是因为,他们没有看到大數据是与我们社会的高度复杂性和高度不确定性联系在一起的,而是在寻求确定性的基本思路中去思考应对大数据挑战的措施。正如我们已经指出的,在工业社会低度复杂性和低度不确定性的条件下,只要认识和把握了事物间的相关性和因果联系就能够找到应对措施。但是,这种做法无法满足也不可能满足后工业社会的现实。在信息技术大大压缩了时间,甚至在一定程度上把时间维度剔除了的情况下,舍恩伯格等人用相关性否定因果关系,紧紧抓住相关性不放,并以为这样就能够让复杂和不确定的世界显得简单而确定,这显然是一种过于简单也过于天真的想法。基于这种简单的和天真的想法,如何能够提供切实可行的大数据应对方案,更不用说去预测未来了,即便是根源于近代以来固有的控制追求,也会陷入非常尴尬的境地。不过,舍恩伯格等人的《大数据时代:生活、工作与思维的大变革》是一部有着最为广泛影响的涉及大数据问题的著作,它的广泛传播也说明:其一,它敏感地反映了大数据这一时代课题;其二,它迎合了我们这个时代中人的线性思维习惯。也就是说,尽管网络已经成为我们生产、生活和交往的基础性平台,但我们还没有学会网络思维;尽管在高度复杂性和高度不确定性的条件下人类需要的是去谋求人的共生共在的出路,但我们还斤斤计较于个人的利益得失;尽管人类需要用合作行动去应对一切挑战,而我们却更乐意于通过竞争或斗争的方式去开展社会活动,而且,所有这些已经远远落后于时代要求的做法又都得到了制度性设置的鼓励,甚至我们早已因为习惯了这些制度性设置而忘记了所有其他的可能,就像我们已经不知道如果不通过竞选的方式如何能够产生一位总统。所以,在今天,“大数据”一词所包含的更多内容还是用来维护或者去改善工业社会中所生成的一切,用来为个人的以及小群体的利益服务,甚至用来实现对社会更为严苛的控制。既然如此,又如何判断大数据带来了思维方式的变革呢?
总之,舍恩伯格等人所许诺的大数据思维并不是什么新思维,它赖以立基的确定性和可预测性、控制导向、利益导向、技术主义等都表明他们所描述的仅仅是工业社会线性思维的一种延伸。当然,我们承认人类进入了一个包含大数据的时代,但我们不能仅仅满足于数据处理和数据分析能力的不断刷新,更不应从这里错误地解读出思维方式的变革。因为,如果我们满足于此的话,就可能在我们面前伸展出一幅极其惨烈的竞争甚至斗争画面。也就是说,在工业社会线性思维的逻辑下去认识和理解大数据,必然会在人类社会生活的几乎所有层面催生出新一轮的竞争浪潮,不仅国家之间、群体之间而且个人之间都会去抢夺大数据这一新发现的宝藏。如果说争夺领土进而划分势力范围的大规模战争在今天已经结束或被认为过时了,那么互联网所塑造的虚拟世界就会因为这种思维方式而成为各个国家竞相逐鹿的另一个竞技场。“如今,数据已经成为了一种商业资本,一项重要的经济投入,可以创造新的经济利益。” 〔3 〕8 “大数据,将成为全世界下一个创新、竞争和生产率提高的前沿。抢占这个前沿,无异于抢占下一个时代的‘石油和‘金矿。” 〔7 〕58 既然大数据预示着商业利益,是在对商业利益的追逐中兴起的一种工具,就必然会引发对这一新事物的狂热追求。
托马斯·达文波特(Thomas H. Davenport)曾表示,数据分析能力是当代公司的核心竞争力,“大部分发达国家的公司有着充足的理由去追求数据分析的战略……愈演愈烈的全球性竞争加剧了这种需要。那些在产品成本方面无法战胜其印度或中国对手的西方公司,可以通过优化商业过程来重占上风。” 〔8 〕我们知道,我们拥有的是一个具有中心-边缘结构的世界,在这个体系中,民族国家是划分成中心国和边缘国的,中心国本来就凭借着经济、政治和军事实力控制着这个世界,并通过控制而实施着对边缘国的剥削、压迫。现在,中心国从大数据中看到了新的控制和支配工具,可以通过率先占领这一新兴技术去塑造自己相对于边缘国的新优势。这样一来,基于利益谋划的大数据及其所带来的行动只会成为那些占得先机者赚取巨额利润的工具,在中心-边缘结构中,就是剥削边缘国的工具。事实已经如此,由于中心国已经在工业化道路上取得了丰硕成果,他们就拥有再次抢占先机的优势,当他们率先占据了大数据的中心位置,那么,作为一种新技术,大数据的扩散就会遵从中心-边缘结构中的技术垄断和扩散模式。“大数据是一次技术革新,技术革新的扩散从来都不是迅即和统一的……由于发展中国家在基础设施、人力资本、经济资源供给和制度框架等方面的匮乏和不利因素,大数据——像此前所有的技术革新一样——将经历一个缓慢而不平等的扩散过程。” 〔9 〕在这种中心-边缘结构的扩散模式下,其他国家依旧是作为边缘存在的,大数据只是在他们的边缘状态上又增添了一个新的面相。也许正是意识到了这一点,中心国才会努力把持大数据的高地,并通过技术转让等方式而继续实施对边缘国的控制和支配。面对这一状况,我们认为,问题的关键在于工业社会的思维方式没有被改变,如果我们从根本上意识到大数据这一人类社会的新事物需要有着相应的思维方式与之相伴随,那么,自觉地谋求思维方式变革的运动就不会在对大数据的直接观察中进行,更不应声称大数据已经引发了思维方式的变革,而是需要在后工业化的场景中去思考思维方式的变革问题。
三、大数据能否改变社会的基本结构
我们正走进包含着大数据的时代,大数据已经开始影响我们社会生产和生活的各个方面,然而,与这个时代相适应的真正的大数据思维尚未建立,面对大数据,人们依然拥有和应用着在工业社会历史阶段中所形成的线性思维,努力去消解大数据所包含的社会变革要求,甚至试图将其应用于巩固工业社会的基本结构——中心-边缘结构。应当说,人们已经意识到了大数据对社会造成的冲击,也在积极地通过大数据去对社会生活作出一些新的安排,但从总体上看,人们仍然是在工业社会的思维习惯中理解大数据,还仅仅是把大数据理解成一种机遇,利用大数据去开展竞争和谋取更多的利益。这样的话,就必然会引发人类社会长期存在着的不平等和非正义的加剧。我们知道,在农业社会,人类的一切不平等和非正义都是根源于它的等级结构,而在工业社会中,不平等和非正义则是根源于社会的中心-边缘结构。现在,大数据的出现是与人类社会的全球化、后工业化联系在一起的,或者说,大数据是全球化、后工业化的标志之一,是全球化、后工业化用以展现这个伟大历史进程的途径之一,它是包含着思维方式和社会变革的要求的。当然,大数据毕竟只是一种新工具,作为工具,它既可以成为引发社会变革的因素,也可以被用来去巩固既存的现实。从当前的情况看,在人们面对大数据的一切热情背后,所包含着的是因为有了新的手段去实现工业社会长期力所不及的控制而爆发的欣喜,人们努力通过大数据去达成谋利的、有效协作的、加强社会控制的和获取一切竞争优势的等等目的。这样下去,也就必然会导向对既有的社会基本结构的强化。
就当前的情况来看,大数据之所以产生,更新数据处理技术的要求之所以被提出,其直接原因是无处不在的各种传感器、记录仪或监测系统,它们随时随地记录、存储和上传各种类型的数据,这些数据最终汇总起来就构成了一个大数据,而且对这些大数据的分析是能够有着明显收获的。在扩大的意义上,每个人都是数据和信息的提供者,都随时随地地生产数据,因而在整体上汇聚成了大数据。正是在此意义上,大数据的研究者认为,人类已经进入了信息自由和信息平等流动的时代,每个人都是信息的提供者,同时也在数据的生成中获益。这确实是我们当前在信息流中所看到的情况。不过,这种信息流的生成有时是人们主动提供和自觉生产的,而有时则是无意识地生产出来或不自觉提供的,即便是一些自觉生产的信息也存在着不自愿提供的情况,而更多的情况是,通过信息搜集和信息处理所获得的信息,往往是人们不情愿提供的,甚至是在毫不知情的情况下被窃取的信息,有时却是眼睁睁地看着被强掠了的信息。另一方面,这些被汇集起来的信息往往被有着信息收集和分析技术的强大组织所掌握和利用,事实上则成了他们谋取利益的手段。在大数据的语境下,每个信息提供者都作出了自己的贡献,即为大数据的效益作出了贡献,但是,大数据的效益却被少数人所收获和占有。从个人的角度去看,贡献者是应当得到与其贡献相应的那部分收益的,但事实却是,信息提供者并未从中受益,更不用说大数据能够满足社会的普惠预期了。
如果说大数据意味着一个时代的开启,是社会变革的引信或动力,那么,大数据的运行就不应是耽于工业社会模式中的,也不应从属于工业社会的基本社会结构,而是会显现出对工业社会的运行模式和基本结构的挑战。然而,现实情况却是,大数据带来的有形和无形收益都不是为全社会所共享,而是在工业社会的中心-边缘结构中进行分配,原先处于社会中心的人及其人群基于权力、资本以及社会地位等把持了数据猎取和处理的优势,甚至具备数据处理能力的专家也只不过是他们的雇佣者,为他们打工并得到一份可怜的恩赐工资,而绝大多数社会成员依然处在边缘地位上,表面看来大数据使他们的生活内容和行为方式发生了改变,但实际上他们的社会地位以及生活质量并未因为大数据而得到改善。在工业社会的中心-边缘结构中,中心对边缘的剥削主要反映在财富方面,根据经济主义的理解,正是为了实现财富上的剥削和掠夺,才有了政治上的压迫,才在政治的合法性追求中出现了由政府执行的社会控制。而现在,剥削的触角伸向了信息,即增加了一重对边缘人(群)所生产的信息的占有,而且是通过掠夺和窃取的方式实现的占有。就此而言,显然是与后工业化中的去中心化要求不一致的,而且恰恰是反向而行的。
我们看到,有各种迹象表明,后工业化进程将是一个去中心化的过程,从信息生产和信息传播来看,这种去中心化过程的反映就是:每个人都是信息的生产者和传播者,也同时是信息的接收者和处理者,而且都发生在此时此刻,特别是在网络结构互动的平台上,每个人都是一个随机性的节点,在信息的生产者和接收者之间自由转换角色。这是与传统的由中心收集信息或发布信息完全不同的传播模式,是不再有中心与边缘区分的模式。这是一种有着广泛扩散可能性的无中心状态,它将意味着我们的社会将打破中心-边缘结构,并为网络结构取而代之。大数据是出现在后工业化进程中的一个社会现象,它本应汇聚到去中心化的进程之中,成为打破中心-边缘结构的力量。然而,现实情况却是,虽然每个人都是信息的提供者,却在信息收益的分配中处于边缘地位,作为社会成员中的边缘者的性质丝毫没有改变。对于大数据而言,边缘者并非自觉地生产信息,他们在信息流动和处理中没有任何自主权,收集、存储、分析进而进行加以利用的行动都被中心所垄断,这就进一步强化了生成于工业社会的中心-边缘结构。如果说工业社会的中心-边缘结构决定了信息是从中心向边缘单向流动的,那么大数据的信息流轨迹依然表现出了中心-边缘结构,至多也只能说是在中心-边缘结构的主轴上生成的一种变体,或者说,它是因中心-边缘结构在后工业化进程中进行自我维护和自我強化的要求而出现的一种变体。这样评价大数据,也许过于激烈了,因为它毕竟是在后工业化进程中出现的新生事物。不过,我们应该看到,大数据仅仅是工具意义上的新生事物,可以在后工业化进程中成为打破社会中心-边缘结构的利器,也可以被用于巩固社会中心-边缘结构,而现实所呈现给我们的恰恰是后一种情况。
在社会治理体系的运行以及社会治理的行动中,公民(众)参与、政府信息公开等出现在20世纪后期的新方案都是基于社会以及社会治理体系的中心-边缘结构而作出的新设计。以“参与治理”为例,是因为有了中心和边缘才有所谓参与,参与也就是让社会治理体系中的边缘参与到社会治理过程中来,而主持参与、操纵参与的人则是处在社会治理体系中心的行动者。在20世纪后期公众参与运动兴起的时候,许多睿智的学者就指出了这一点,而且也出现了许多激烈的批评。然而,在大数据的概念开始流行后,一些人又开始重拾“公民参与”、“政府信息公开”等话题,声称大数据能够让参与者充分了解政府以及政治运作的信息,从而实现更为有效的参与。试想,如果公共参与的操纵机制不发生改变的话,公众的有效参与又何以可能?就“参与治理”而言,每个公民都的确成了某些政策信息的提供者,政府也确实为信息的采集建立了场所和平台,尤其是大数据的许多技术手段让信息供给与收集变得更加便捷,但是,就“参与”一词本身必须在中心-边缘结构中去加以理解而言,依然是难以避免被操纵的命运的。作为公众的一员,你可以非常认真地表达自己的意见和你认为无比重要的信息,但是,处于社会治理体系中心的政府及其官员可能根本不会把你所提供的信息作为决策的依据,甚至没有对你所提供的信息瞥上一眼,即便公众的声音汇聚成了震耳惊雷,处在社会治理体系中心的政府及其官员也可以凭借着手中的权力加以操纵,让参与行动朝着他们事先确定的方向发展。所以,在社会治理中心-边缘结构未发生变化的条件下,大数据是不可能使社会治理得到实质性改变的,反而会成为一项增强中心-边缘结构的新技术,让集权获得更大的社会控制力量。
从国际社会来看,情况也大致相同。我们知道,在现代化的进程中,西方一些率先建立起民族国家和率先实现工业化的国家通过资本主义世界化的手段而在全球建立起了中心-边缘结构,从而把世界分为中心国和边缘国,中心国依据世界的中心-边缘结构而实施着对边缘国的政治压迫、经济剥削和军事掠夺,而且这种世界格局迄今尚未发生改变。大数据出现后,一些学者试图从中解读出边缘国的发展机遇,鼓吹大数据将为全世界带来共同进步。根据他们的看法,大数据能够使边缘国民众的需求得到更好的了解,因为移动设备已经在边缘国得到了普遍应用,这些移动设备能够时刻收集并上传民众的健康、金融、社交等各类数据,只要通过对这些数据的分析,就能更加清晰地了解边缘国民众的需求,进而基于分析结果去为他们提供更好的服务。这看起来确实是一幅美好的图画,让人想起来都无比惬意,但是,在世界的中心-边缘结构中,由谁去执行?中心国愿意这样做吗?边缘国有能力这样做吗?我们认为,这些言论要么是中心国故意编织的谎言,是用来为他们窃取边缘国的数据并用这类数据去谋利而施展的欺骗伎俩;要么就是那些爱幻想又缺乏思维能力的人的臆语。事实上,关于大数据带来人类福利的各种允诺都是属于前一类谎言。“棱镜门”事件虽然因为斯诺登的叛逃和爆料而引发了公众的关注,但事实上,美国通过大数据实现对全世界的监控早已不是什么秘密了。不仅如此,中心国一直在通过互联网和移动设备采集一切可以采集的信息。他们通过技术转让、技术援助等方式实现了对互联网和移动设备的控制,从中获取数据,并将所获取的数据用于政治的、经济的和军事的目的。普通社会成员都知道,只要接入互联网,大量数据就会源源不断地被传输进中心国的存储设备中,中心国可以随意地处理这些数据。其实,中心国收集边缘国普通民众的信息并不是近几年才发生的事情,这些数据在很早的时候就已经躺在了中心国的存储设备里,只是中心国在早期并没有给予这些普通数据以太多关注,而是把重心放在了边缘国的精英阶层上了。“9·11”事件的发生开始让中心国把视线转向那些在自己的存储设备中沉睡了多年的大数据,才使边缘国普通民众的数据变得有价值了。这也正是一些大数据研究者所看到的大数据的“价值”特征,他们认为大数据时代要求人们学会变废为宝,把过去被忽略的数据利用起来,从数据中挖掘价值。“数据化意味着我们把一切都透明化,甚至包括很多我们以前认为和‘信息根本搭不上边的事情……这样,我们就激发出了这些数据此前未被挖掘的潜在价值。” 〔3 〕20 从舍恩伯格等人对这种价值的论述中也可以清晰地看到,关于变废为宝的建议显然是他们献于中心的一项计策。
虽然“大数据”一词是自2008年开始大范围流行起来的,但美国的“棱镜门”计划在2007年就已经启动了。“棱镜门”计划的主要内容就是收集包括电子邮件、网站登陆、社交传输中流动的文字、语音、照片、视频等各种类型的复杂数据。无论从数据规模、数据类型、数据增长速度、数据价值的哪个维度来看,这都俨然是一个大数据的典型案例。由此看来,美国是最先掌握了大数据收集和分析能力的国家,至于2012年奥巴马政府投资2亿美元于“大数据研究与发展计划”,只说明了美国有着进一步强化这种能力的要求,是为了从数据中挖掘出更多有利可图的价值。我们在上述提出了一个判断,指出大数据是后工业化进程中的一个新的社会现象,在此,我们需要再增加一项判断,那就是作为技术现象的大数据首先是与美国联系在一起的,是美国首先掌握了大数据的技术。所以,我们才看到了大数据是在既有的世界中心-边缘结构中成为中心国控制和支配世界的工具,不仅没有使世界变得平等,而且也没有为边缘国带来福利,实际上,反而使这个世界变得更加不平等了。
当然,中心国基于大数据的全球活动有时是以政府的名义直接进行的,但更多的时候则是通过跨国公司的市场行为渗透的。表面看来,世界市场有着“自由”、“平等”的面相,而在实际上,几乎没有任何一个跨国公司会像它的名称所显示的那样跨越国界,也不可能有置身于国家之外的所谓跨国公司,跨国公司无非是根植于某个国家而向其他国家“跨”出去的组织。也许包括中国在内的许多边缘国的人们都没有意识到这一点,但是,当美国国会对中国的一家叫做“华为”的公司作出决定时,说明美国最清楚跨国公司是什么样的经济动物了,同时也给全世界边缘国的人们上了一堂关于跨国公司性质的课。也许边缘国从来也没有打算控制从自己国家中成长起来的跨国公司,但中心国却从来也没有打算不去控制任何一个跨国公司,而是充分地利用跨国公司去诠释它对世界的支配权。以谷歌公司为例,它曾以拒绝中国政府的网络审查、拒绝向中国政府提供用户搜索信息等为由而退出了中国大陆,美国政府也在申述网络自由、言论自由的名义下就此事件而批评中国,甚至要求中国就谷歌退出事件展开调查。在这一事件中,美国政府与谷歌公司都在极力塑造一个言论自由、信息自由的美好形象,力图站在道德的制高点上向中国施压。但是,谷歌是否是一个独立的和自由的跨国公司,答案则是否定的。因为,谷歌公司与美国政府之间有着密切的配合,不仅谷歌公司默认了美国政府对它的监控,任由美国政府使用谷歌所获得的全世界用户的数据,而且谷歌公司也会时常主动地向美国政府开放一些特有的数据。这就是谷歌公司和美国所主张的言论自由和信息自由的真实状态。
在中心-边缘结构中,信息自由就像经济自由一样,只是中心国说于边缘国听的神话。一般说来,作为中心国中心的政府总是通过说服、交换、窃取、强制等方式要求企业传输数据,而在世界范围内,中心国则力图通过同样的方式要求边缘国将其所拥有的信息“自由地”传给中心国。在这样做的时候,中心国政府往往把根植于中心国的跨国公司笼络为自己的帮手。美国前国务卿希拉里·克林顿在2010年曾就所谓的“中国黑客”攻击谷歌事件发表声明,要求中国政府展开调查,“那些参与网络攻击的国家或个人应当承担惩罚和国际谴责。在一个網络互联的世界里,对一个国家网络的攻击就是对整个网络的攻击。为了强化这一意识,我们应当建立国家间的行为规范,并鼓励各国对全球网络公域(the global networked commons)给与尊重。”③当前,互联网和移动设备是数据的主要来源地,当它们方便于和有利于中心国从中获利的时候,中心国就会大谈信息自由;如果情况相反的话,中心国就会表现出在信息自由问题上的出奇的沉默。所以,大数据成了一把你争我夺的宝剑,人们希望夺得这把宝剑后而将对方置于控制之下,而中心国在既有的世界中心-边缘结构中占据着有利地位,已经实现了对大数据的掌控。但是,中心国并不满足于此,而且要求边缘国持续地、不断地向它(们)开放所有的数据。可见,在不打破世界中心-边缘结构的情况下,大数据只不过是由中心国操控的一个新的工具。我们看到,美国国防部为贯彻奥巴马政府的大数据计划而拟定的目标就是:“提升情景意识以帮助战斗人员和(军事)分析人员,为(军事)行动提供进一步的支持。将分析人员从各种语言文本中获取信息的能力提升一百倍,同时大幅度增加可供分析人员观察分析之用的物体、行动和事件的数量。” 〔10 〕在这里,我们所能看到的是一个什么样的世界前景?
总之,大数据是在全球化、后工业化这场社会变革运动中出现的一种新的技术现象,同时也是一种新的社会现象,它作为工具无疑是一把利器,这就意味着两种应用它的可能性:其一,可以应用于促进变革,以打破世界以及社会的中心-边缘结构;其二,被用来维护和巩固既有的世界和社会的中心-边缘结构。如果是后者的话,在不远的将来,我们所看到的就将是一场巨大的灾难。然而,当前的情况显示,无论是在一国内部还是在国际社会中,大数据都被用来强化控制体系,对于许多人来说,也都没有从中觉察到危险。正是这一点,可能是人类将要遇到的最大危险。也正是因为这一点,我们亟需为大数据这样的流行概念正名,力图将大数据这一技术工具引向增进人类福祉的方向。
注 释:
①也有学者认为,这是“大数据”作为一个专业术语被首次正式提出。如果仅仅在大规模数据的意义上来理解“大数据”的话,可以认为“大数据”一词早在上个世纪末就已经被提起,可参见:Cox, M., & Ellsworth, D. Application-Controlled Demand Paging for Out-of-Core Visualization. In Proceedings of the 8th conference on Visualization'97. IEEE Computer Society Press, 1997. 另外,需要指出的是,一些学者将“大数据”一词溯源至阿尔文·托夫勒(Alvin Toffler)的《第三次浪潮》,实际上,托夫勒并未在该书中使用过“大数据”一词,而是用了“information overload”等与“大数据”一词近似的提法。
②马丁·希尔伯特(Martin Hilbert)指出,应当在作为数据的小写的“大数据”(big data)和作为现象的大写的“大数据”(Big Data)之间作出区分,同时也应当与作为工具的“大数据分析”(Big Data Analysis)相区分,“大数据模式(Big Data paradigm)的关键并不在规模不断扩大的数据本身,而在于为了明智决策而对数据所做的分析(在此意义上,‘大数据分析的表述比‘大数据一词似乎更为适切一些)”。参见:Hilbert, M. Big Data for Development: From Information- to Knowledge Societies. Jan 15, 2013. http://dx.doi.org/10.2139/ssrn.2205145. 而艾玛纽尔·勒图(Emmanuel Letouzé)等人则提倡“基于发展的大数据”(Big Data for Development)的表述,认为“基于发展目的的大数据(Big Data for the purpose of development)与‘传统的发展数据(traditional development data)以及私人部门和主流媒体使用的‘大数据(Big Data)虽然相关,但在许多方面又有所区别。” 参见:Letouzé E. Big Data for Development: Challenges & Opportunities. UN Global Pulse, 2012, 47.
③Hillary Rodham Clinton. Remarks on Internet Freedom. Washington, D.C., 21 January 2010. http://www.state.gov/secretary/20092013clinton/rm/2010/01/135519.htm. 同年,《经济学人》的一篇评论文章写道,希拉里使用“the global networked commons”一词,“它是指,网络是一个共享的环境,就像海洋或天空一样,需要国际协作以实现对它的充分利用,而审查制度则污染了这一环境。扰乱信息流动不仅损害了数据的整体性,也是对自由言论的违背和对集会权利的否定……世界贸易组织负责监管货物贸易的自由流动,也许我们也可以诉诸于它去维护电子信息与服务的流通。”参见:New Rules for Big Data. The Economist. February 27, 2010. http://www.economist.com/node/15557487.
参考文献:
〔1〕Laney, Douglas. 3D Data Management: Controlling Data Volume, Velocity and Variety〔J〕.Meta Group,2001(6).
〔2〕Puschmann, C.,Burgess, J. Metaphors of Big Data〔J〕. International Journal of Communication,2014(8).
〔3〕〔英〕维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革〔M〕.盛阳燕,周涛,译.杭州:浙江人民出版社,2013.
〔4〕李德伟,等.大数据改变世界〔M〕.北京:电子工业出版社,2013.
〔5〕Big Data, Big Impact: New Possibilities for International Development 〔DB/OL〕.http://www3.weforum.org/docs/WEF_TC_MFS_BigDataBigImpact_Briefing_2012.
〔6〕〔英〕齐格蒙特·鲍曼.全球化——人类的后果〔M〕.郭国良,徐建华,译.北京:商务印书馆,2001.
〔7〕徐子沛.大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活〔M〕.桂林:廣西师范大学出版社,2012.
〔8〕Thomas H. Davenport. Competing on Analytics〔J〕. Harvard Business Review, 2006(84).
〔9〕Hilbert, M. Big Data for Development: From Information- to Knowledge Societies〔DB/OL〕. http://dx.doi.org/10.2139/ssrn.2205145.
〔10〕Obama Administration Unveils “Big Data” Initiative: Announces $200 Million in New R&D Investments〔DB/OL〕. https://www.whitehouse.gov/sites/default/files/microsites/ostp/big_
data_press_release.
(本成果受到中国人民大学“统筹支持一流大学和一流学科建设”经费的支持)
责任编辑 于晓媛