APP下载

生活是如何被篡改为数据的?
——大数据套用到研究人类的“原罪”

2016-11-25潘绥铭

社会观察 2016年7期
关键词:原罪人文建构

文/潘绥铭

生活是如何被篡改为数据的?
——大数据套用到研究人类的“原罪”

文/潘绥铭

近年来,对于大数据已经出现了盲目崇拜,就是无质疑、不反思地跟风颂扬和无限拔高。本文不涉及任何自然科学领域中的大数据及其应用,仅讨论一个根本问题:大数据能够套用到对于人类的研究中吗?

对这个问题,我国学术界虽然也出现了一些质疑,但是不仅寥若晨星,而且在学理上也主要是在可操作性的层次上争论,并没有击中要害。其实,大数据最值得质疑的,既不是其定义,也不是其功能或意义,还不是方法论层次上的“以相关分析取代因果分析”,而是“一切皆可量化”这个核心口号和基本理论。它表述了大数据的三层意思:其一,没有量化,就没有数据,更不可能有什么大数据;其二,物质世界当然是可以被量化的,但是如果仅限于此,那么所谓的大数据就仅仅是数量的增加,性质毫无改变,纯属炒作;其三,现在的大数据之所以被崇拜,要害其实只有一点:把人类的行为及其结果,也给量化了,而且号称无所不包。

这样一来,大数据的性质就变了,从自然科学侵入到人文社会研究,从科学蜕变为“唯科学主义”。这就不仅仅是一个研究工具的问题,而是一个认识论的根本问题。对此进行批评的人文社科著作汗牛充栋,本文不再一一列举,仅在操作的层次上分析一下,人类无限丰富的生活实践,在被“唯科学主义”改造成“数据”的过程中,究竟发生了什么。

现实生活被裁剪

大数据崇拜者极力鼓吹“4V”(规模大、种类多、高速度、高价值),却故意回避了一个根本的问题:在最开始,您收集到的,就是可以用来分析的数据吗?

在社会学的问卷调查中,这是有可能做到的;但是在所谓的大数据中,却绝对不可能。因为大数据并不是研究者主动去收集的人类行为及其结果,而是五花八门的所谓“客观记录”,是人类生活中微乎其微的那一部分“可获得信息”,例如上网活动所留下的痕迹、监控记录等。

可是尽人皆知,在人类活动的全部信息中,可获得的要远远少于不可获得的。后者最典型的就是人类的一切精神活动的信息,在可预见的未来,仍然不但是无法获得的,而且根本就是无法监测的。这样一来,所谓大数据所获得的信息,首先是极端片面;其次是漫无边际;第三是支离破碎;第四是毫无意义;根本不可能直接用于任何量化的分析。

那么,这样的信息怎么才能转化为可分析的数据呢?首先是必须加以“界定”,就是保留什么和舍弃什么;其次是进行“分类”,就是把什么归属于什么;第三步是加以“定义”,就是给某类信息赋予特定的人类意义;最后一步则是“赋值”,就是把不同的定义转换为可计算的数值。

显而易见,在这个四部曲的过程中,完完全全是研究者自己在主观地、人为地、强制地 “整理”那些“可获得信息”,把人类生活的痕迹,完完全全地篡改为自己的世界观和价值观所能接受的“数据”。往好里说,这叫做无可避免地加工;往坏里说,这就是赤裸裸地伪造。

这就是说,所谓的大数据,其实一点都没有超出“小数据”原有的局限性:裁剪生活,撕碎人生;非要把整体生存的“人”,视为一堆杂乱的零碎。在实际生活中,人类绝对不是,也不可能是这样来“量化地”认知和行动的。因此,大数据其实并不是帮助人类思考,而是企图取代和控制人类的生活经验,是人工智能的噩兆。

社会情境被忽视

有人已经发现,大数据记录的都是单独个人的行为,无法发现不同行为者之间的关系;于是问题就来了:在这个现实世界里,难道真的存在一种与他人毫无关系的个人行为吗?难道个人的一切行为,不都是在一定的人际关系中,才会产生,才会带来某种结果吗?

社会不是个人的简单集合,而是人们通过各种关系有机地组织起来的。同时,人们又是在特定的社会环境中做出各种行为的,不可能天马行空,独往独来。因此,人类活动留下的一切痕迹,必定蕴含着无限丰富的社会内容。如果舍弃之,那么不管什么样的数据,不仅是浮光掠影,而且必定是盲人摸象。

尤其是,每一个人都在特定的社会中,一点一点地成长为“此时此景中的此人”,然后才会做出“此因此果的此行为”。这就是每个人的社会历史建构过程,其中最重要的就是我们的一切社会背景、生活状况和成长经历。

可是这一切,往往仅仅存在于我们自己的经验与记忆之中;往往难于言表,更往往无法记录。从“客观监测”的角度来说,根本就是“风过无痕”。那么,就算毫无隐私,就算监测可以天罗地网,所谓大数据的信息源又是从何而来的呢?因此,对于了解人类生活而言,大数据其实根本就是空中楼阁。

主体建构被抹煞

“大数据崇拜者”很可能不知道,或者不敢承认:在人类生活中还有一种现象,叫做“主体建构”。即人们对于自己的行为所做出的解释,很可能与监测者的解释大相径庭,甚至背道而驰。最常见的就是,一切人际的误会,盖源于此。

那么,无论大数据监测到多少人类的行为,它究竟是如何分辨出其中主体建构的成分呢?第一,以网购的大数据为例,即使您收集到全部的上网痕迹,而且全都数字化地一览无余,那您怎么知道人家就真的就是这样想的呢?这种“客观测定”,离矿物学很近,可是人却是有主观意志的啊,您是怎么监测到的?连物理学还有个“测不准原理”呢,何况对于人的主观意愿?第二,您知道人类还会“自我呈现”吗?说不好听一些,就是表演。如果连测谎仪的结果,法律都还不予采信,那么您怎么筛除被监测对象的表演呢?第三,难道您就不找被监测对象去核实一下?在司法审判中,就连证据确凿的罪犯,法官也必须听取他的说法,才能做出正确的判断。可是大数据崇拜者却根本漠视主体意愿的存在。这岂不是自欺欺人?第四,您知道除了“动机”,还有“无意识”吗?即使是某些询问对方意愿而获得的数据,也仍然存在着这样一个问题:对方是否具有足够的能力来表述自己的意愿呢?不应该忽视无意识行为的广泛存在,更不应该否认:人类的一切行为痕迹,无论多么海量,其实并不能容纳和表述人类的生活意义。因此,如果行为者自己都搞不清楚自己是怎么回事,那么您还怎么去核实呢?根据什么来判断真伪与程度呢?

总而言之,一切试图用自然科学或者数字化来了解人类及其社会的尝试,不是都必然失败,而是都无法否定人类“主体建构”的重要性,结果都必然是把真实的生活给削足适履了。

生活意义被取消

人文社会研究的至少两千年历史告诉我们:人类的一切行为,不仅蕴含着他们的人生意义,而且是为了追求其人生意义而行动的。这是人与物的根本区别。可是,大数据所谓的一切“可记录的痕迹”,如果没有获得对方的主诉,那么就不可能包含该行为意义的信息。例如一切上网活动,行为主体都不会表述自己为了寻求什么才这样做的,也不可能表达出这样做带来了什么样的价值与意义。

交通监控录像、医疗记录、通讯记录,等等,都足以号称自己是“大数据”。可是,所有这些数据,都仅仅是记录下了人们生活中的一个个零散的侧面。因此,这样的“大数据”再怎么大,也无法解决以下一系列常识性的问题:首先,人在生活的某个侧面里的表现,与他/她的整个人格与人生,难道不存在紧密的关联吗?农民工吃20 元的盒饭都嫌贵;富豪买上千万的汽车也不眨眼,这难道仅仅是所谓的“消费选择”吗?其次,人类生活的各个侧面之间,难道不是相互影响着的吗?农民工吃20元的盒饭,却可以搭上200元的礼钱;富豪买上千万的汽车,却不肯做一点儿慈善,这也仅仅是所谓“购买习惯”吗?最后,任何一个人的生活,难道不是被社会、文化、历史等因素制约着吗?农民工之所以要吃20元盒饭,绝不仅仅是因为工资低,还因为他的抚养系数、失业可能性、职业风险等等都比富豪要高出很多。这,难道也是“可支配资金”吗?如此这般,数据越大,岂不是错误越大?

结语:原罪就是原罪

在基督教教义中,原罪不但是与生俱来的,而且是背负终身的,不能通过人自己的救赎而被消除。很可惜,量化研究也是如此。无论其技术手段如何发达,无论其数据多么大,一旦应用于人文社会研究,其缺陷与弊病就根本无法避免,充其量也不过是程度的减轻而已。说到底,“大数据崇拜”,其实就是“唯科学主义”在人类历史面前一败涂地后的末日哀鸣。如果科学没能阻止希特勒的统治,也没能预测出此后人类的一切发展,那么就绝不是“艺不精”的问题,而是用错了地方,是越界跑到了自己无能为力的领域。

当然,这并不是说,量化研究和大数据就一定不能用,而是表达三层意思:首先,它们都不能质疑更不能取代各种非量化的人文社会研究;其次,只有对这些先天缺陷进行深刻反思,并且予以充分展示的量化研究,才有资格在人文社会研究中保留一席之地;最后,两种研究就像是两条铁轨,缺一不可,但又平行延伸,永不交叉。

(作者系中国人民大学性社会学研究所教授;摘自《新视野》2016年第3期)

猜你喜欢

原罪人文建构
论相对独立的刑事涉案财物处置程序之建构
美在山水,魂在人文
最朴素的人文
情境—建构—深化—反思
建构基于校本的听评课新文化
建构游戏玩不够
罪与罚
《年轻的布朗先生》:对信仰的批判与坚持
人文社科
华为在美国人眼里大概有“原罪”