大数据的技术乐观与人的体验
2015-08-15李岩
李 岩
(深圳报业集团博士后工作站,广东深圳,518009;吉林省社会科学院哲学与文化研究所,吉林长春,130024)
整体行为的状态与特征,常常超越个体眼光的范围,但冥冥中好似有一种力量在把持调控,如亚当·斯密所谓的“看不见的手”。对于市场行为,这种“看不见的手”带来了乐观的情绪,在观念上人们愿意相信市场的机制有着巨大的积极力量,能够在经济生活中实现“每个人心满意足、所有人皆大欢喜”的局面,而且还有着自我调节和纠错的能力。这种观念甚至并不完全出自亚当·斯密的原始文本,但经由约瑟夫·熊彼特和保罗·萨缪尔森的解释学解读,被一再地传承下来[1-2]。
“看不见”隐喻着一种视觉维度。视觉上的“invisible”可以理解为触觉上的“inaccessible”,作为个体的人没有一个“上帝视角”,因此不能获得一种“真正”的全局性资料,不能把握控制全局的动态,正所谓“不识庐山真面目,只缘身在此山中”。这种资料的无法获得,即“inaccessible”,在视觉上也是存在着的“无”(invisible)。而人类的技术,正是把“不可见的”变为“可见”,把“不可触碰”变为“可以获得”。随着数据技术的革命与革新,我们正在形成更高维度的“景象”,原来难以搜集和整合的讯息,可以相对便利地获取,大数据技术为我们提供了越来越多的关于整体行为的可辨识信息。从20世纪90年代以来,我们进入了所谓的“数字时代”。
一、大数据与人的解放
数字时代的到来与计算机技术的发展紧密相关。如果说牛顿开启的物理学时代,因为力学的范式转换与技术的革命相得益彰,造成了工业技术革命而解放了人的肢体,那么计算机技术与人工智能的发明则解放了人的大脑。工业革命使人们能够凭借自然能源—能量的转化,从事自身的物质财富生产,而数字时代的开启,使人们的文化生产、信息生产、符号生产更加便利。事实上,物质、能源、信息、数据成为今天人们完成自身生产—生活的主要元素。
在这里,还有更重要的一个维度越来越引起人们的审视。就是随着技术革命的到来,人类的物质—文化生产越来越超越个人—个体的层面,而进入到群体的高度。最初的物质工具是以解放个体的身体为主要目标的,但随着大机器生产模式的推广,人越来越依附于机器,以生产线生产为主要特征的工业模式逐渐成为主流,某种意义上导致了“人”的消失。更进一步,计算机技术的发明与更新是以解放个体脑力为目标的,但是分工与协作的二元关系,要求作为“端口”的PC机必须以“联合”的形式组装起来,而这是今天意义的数字时代的基本含义。作为关系的互联网超越了作为个体的PC机,从原始的单点数据—计算发展到互联网时代的数据信息交流。
数字时代带来了个人计算机的普及,而更重要的是这些计算机可以在更大的网络中相互连接和交流信息,大数据的计算与联结为工作带来了巨大的便利与灵活。数据越来越不是个体通过搜集、运算就能从中获取必要信息的原生材料,它超越个体层面,内在地诉求一种更高维度的革命性“算法”。数字时代和信息时代是一个时代的孪生名字,在这个时代里,人们不能够再局限于个体范围内的工作,而是进入到“大联结”的网络。
所谓大数据并没有一个完全清晰的定义,一般来说,是指用目前在机构型数据库占据主流地位的关系型数据库无法进行管理的、具有复杂结构的数据。或者也可以说,是指由于数据量的增大,导致对数据的查询响应时间超出允许范围的庞大数据[3]。这是一个从外延上界定的概念,其中的意义在于,它超越了“个体”处理器的操作能力范围,必须借由更高层级的计算机制来实现运算的数据,因此大数据也是一开始就与“云计算”相联系的。
大数据的运算试图超越个体层面,以捕捉更高层次的信息,这是通过技术手段分析“看不见的手”所“操持”的行为动向。这大大推动了人的智力解放,面对广泛数据背后隐藏的价值信息,大数据在“量”的层面保持巨大的优势,一般来说具有“4V”特点,具体是指“Volume”(大量)、“Velocity”(高速)、“Variety”(多样)、“Value”(价值)。一个典型的例子是2009年谷歌公司对流感的预测,谷歌把美国人最频繁检索的5000万条词条和美国疾控中心在2003年至2008年间季节性流感传播时期的数据进行了比较。它总共处理了4.5亿个数字模型。经过与官方数据的对比后,谷歌公司的预测与官方数据的相关性高达97%。谷歌公司通过大数据分析,能够及时准确地判断出流感的传播的源头,传播的路径[4]2-4。无论是对现实的跟踪还是未来趋势的预判,大数据都表现出强大的数据信息生产力,人们越来越感受到高大数据技术带来的运算便利,形成了前所未有的“技术乐观”。
二、大数据与时空关系
大数据的有效运行开辟了一个新的乐观局面,这是技术推动的一个重要里程碑。大数据分析从根本的意义上说,是数据与运算在新技术下的重新整合,是基于归纳分析的一次新技术应用。在归纳方面,由于大数据在数据采样上克服了以往因为技术不足而导致的数据收集的困难,使得这种分析在概率上更具有可信度。但是也应该看到,归纳本身的悖论——采样的不可绝对穷尽——依然是大数据分析技术无法超越的。这也为大数据平添了一分底层限制。
归纳不可能是绝对因果性的,关于这方面,提出大数据理念的舍恩伯格等人已经觉察到,所以他特别强调了大数据分析的是“相关性”而绝非“因果性”。他采取的策略是回避哲学上的论争,指出“因果关系还是有用的,但是它将不再被看成是意义来源的基础。在大数据时代,即使很多情况下,我们依然指望用因果关系来说明我们所发现的相互联系,但是,我们知道因果关系只是一种特殊的相关关系。相反,大数据推动了相关关系分析”。[4]89
从另外一个侧面上说,这种相关性的特点也决定了大数据永远是处于一种“在路上”的状态,必须保证自身技术的“实时性”,因为相关性拒绝为因果性“埋单”,所以它必须时时监测数据的“动向”,以技术代替人去关注更高维度的发展脉络。它并不企求一劳永逸地为数据在“因果律”上获得解释,而是凭借海量数据的高级运算,从底层迷宫上升到更高的层次,俯瞰其“相关性”。
大数据常常牵涉到人群行为与时空之间的关系。从时间的关系上看,可以按照“过去—现在”,“现在—未来”和“未来—现在”三个层面来看。第一种是对已经发生了的行为状态进行呈现,大数据在这方面的优势在于,它能够使原本很难收集和使用的数据变得容易利用,通过各行各业的不断创新,大数据能够有效地对既已发生的行为状态做出分析,并对现在的状况做出合理性解释。理解过去是为了更好地理解当下,对过去的基于大数据的分析能够将现在的“未知”变成“已知”,理解当下存在的“看不见的手”,并予以反馈。
第二种是“现在—未来”层面,这更多的是基于对现状的解释以及对未来的预判。这个层面侧重于对未来世界的保守性理解,通过对现在阶段的大数据分析,使人们能够更早地对未来的发展可能做出预测,以应对未来可能发生的各种情况。第三种是与第二种相对应的,它也可以被称作是引领性的层面。如果说第二层面是基于解释的,那么这个层面则是基于改造的。它预设了一个更高导向的未来局面,通过大数据的分析模拟,以反向的形式思考改变现状的可能性、合理性及可操作性。也可以把这三种层面理解成“历史型分析”、“科学型分析”、“实践型分析”。
历史型分析和科学型分析都是较侧重对数据背后的主体行为状态做出“解释”,因此属于解释性的数据分析,而因为大数据放弃对因果性的所谓不实幻想,因此追踪的“实时性”成为其分析所必须保证的要素。数据在数量上的“多”和在时间上的“快”进而成为这两种大数据分析的隐性前提。这就催使基于历史型和科学型大数据需求的机构必须长期侧重性地在技术上扩展功能,数据搜集的广泛与新鲜性稍有差池,则往往导致相关性方面的误判。随着科学技术和信息在大众间的普遍推进与传播,一方面使得群体较以往更具有理性意志,另一方面,随着信息获得途径的多样化和差异化,非理性意志也增加了前所未有的复杂性,因此单纯假定“人是理性动物”为前提,则会导致对数据分析的巨大偏离。这也解释了为什么因果性会在大数据时代下失效。
大数据是跟随科学技术的发展而来的,它并不单一倾向地服务于数据使用者,科学技术带来的数据共享一旦生成,便不可避免地(或早或晚)对所有对象敞开,这些信息终会以各种形式与传统的观念、行为状态、行为趋势发生理解性碰撞。“大数据最大的价值在于它们可以和其他企业数据结合起来。将大数据里找出的东西放到更大的处理环境中,新的洞察的数量和质量都会呈指数级增长。”[5]然而大数据不是悬挂在群体行为之外的“超元素”,它本身就是这个时代的群体行为的元素之一。从这个意义上讲,大数据一方面为呈现“看不见的手”提供了巨大的技术便利,一方面也因为自身的“加盟”,使前者更加扑朔迷离。所以大数据并不是一劳永逸从底层解决问题的法宝,它是具有“瘾性”的技术,大数据一旦介入,必然与时间性发生捆绑。
实践型分析是引领性的,它基于未来的目的而试图改造现在。这种大数据类型更适用于对未来项目的规划,未来是发展的目标,现在是这个目标的试验场和模拟场。这种引领和改造仍然离不开前两种解释型分析的巨大后备,但它不是单纯的解释型分析,而是对现有状态和局面的挑战。任何挑战都意味着一定程度的风险,因此即便大数据极力保证数据的大量与迅速及时,但仍没有绝对的力量保证这种数据为未来提供安全的预测。所以实践型分析是建立在引领改造和实时数据反馈调控的二元互动基础上的。大数据在这里并不能拥有过度的乐观预想,因为“历史的狡黠”可能随时会出场。
从空间上的关系上看,大数据也表现出一些明显的特性,大致可以分为文化空间、地理空间和部门空间三个层面。首先是文化空间,当今时代是文化的趋同与多样化并举的时代,一方面随着资本市场的逻辑,文化借由经济行为导致了相当大程度的趋同;另外一方面,随着这种趋同的不断加深,无论从政治的角度,还是经济抑或文化自身的角度来说,文化的多样性需求正在日益彰显。而大数据必须回应这个问题。大数据是基于“量”分析“质”的技术,而文化的多样性空间首先就是“质”的差异化。因此,在一个文化空间内部的数据分析结果,并不逻辑地导致在另一文化空间里依旧保持效力。比如,在本土文化市场的成功经验,并不必然可以推广到异文化领域而获得成功。
地理空间的意思是从地缘的角度理解大数据行为。在今天,物质生产、文化生产依然没有完全跳出物理地理的界限,即便是跨地理布局的大型企业和机构也依然面临“扎根落地”的实际现实。地缘空间在很大程度上决定着企业机构的生产行为,以及群体的接受、消费行为。以文化创意产业为例,内陆与沿海,北方与南方,城市与乡村,城区与城郊,都有着不同的地理构架,形成各自不同的梯度型分布,因此大数据必须考虑这些方面的因素,也正因此,也催使大数据本身必须“照顾”这种差异而形成自身数据的不同调配和高阶应用。所谓高阶应用,是指对大数据的大数据分析,也意味着大数据并不是单层面的“对底层负责”,必须形成上下兼顾的拓扑分析能力。
部门空间是指人们在物质—信息生产方面形成的各种相关部门之间的空间关系。具体有政府部门、企业机构、民间组织和终端群体等方面。这几个方面之间形成了服务与调控、引导与制约、运营与反馈等复杂的交互关系。如果说大数据技术是从生物体的细胞层面开展信息的捕获与分析,那么部门空间所展示的,则是属于生物体的器官与组织层面的。尽管大数据的分析能够超越甚至取代后者对某些数据的分析能力,但是作为调控、引导、制约的外来信号,则是大数据需要谨慎面对的参数和元素,而不是其分析得到的结果。虽然大数据技术的优质特性能够推动和影响这些参数的结果,但是它不是导致它们的唯一力量。
三、数据理性与人的创意—体验回归
力学范式转换与技术革命开启了人的体力解放,但同时大工业的分工也导致了人与人的疏离,而另外一方面的集中生产也导致了人日益依附于生产机器本身。同样,信息技术的革命为人的智力解放提供了更大的可能。在今天,大数据成为这个时代的关键词之一,对细微数据的发掘和对海量数据的收集整合,因为迅速、及时、有力而超过了以往任何一个时代。过去在群体性行为的模拟判断,因为技术上的壁垒而呈现的“看不见的手”,正在透过大数据的光晕呈现出各种维度的拓扑影像。但是也应当看到,大数据依然是技术,作为技术之一种,它背后依然是作为主体的人。
作为主体的人,一方面因为大数据技术而变得更加理性,一方面也由于大数据自身的多维度和多样化传播而显现出更大的非理性。单纯看到大数据理性,只是问题的一方面,技术乐观和数据理性是对信息处理手段的关照,但是大数据依然是人创造的技术,而“我们心智的非完美性,一定会渗透到我们的一切技术之中,正如它渗透到我们的理论中一样”[6];另一方面,由于人永远是具有价值取向、价值判断和价值诉求的物种,因此大数据最终还是面向人,人是大数据的“终极关怀”。大数据体现着人的意向性,因此它不是可以孤立看待的自动机和永动机。它是人的手段之一,不是目的,它是呈现人通过自身的体力和脑力无法呈现的“看不见的手”的工具,也正因如此,它也增加了许多“看不见”的可能性。
大数据是在运算规则之下运行的,而运算规则本身则取决于人的设计,甚至对于物质生产和信息生产的“游戏规则”的创造,依然是人的任务。后者需要凭借人的“创意”。在物质生产和文化生产方面,大数据本身不提供这种“创造性”。也正是大数据呈现了许多看不见的景象、状态与趋势,使得人知晓在哪些方面、哪些领域,可以和怎样激活新的创意。创意本身不可能通过大数据来独自完成操作。创意不仅关怀大数据所体现的海量、高速、价值和体验,它还勾连着更多隐性的相互关系。创意是技术与审美的结合,单就后者而言,它离不开作为主体的人的体验,而不是数据背后的相关性理性分析。
在面向未来的实践型大数据分析层面,大数据依然需要最底层的反复“产业试错”、“行为试错”和“关系试错”。大数据的强势优势在于,当形成了海量的数据资料以后,它能够迅速及时地得到试错之后的正负反馈,在“有”或“无”,“多”或“少”,“程度”和“维度”,“层次”和“结构”等方面给出结果。但是如何试错方面,引领什么样的生活价值和生活体验方面,人依然具有第一发言权。尤其对于今天蓬勃发展的文化产业来说,文化背后承载的价值诉求、审美关怀、经济效果,仍应当以人的体验为本。
还有更重要的一个方面,就是随着大数据技术的发展,越来越多的新兴产业类型开始生发,造成了新的轮番效应和凝结效应。但是未来的发展在另外的意义上说,更有可能在传统的边缘绽放出更大的生命力。因此大数据的任务也应在边缘上发挥自己的效力。作为一种数据驱动的革新型技术。发现边缘、监控边缘,激活新的生长点,也是大数据技术的一项厚重的任务。
大数据是分析的,也是纠错的,在这个意义上,它既是解释世界的,也是改变世界的;同时,大数据既是反馈的,也是启发的,在这个意义上说,它既是服务的手段,也是面向人的创造性目的的。大数据使人看到了以往看不到的景象,也增添了这个世界的复杂性。这其实是历史的伟大趋势,大数据为人们带来了技术理性的乐观情绪,但并不是万能的,它是一种驱动的技术力量,使人们能够在新兴的时空维度,去革新人的生产方式和生活方式。而目的、价值、体验和创意,依然是人自身的任务。
[1]李井奎.亚当·斯密与“看不见的手”——一场经济思想史的知识考古[J].社会科学战线,2011(2).
[2]林金忠.从“看不见的手”到“市场神话”[J].经济学家,2012(7).
[3]城田真琴.大数据的冲击[M].北京:人民邮电出版社,2013:3.
[4]迈尔-舍恩伯格,库克耶.大数据时代[M].杭州:浙江人民出版社,2013.
[5]弗兰克斯.驾驭大数据[M].北京:人民邮电出版社,2013:19.
[6]莱文森.思想无羁[M].南京大学出版社,2003:125.