APP下载

基于大数据知识表征的特质

2017-01-27苏玉娟

哲学分析 2017年2期
关键词:客观性范式语境

苏玉娟

基于大数据知识表征的特质

苏玉娟

基于大数据的知识表征不仅凸显知识的精神特质,而且凸显知识生产特质、实践特质和规范特质。多元的大数据主体使知识更加复杂,数据的主体多元性在客观上要求数据共享,而实现大数据共享是一个复杂的过程;数据的主体多元性使大数据仓库的客观性越来越复杂。关联的网状大数据彰显知识的客观性,基于大数据知识表征的客观性不仅来源于关联的大数据形态,而且来源于经验世界的大数据、主体与经验世界关联的数据、主体间数据的客观实在。强语境依赖的大数据彰显知识的相对性,基于大数据知识表征依赖大数据产生的时空语境,基于大数据知识应用具有应用空间的相对性。大数据知识的实践应用彰显知识的社会规范性,应遵循客观性、公有性和社会性及技术层面、组织层面的制度规范。基于大数据的知识表征不仅彰显大数据工具的个性特征,而且具有普遍知识的本质特征,是对人本主义和外在主义知识论的超越,是关联分析和因果分析的辩证统一,并具有实践意义。

大数据;知识表征;数据关联;复杂性;客观性;相对性;社会规范性

知识是内在主义主观与外在主义客观知识定义的集合,内在主义知识主要关注点是人的认知过程及其特质;外在主义认为知识是客观的,强调客观性结果。可以说,知识是证实了的真的信念,并被客观展现的结果。表征是指在实物不在场的情况下指代这一实物的任何符号或符号集。这里的符号或代码既可以是客观的物理符号,也可以是主观的心理意象,既可以是静态的事物,也可以是动态的机制。知识的表征就是用这些东西代表知识。*王建安、叶德营:《知识分类与知识表征——评赖尔的知识分类与围绕它的争论》,载《自然辩证法通讯》2010年第4期。从表征的方式看,知识可分为陈述性知识和程序性知识,陈述性知识回答“是什么”“为什么”“怎么样”的问题,程序性知识解决“怎么做”的问题。组织理论家罗素·艾可夫勾勒关于知识的三角形金字塔,最下层是数据,依次为信息、知识、理解和智慧。这样,知识表征彰显知识被生产和应用的整个过程。知识研究的对象是经验世界,经验世界包括“自然事实、科学事实和现象学事实,形成日常知识、科学知识和哲学知识”*马克斯·舍勒:《知识社会学问题》,艾彦译,北京:北京联合出版公司2014年版,第11页。。大数据不仅可以实现对自然事实、科学事实和现象学事实等经验世界的表征,而且可以实现对网络世界虚拟现实痕迹的表征。因而基于大数据的知识表征包括对自然知识、科学知识、现象学知识、网络知识的表征,是更广意义上的知识表征。基于大数据的知识表征不仅凸显知识的精神特质,而且凸显知识生产特质、实践特质和规范特质等。

一、 多元的大数据主体使知识更加复杂

吉姆·格雷认为科学形成四个关键性科学范式,即经验范式、理论范式、计算范式和数据挖掘范式。不同范式折射出知识的不同特质。经验范式产生于几千年前,以个体观察和实验为依据,逻辑经验主义强调一切综合命题都以经验为基础,并提出可证实性、可检验性和可确认性原则,由于本身证实原则的不可靠性、不普遍性等原因,以及不能对经验知识进行满意的描述而受到质疑。理论范式产生于几百年前,以建模和归纳为基础,归纳主义认为知识是从观察和实验得来的经验事实中推导出来的,但是有限不能证明无限,归纳不是一个严密的逻辑形式推理,作为知识的生产范式存在缺陷。计算范式产生于几十年前,以模拟复杂现象并进行计算为基础,计算主义认为一切事物的变换都是计算,物理理论永远是真实物理世界的一种简化和理想化,这样物理世界是可计算的观念受到了质疑。数据范式以数据挖掘为基础并联合理论、实验和模拟为一体的数据密集计算,数据范式包括了事物发展的经验大数据,并运用计算反映出事物之间的相关性,形成理论知识。不同范式折射出知识来源的不同途径和不同特质。从人类认识范围看,有自在世界、经验世界、表象世界和网络世界。自在世界是在经验世界之前就存在的世界,是自在的客观的外在世界。表象世界是自在世界的再现或者我们的幻觉或梦境。经验世界是自在世界通过先验自我的意向性活动,把表象世界与自在世界统一为一体的世界。网络世界是人类思维和行为在网络空间的再现。基于大数据的知识表征,研究的是经验世界和网络世界。从知识演进的范式看,知识的主体从一元走向多元,多主体的协同成为知识表征最显著的特征,并使知识表征越来越复杂。

在传统的经验、理论和计算范式中,知识主体相对比较单一,知识表征主要在认识论层面,研究知识是如何被确证的,并与客观相符合。在经验范式阶段,知识主体主要是哲学家,内在主义关注信念、真和证实三个要素。如柏拉图认为知识是被证明是真实的信念。在理论范式阶段,知识主体从哲学家扩展到科学家群体,知识来源于科学家或者哲学家的理性构建。笛卡尔被认为是近代科学的“始祖”,也是一个理性主义者,他认为理性比感官的感受更可靠,知识是思维本身的产物。在计算范式阶段,知识主体由科学共同体进一步扩展到企业,知识来源于计算机对知识主体数据库中结构性数据进行处理并获得知识,数据库多为知识主体所拥有,数据库之间共享少。根据目的的不同,知识既包括认识论层面的知识生产,也包括实践层面的知识应用。科学共同体利用计算范式探索未知世界,形成认识论层面的知识。企业通过对自己所拥有的数据库中数据的分析挖掘,形成为企业服务的知识。所以,在计算范式中,知识管理是企业管理很重要的内容,知识表征开始从认识层面走向实践层面。

从知识主体的演进历程看,基于大数据知识表征的知识主体从哲学家扩展到科学家、企业、政府和民众,他们既是大数据知识的生产者,也是数据知识的使用者,知识主体的多元性使知识表征走向复杂化。

首先,数据的主体多元性客观要求数据共享,而实现大数据共享是一个复杂的过程。传统的小数据时代,各知识主体都是依托自己的经验、理论、计算来生产知识、分享知识和利用知识,知识生产与应用都是某些人的事情。大数据时代,知识来源于不同主体所拥有的大数据形成的大数据仓库,大数据仓库既包括结构性数据,也包括图片、音像等非结构性数据。大数据仓库的完备程度由大数据知识表征的客观程度决定,而大数据仓库的完备程度由各知识主体大数据共享程度决定。目前,从我国大数据共享的现实情况看,“不愿共享开放”“不敢共享开放”“不会共享开放”的情况较为普遍。特别是我国各级政府、公共机构汇聚了存量大、质量好、增长速度快、与社会公众关系密切的海量数据资源,除了部分自用和信息公开外,大部分没有充分发挥数据资源作为“生产要素、无形资产和社会财富”的应有作用,这不仅是认识方面的问题,而且是制度和规范等方面的问题。《关于促进大数据发展行动纲要》的核心就是要推动数据资源共享开放,解决大数据共享难的问题。

其次,数据的主体多元性使大数据仓库的客观性越来越复杂,这影响了大数据知识表征的客观性。知识是对经验世界运行规律的认识,无论我们是直观经验世界,还是通过理论和计算范式认识经验世界,都是建立在对经验世界客观实在的认识基础上。小数据时代,数据库规模小,多是采集经验世界运行数据并在分析挖掘相关数据基础上形成知识,这些数据基本能够客观反映事物的客观实在,因而具有可信性,依靠其产生的知识具有客观实在性。大数据依靠的不是随机样本,而是全部样本。大数据仓库的数据来源于网络、政府数据、基于传感器的镜像数据,而网络数据特别是社交网络中的数据,有些是虚假的。这些虚假大数据会影响大数据仓库中大数据的客观性,进而影响由此产生的知识的客观性。“我们应该对依赖有缺陷的大数据可能给公共服务及公共政策造成的影响有所警惕。”*苗东升:《从科学转型演化看大数据》,载《首都师范大学学报》2014年第5期。因此,在大数据时代,解决大数据虚假和缺陷问题非常必要,我们需要提高科学共同体、政府、企业、民众等不同主体的社会责任感,提高政府对虚假大数据制造者的惩罚力度也是非常必要的。“政府必须在理念层面、技术层面、保障层面积极回应大数据时代提出的新要求。”*任志锋、陶立业:《论大数据背景下的政府“循数”治理》,载《理论探索》2014年第6期。

二、 关联的网状大数据彰显知识的客观性

知识很重要的一个元素就是真,能够反映客观实在,即客观性。知识的客观性是由两个方面确定的,一个方面是认识对象的客观性;另一个方面是认识对象与感知主体之间的客观联系。只有满足这两个条件,知识的客观性才能被表征。客观性彰显知识主体对经验世界的理性认识,是主观认识与经验世界的符合。

在传统的经验、理论和计算范式中,设定主体与客体二元分立,秉持“主观理性”的个体视自身为知识生产的绝对主体,而将自我以外的他者视为知识的对象或客体,知识的客观性来自主体对客体的概括与反映。在不同的认识阶段,客观性表征的形态是不同的。经验范式阶段,知识建立在主体对传统经验的归纳基础上,主体通过对经验的理论概括形成知识,知识是否客观关键看理论与经验世界之间的契合度。理论范式阶段,主体通过理论建构形成对经验世界的客观认识,理论的客观性需要通过在具体事物中的演绎来验证。计算范式来源于对经验世界的模拟以建构理论,反映客观规律,理论与现实的契合度需要通过计算工具来实现。所以,无论知识来源于经验、理论或计算,知识的客观性都是通过主客体间性表征出来的,知识反映主体对客体的认识水平。

大数据时代,主体也产生大数据,可以说没有旁观者,都是参与者,大数据不仅成为联结主体与客体的桥梁,而且正在消解主客体之间的二元对立。基于大数据知识表征的客观性不仅来源于关联的大数据形态,而且来源于经验世界的大数据、主体与经验世界关联的数据、主体间数据的客观实在。

第一,经验世界的客观性表征为间接的数据间性。这是借助大数据工具实现对经验世界的间接表征。产生知识的大数据来源于网络、政府数据和基于传感器的镜像数据,这些大数据不仅包括结构性数据而且包括图片、音像等非结构性数据,大数据呈现爆发式增长,这些大数据反映了经验世界的镜像存在,这为基于大数据知识表征提供了客观基础。正是数据间的相关关系,彰显了经验世界的客观存在。

第二,主体与经验世界关系的客观性表征为主体对经验世界大数据存储、分析、挖掘、应用等一系列过程的客观分析。“数据挖掘一方面发现了隐藏在数据表面下的历史规律,另一方面又可以对未来进行预测,它具有了科学规律的要求和特征。”*黄欣荣:《大数据对科学认识论的发展》,载《自然辩证法研究》2014年第9期。虽然大数据正在消解主体与客体之间的界线,但是,主体与客体还是有区别的。大数据时代,知识表征的主体从科学家扩展到企业、政府和民众,不同主体对大数据的客观性认知程度影响其知识表征的程度。主体对经验世界大数据的认知是客观存在的。不同主体对大数据的客观性认知包括三个方面,即具有大数据可以产生知识的信念,相信这些知识能够反映经验世界的真实性,这些知识并能为实践提供服务。目前,不同主体对大数据的客观性认知不断提升。

第三,主体间的客观性表征为科学共同体、政府、企业和民众等不同主体间大数据的内在关联,而且是知识生产与应用客观性彰显的重要方面。在传统的经验、理论和计算阶段,知识主体不管是哲学家、科学家或科学共同体,主体间关系都是微弱的。由于基于大数据知识表征的大数据来源于政府、企业、民众,只有形成跨越主体边界大数据仓库,大数据挖掘形成的知识才具有客观性,即全样本的大数据分析彰显知识表征的客观性。所以,基于大数据知识表征的客观性还表现在科学共同体、政府、企业、民众之间数据关联的客观存在,这种关系的客观存在表征为不同主体所拥有的大数据互联互通,特别是公共数据的互联互通对创造公共知识非常重要。

第四,知识整合的客观性表征为不同类型数据的网状关联。传统范式下,知识大厦是由可以实证地观察和检验的语句构筑成的。知识遵从物理的叠加原理,即具有还原性。随着大数据时代的到来,数据不断转换成有价值的信息,信息再提炼加工成相应的知识,这是大数据时代知识形成的完整链条。目前,由于大数据的巨量增长,由大数据产生的信息碎片化越来越严重,多数信息是对大数据实在的现象描述而非逻辑和系统的知识体系。这个问题的关键就是人们缺乏将碎片信息转化成系统化知识这个关键环节,并形成系统的、联系的和理论的知识体系,以指导实践。大数据时代,“知识不是对照自然的一面镜子,而是一种相互联系的网络”*戴维·温伯格:《知识的边界》,胡泳、高美译,太原:山西人民出版社2015年版,第281页。。“通过网络数据,大量的个人的或很小组织的真实行为通过计算机以数据形式被记录下来,这些数据为人类行为研究提供了极其丰富的可靠信息,避免了研究者认知的偏见、感知的误差和框架的歧义。”*D. J. Watts, “A Twenty-First Century Science”, Nature, Vol.2, 2007, p.77.数据的原子因为共同分享元数据而相互钩在了一起。大数据能够根据不同目的实现结构性和非结构性数据之间的关联整合,形成基于大数据语境之间的关联分析,提高不同语境中知识之间的整合力。一方面,不同语境中事物之间的关联性彰显为不同类型数据之间的多种关联性,也就是说同一数据根据使用目的不同,会同其他不同的数据形成不同的关联。这样,由数据形成的网状关联,经过分析、挖掘会形成网状的知识结构,实现知识的网状化发展,使知识由分隔走向整合。这样,知识大厦并不遵从还原论,而是具有复杂的网状的交叉关系。大数据因在科学共同体、政府、企业和民众之间的可通约性而具有共享性,这种共享性有助于不同学科、不同领域知识之间的交叉融合,实现不同学科的资源共享。

三、 强语境所依赖的大数据彰显知识的相对性

知识无论产生于经验范式、理论范式、计算范式还是数据挖掘范式,都对相应语境有一定的依赖性。随着范式的不断演进,知识对相应语境的依赖度不断上升。从经验范式看,由于知识来源于对大量经验事实的归纳,由归纳形成的知识的应用语境与知识形成的语境具有同质性。如天鹅都是白色的,仅限于对中国境内东北、内蒙古等地天鹅的归纳,这个归纳结果不适用于澳大利亚和新西兰等地,原因在于这些地区有黑天鹅。从理论范式看,理论构建不仅是对经验事实的归纳,而且具有高度的主观构建的特征,主体所认识的经验世界具有语境依赖性,这样,理论知识的形成也具有语境依赖性。如牛顿的经典力学只适用于对宏观世界的分析,而爱因斯坦相对论适用于宏观世界。从计算范式看,其所有计算资源多是结构性数据并被集中在一个物理系统之内,结构性数据来源决定了计算所产生的知识所依赖的语境。如对流动人口的治理,流动人口数据库是该理论形成和被应用的语境。

大数据时代,大数据呈现主体多元、数量巨大、类型多样、处理速度快、真实有效、立体时空感强、价值低密度性等特征。大数据产生的知识不仅反映客观实在,关键在于社会应用,这是大数据知识最大的价值所在。目前,大数据已被广泛应用于环境保护、公共安全等政府治理、社会治理、国家治理和企业治理领域。基于大数据的知识生产和应用具有强语境依赖性和相对性。

第一,基于大数据的知识表征依赖大数据产生的时空语境。知识来源于对客观实在的理论概括。大数据时代,客观实在依托时空镜像中的大数据。大数据的巨量特征使得即便研究问题相同,不同时空语境呈现出的大数据形态也是截然不同的。我们要分析城市公路交通发展的规律性,不同城市由于居住人口、机动车辆等差距较大,大数据镜像依赖的语境因素不同,因而表征出来的知识是不同的。“牛顿运动定律、欧姆定律等具有广泛的适用性,而大数据所发现的规律一般都具有时效性和地域性的特点。沃尔玛发现飓风与蛋挞的关系,仅仅适用于美国。”*汪大白、徐飞:《大数据:科学方法的新变革》,载《自然辩证法研究》2016年第1期。因此,我们分析交通发展的规律性不仅需要分析挖掘与此相关的汽车等交通工具运行的表象特征,同时还需要分析这种表象存在的客观原因,形成时空语境中的客观实在—大数据镜像—理论知识—实践服务的知识链条。

第二,基于大数据的知识应用具有应用空间的相对性。从知识生产演化进程看,知识对语境的依赖性越来越强,知识依赖的经验事实涵盖从个体普遍的经验到依赖计算和大数据采集的经验实在。大数据虽然呈现巨量化增长,但是,对于确定的研究目标而言,其大数据可采集的时空边界是相对有限的,其产生知识的应用范围也局限于相应的语境。这种相对性表现在不同时空里产生的知识是有区别的,相应知识的应用也具有相对性。

四、 大数据的实践应用彰显知识的社会规范性

“科学的精神特质指约束科学家的有情感色彩的价值观和规范的综合体。”*R. K. 默顿:《科学社会学》,鲁旭东、林聚任译,北京:商务印书馆2010年版,第363页。科学的精神特质某种程度上强调对知识生产主体的价值指引和行为规范的约束。默顿认为科学的精神特质包括普遍主义、公有性、无私利性和有组织的怀疑态度。作为爱丁堡学派的代表之一,大卫·布鲁尔认为科学知识应当遵循因果关系、客观公正、对称性以及反身性四个信条。他们主要研究知识生产过程中精神层面的规范性。社会规范指人们的社会行为和社会活动的规矩和准则。根据规范对人们的控制程度的不同,可以分为价值规范、制度规范(技术规范)等。价值规范是一种内化了的行为规则,制度规范是社会组织对其成员的要求和准则。

随着知识生产主体从科学领域走向大众,知识表征所依赖的客观实在从直接经验向理论、计算和数据等间接经验的转变,知识生产与应用的社会规范性越来越重要。在经验范式阶段,当时科学还没有从哲学中分离出来,生产知识的主体是哲学家,知识生产和知识应用多是个人行为,因而还没有形成真正意义上的社会规范。在理论范式阶段,科学家已成为专门的职业,理论建构建立在科学共同体对科学理论的思想把握上,该阶段科学家的活动更多遵循的是价值层面的规范性,如默顿所言的普遍主义、公有性、无私利性和有组织的怀疑态度,库恩的范式结构等。在计算范式阶段,知识生产主体包括科学共同体、企业等,计算数据多来源于组织内部的实验和经验的结构性数据,知识归属问题决定了知识生产者的行为规范。所以,该阶段知识生产主体多是遵循价值层面、组织内部的制度规范,属于组织内部的知识应为组织保密,为公共利益而进行的知识生产应遵循公共的价值规范和制度规范。

随着大数据时代的到来,基于大数据知识表征的主体不仅仅局限于科学家,知识表征不仅仅局限于知识的认识过程,还包括对知识的应用过程。可以说,基于大数据知识表征的社会规范指约束知识生产和应用主体的价值规范和制度规范的综合体,体现基于大数据知识表征的本质特征。

首先,从价值规范看,基于大数据的知识生产和应用主体应遵循客观性、公有性和社会性等。由于大数据来源的复杂性,特别是巨量的网络大数据的产生,大数据的真实性影响知识表征的客观性。所以,基于大数据的知识要求科学共同体、企业、政府和民众等产生的大数据无论是图片、评论或者镜像数据,都具有真实性,是事物发展过程的客观再现,应消除数据虚假、数据主观等因素。公有性要求对于涉及国家治理、政府治理和社会治理等公共领域的大数据,不同公共数据拥有主体应树立公共价值理念,促进公共大数据仓库的形成,为公共利益服务。目前,数据分隔、数据孤岛等问题比较突出,关键在于不同主体对大数据公有性价值认识不足。同时,不同主体应具有社会性,即不同主体不但具有将大数据融入社会大数据仓库的义务,而且具有相应的社会责任感,特别是对于服务于公共领域的政府来讲,不仅应提供由大数据产生的碎片化信息,而且应提供系统性的知识体系,为大数据知识服务社会提供知识支撑。

其次,从制度规范看,基于大数据的知识生产和应用主体应遵循大数据的技术层面、组织层面的制度规范。目前,由于技术规范体系建设的滞后性,使很多大数据融入公共大数据仓库比较困难。就技术规范来讲,不同领域大数据如何整合需要建立相应的技术规范体系。“由于政府利用数据意识薄弱,相关制度创新不足和数据分析能力欠缺等原因,大数据的有用性及数据驱动力不足。”*苏玉娟:《政府数据治理的五重系统特性探讨》,载《理论探索》2016年第2期。组织层面的制度规范主要从制度层面规范不同主体的行为。《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》提出,要实施国家大数据战略,为大数据知识表征提供了制度规范的空间。“对民众来说, 大数据带来的最现实问题是个人隐私的泄漏与保护问题。”*黄欣荣:《大数据哲学研究的背景、现状与路径》,载《哲学动态》2015年第7期。制度规范应解决民众大数据与个人隐私之间的边界问题,既要充分利用民众产生的大数据,又要保护其自身利益。

五、 进一步探讨

基于大数据知识表征的本质特质体现在知识生产与应用的复杂性、客观性、相对性和社会规范性等方面,彰显大数据存储量大、数据类型繁多、处理速度快、价值密度低等特征。为了更好地发挥基于大数据知识的功能,我们需要思考以下几个方面的问题。

(一) 基于大数据知识表征具有普遍知识的本质特征

知识作为人类对经验世界的系统认识,是个体隐性知识向社会显性知识不断转换的过程。知识表征过程是人类发挥主观能动性认识经验世界并形成客观性结果的过程。因此,知识的本质特征是主体性、客观性、系统性。基于大数据的知识具有知识的本质特征。首先,基于大数据的知识生产与应用离不开科学家、企业、政府和民众等主体提供的大数据仓库,同时也离不开这些主体对大数据挖掘形成的信息的理性分析,否则,数据只可能是碎片化信息,而不可能上升到知识。其次,基于大数据知识表征的客观性来源于数据之间的关联,大数据不仅是事物客观运动的反映,同时也是历史经验的客观再现。所以,客观性是基于大数据知识表征的最基本特征。最后,基于大数据知识表征的系统性来源于对大数据挖掘所形成的碎片化信息的理论分析。大数据挖掘、可视化形成的文字、图片等表征并不是知识的表征,仅是大数据形成信息的表征,还需要人类根据相应语境及理论概括形成系统化的知识体系。因此,基于大数据知识表征具有知识的本质特征,只是借助大数据工具彰显知识的这些本质特征而已。

(二) 基于大数据知识表征是对内在主义和外在主义知识论的超越

内在主义与外在主义的区别在于知识的确证是否是可以直接把握的,知识确证的标准是否仅仅是信念的内在状态。也就是说内在主义强调人的主观能动性的发挥,知识确证及其确证的标准都来源于主体的经验及其信念,即知识是被主观证实了的真的信念。外在主义强调知识表征的客观性结果,即知识的确证及其标准与外部世界相联系。基于大数据知识表征是借助大数据工具,使不同主体具有确信大数据分析挖掘提炼后形成的知识的信念。可见,基于大数据知识不仅强调个体的广泛参与性和主观能动性,而且强调主体间关联性,正是主体间的数据关联,知识才得以产生。所以,基于大数据知识表征是对内在主义的超越。

传统的外在主义强调借助数学、经验、行为、计算等工具让主体形成对客观分析的确证性或心理方面的可信赖性,并认为这一信念是真的。基于大数据的知识表征过程借助大数据工具对客观事物的行为进行概率及行动轨迹的分析,形成主体对客体运行规律的确证性,并使主体相信这个分析结果形成的信念是真的。因而,基于大数据的知识表征不仅借助大数据工具,而且也借助概率、客观事物的行为、经验等工具,因而它超越了仅依靠某种外在工具的外在主义,而是在发挥主观能动性并综合运用多种工具基础上形成的知识。

(三) 基于大数据知识表征是关联分析和因果分析的辩证统一

传统意义上知识的来源多是建立在因果分析的基础上。英国经验论者从培根一直到洛克都把因果规律看作是知识产生必然的条件。发现相关性是因,做出决策是果,相关性是一种弱因果性,因果性是一种强相关性。基于大数据知识表征是借助大数据工具分析事物之间的关联性,呈现事物运行的规律性。其实从大数据分析挖掘所得到的是事物之间关联的信息,要使关联信息上升到知识,还需要对其进行因果分析,提出理论性的知识体系,而不是碎片化的信息。如沃尔玛通过对人们购物的大数据分析,发现尿布与啤酒销量之间具有相关性,这种相关性分析结果仅仅是相关性信息,并不能构成知识。我们需要进一步进行因果分析,发现该区域好多消费者多是男性,他们在给孩子买尿布时不忘犒劳下自己捎带买上啤酒。如果没有因果分析,单纯靠数据挖掘形成的相关信息就做出决断,不考虑相应的生活语境和因果关系,容易产生碎片化信息,而这种信息不具有理论性和可信性,因而不能作为知识。因此,基于大数据的知识表征是关联分析和因果分析的辩证统一。仅依靠关联分析得到的仅是碎片化的信息或关联信息,而不是知识。要想使碎片化信息上升为知识,必须进行因果性分析,才可能形成可信的知识,实现人类认识从感性到理性的升华。相关分析不能代替因果分析,人类对因果关系的渴求是永恒的,大数据表征知识也不例外。

(四) 基于大数据知识表征具有实践意义

知识是知与识、知与行的辩证统一。从泰勒斯到黑格尔的传统知识论者,重视对知与识的研究,认为求知是人类的本性,真理性的知识是主观认识与客观对象相符合的结果。

在当代西方哲学中,无论是强调“语言游戏”嵌入“生活形式”的维特根斯坦,还是倡导“以言行事”的奥斯汀,其共同点在于都是把知识奠基于人类的生存实践基础之上,实现知与行的辩证统一。人类的认识过程不仅包括感性到理性的飞跃,而且包括理性认识到实践的飞跃。知识的实践论是实现知识从精神到物质、从理性到现实的桥梁,是知识改造世界和检验理性认识的重要途径。当代美国新实用主义者罗蒂指出:“一个信念之真,是其使持此信念的人能够应付环境的功用问题,而不是其摹写实在本身的存在方式的问题。”*罗蒂:《后哲学文化》,黄勇译,上海:上海译文出版社1992年版,第1页。基于大数据的知识表征不仅重视对知识的认识论层面的研究,而且重视相应知识的实践应用。如对于尿布与啤酒的正相关销售,在实践层面指引沃尔玛将二者位置放在一起,为消费者提供方便。目前,政府、企业、民众等主体已从观念上认同基于大数据表征的知识,并将这些知识应用于企业治理、政府治理和社会治理等。这是基于大数据知识表征最大的实践意义,即用大数据知识解决企业、政府、社会等方面的治理问题。目前,《关于促进大数据发展行动纲要》从国家大数据发展战略全局的高度,提出了我国大数据发展的顶层设计,是指导我国未来大数据发展的纲领性文件,包括构建“国家基础信息资源体系”“国家宏观调控数据体系”“国家知识服务体系”等,将大数据知识应用于国家、社会、政府治理的方方面面。因此,大数据时代,基于大数据知识表征落脚点必然在于其实践功能。目前,我国的安全、环保、交通、反腐等治理都在利用大数据知识。大数据知识成为创新国家治理、政府治理和社会治理的重要利器,大数据知识的实践价值越来越得到政府、企业和民众的认可。

总之,大数据时代,我们紧要的任务是要将大数据知识表征出来,彰显大数据知识的特质。大数据知识表征的过程是科学共同体、政府、企业和民众共同参与的过程,是对关联的大数据存储、分析和挖掘彰显大数据知识客观性的过程,是大数据对相对语境依赖的过程,是大数据知识被社会应用的过程。

(责任编辑:肖志珂)

苏玉娟,中共山西省委党校理论研究室副研究员。

本文是国家社会科学基金重大项目“基于信息技术哲学的当代认识论研究”(项目编号:15ZDB019)的阶段性成果。

B80

A

2095-0047(2017)02-0116-11

猜你喜欢

客观性范式语境
创作与做梦:精神分析语境下的“植田调”解读
以写促读:构建群文阅读教学范式
范式空白:《莫失莫忘》的否定之维
宪法解释与实践客观性
孙惠芬乡土写作批评的六个范式
主题语境八:语言学习(1)
主题语境九:个人信息(1)
管窥西方“诗辩”发展史的四次范式转换
聚焦以能力立意的六种“客观性”函数问题
社会化知识及其客观性探析——兼议朗基诺的科学知识观