大数据知识的实现条件及其特征
2018-05-14苏玉娟
苏玉娟
〔摘要〕 对于知识来讲,其实现条件经过历史的发展过程,形成发现条件、确证条件和实践条件。对于大数据知识来讲,其发现条件主要包括历史、伦理、技术、认知、语言等,确证条件主要包括信念、真、确证、因果分析等,实践条件则主要包括社会需要、社会支撑、大数据知识价值的彰显等。大数据知识的实现条件具有社会建构性、普遍适用性、实现特殊性,并彰显大数据知识的价值多元性和多学科性。
〔关键词〕 大数据知识;发现条件;确证条件;实践条件;特征
〔中图分类号〕TP311.1 〔文献标识码〕A 〔文章编号〕1009-1203(2018)06-0110-04
亚里士多德在《形而上学》一书开头说道:“求知是人的本性。”荀子说:“凡以知,人之性也。可以知之,物之理也。”柏拉图试图对许多关于知识的概念进行归纳,认为知识具有三个基本要素:真、信念、确证,即知识是被证实的真的信念。近代社会,“知识就是力量”彰显知识在人类进步与社会发展中的重要作用。现代社会,知识成为最难获得或最难替代的生产要素,并成为一种经济形态。大数据时代,人们通过对大数据的存储、分析、挖掘、可视化等研究后发现,大数据中隐含着知识,我们把这种知识称为大数据知识。从知识发现的范式看,相对于以实验为主的经验范式、以模型为主的理论范式和以模拟为主的计算范式,大数据知识来源于数据驱动的第四范式。正是由于知识定义、性质、来源、范围、获得手段、效力的不斷变革,知识论研究从传统本体论和认识论走向生存实践论、德性知识论。对于知识的研究,学者不仅应分析其发现条件,而且应分析其是否为真即确证条件,知识是否有效即实践条件。大数据知识作为当代知识新的形态,其实现条件也同样包括发现条件、确证条件和实践条件。
一、知识实现条件的历史演进
知识主要有理性知识和经验知识。对于理性知识来讲,如数学、逻辑学等知识多是通过理性推理获得。知识论更多地研究经验知识。不同时期,人们研究知识论的侧重点不同,对于知识实现条件的研究也因此是不同的。古代知识论主要是从本体论探讨知识是什么,满足什么样的条件就是知识,即知识的确证条件。知识就是被确证为真的信念,信念、真、确证成为知识构成的必备条件,否则,就不是知识,最多是知道或者理解。随着知识论向认识论转向,人的理性、判断、概念、推理等成为知识发现的重要条件。康德在综合经验论与理性论的基础上,提出先天综合判断如何可能的问题。信念只是潜在的知识,只有确证为真的信念才是知识。随着科学技术的发展,知识论研究从本体论、认知论向实践论转向,知识的社会功能逐渐引起学界的重视,特别是20世纪90年代后,知识经济兴起,许多学者更是从知识的经济功能研究知识的社会价值,知识实现条件也因此从发现条件扩展到确证条件和实践条件。
对于经验知识来讲,其发现条件主要包括以下四个方面。一是经验世界。这是人类发现知识的本体,没有认识的对象,也就没有知识。二是人类认知。人类通过认知发现客观事实背后的原理。人类如果没有认知,经验世界只是我们观察到的对象而已。三是语言表征。人们把发现的原理或知道的东西表征出来。四是技术。随着科学技术的发展,被遮蔽的知识可以通过实验、计算、模拟等方法和工具被人们发现,并在这些条件基础上形成对经验世界的理论性认知。实践中,对于具体的知识其依赖的发现条件可能是有区别的,但是,以上这四个方面都是很重要的。
对于经验知识来讲,通过语言表征形成的信念并不一定是知识,是需要确证的,这构成知识的确证条件。对于经验世界的知识来讲,其确证条件包括信念、真、证实、因果分析。目前的证实理论主要有基础主义、融贯论和外在主义等。基础主义认为,“知识的证实建立在某种基础之上,这一基础就是证实的初始前提。……融贯论认为,根本不需要什么基本的信念,因为所有的信念将由与其他信念的联系、将由它们之间的相互一致而得到证实。……外在主义认为,我们真正所必需的只是信念和外在事物之间的某种外在关系” 〔1 〕。不同的确证理论其所需要的确证条件是不同的:基础主义需要有一个初始前提;融贯论要求有不同信念,并且它们之间具有一致性;外在主义要求信念、外在事物以及它们之间的相符合性。
对于经验知识来讲,我们发现了知识,并确证其为真,接下来就是关于知识的实践问题。有些知识其价值可能体现在理论上的创新,解决了某个理论难题。随着知识社会化进程的加速,更多的经验知识不仅在于解释世界,而且在于改造世界,知识在实践层面的应用正是知识改造世界的过程。所以,对于知识来讲,其实践条件包括改造经验世界的客观需要、知识、实践工具和人的主体性的发挥等。只有客观需要,知识才有转化为实践的动力。知识本身作为理论化被确证为真的信念,是不能直接转化为实践的,需要借助于一定的工具,如技术、机器等。知识能否转化为社会价值,还有一个重要方面就是人的主体性的发挥;知识本身不具有社会实践的功能,关键在于人的主体性的发挥,将知识转化为社会变革的力量。
总之,知识论不仅研究知识的发现条件,还要研究其成为知识的确证条件和实践条件。只有弄清楚知识的发现条件、确证条件和实践条件,才能解决知识的发现、确证和实践问题。知识实现条件的不同层面是相互联系、辩证统一的。发现条件使知识成为可能,确证条件使信念成为知识,实践条件则使知识成为社会生产力。可以说,发现条件是基础,确证条件是中间纽带,如果信念不能确证为知识,其可能就是伪知识或者错误信念,其转换为社会实践就是不可能的或者是负面的,实践条件为实践结果提供支撑。知识作为社会生产力,我们需要对它的实现条件进行客观的分析。
二、大数据知识的实现条件
大数据时代,“正在兴起的这场轰轰烈烈的大数据技术革命即将引发一场彻底的哲学革命,必将带来世界观、认识论、方法论、价值观和伦理观诸多方面的深刻变革” 〔2 〕。大数据作为知识新的来源,直接来源于社会需要,其实现条件包括发现条件、确证条件和实践条件。
从发现条件看,大数据知识的发现条件包括大数据的全样本性、大数据技术、人类认知、伦理分析、语言表征等,这些条件涉及历史、伦理、技术、认知、语言等因素。大数据不是单纯的数据,而是对经验世界发展动态的镜像反映。大数据的全样本性包括经验世界动态的全方位全样本数据,如分析某市交通状况,我们需要该市指定时段内所有交通大数据,包括车流、人流、拥堵情况等。这是发现大数据知识最基础的大数据,这些大数据作为大数据知识发现的本体,离不开经验世界和网络世界的客观运动。也就是说,大数据知识的本体是经验世界和网络世界与大数据的联合体,经验世界和网络世界是基础,大数据是其镜像反映,没有经验世界,也就没有大数据。“伦理主要指天伦、人伦和人际关系的客观法则和他律性” 〔3 〕。由于大数据本身并不是经验世界和网络世界,有些人可能制造虚假数据,或者人为地制造数据孤岛,数据的不真实性直接影响大数据知识的可靠性。因此,对大数据进行伦理治理是非常必要的。我们主要是通过传感器、网络等手段收集大数据,并借助大数据技术发现其中的知识。也就是说,知识遮蔽在大数据中,我们需要借助大数据技术来解蔽,以发现其中的知识。大数据技术通过对大数据进行存储、分析、挖掘和可视化等,彰显大数据中的潜在知识。大数据彰显的可视化结果是大数据知识最重要的依据,但还有其他因素。虽然有些人认为要“让数据发声”“让数据说话”等,但大数据可视化结果只是将大数据中的潜在知识显示出来,这些结果是否可靠,需要人类通过认知进行分析和判断。原因在于大数据技术作为工具理性,只是通过机器学習减轻人类的脑力劳动,并不能代替人类思维,替人类作决定。对于可视化结果,需要人类认知结合传统小数据、经验、影响因素等,通过语言表征将大数据中包含的信念表征出来。实践证明,语言表证是非常必要的,否则可能只是潜在知识或者是隐性知识。另外,为发现大数据知识,大数据全样本、伦理治理、大数据技术、认知水平、语言表征等也都是必要的因素。只有依靠以上这些因素,大数据知识才可能被发现,这些因素构成大数据知识的发现条件。
从确证条件看,基于发现条件形成的信念是否是真的需要确证,以判断信念与经验世界的相符合性,并挖掘其中蕴含的原因。确证主要解决信念是否为真,即信念是否与经验世界相符合,反映经验世界的客观运行规律。传统意义上的确证,包括基础主义、融贯论和外在主义等。确证的条件包括信念、真、证实、因果分析及证据的真实性等。对于大数据知识来讲,其本身并没有预设性,因而没有一个最基础的信念作支撑,但存在一个大数据,即大数据中包含知识,大数据知识的确证与大数据知识的发现具有信念的一致性,即要研究大数据知识与外在世界的相符合性。所以说,其理论基础是基础主义、融贯论和外在主义的统一体。我们同样需要确证信念与经验世界的相符合性,如果信念不符合经验世界的运行规律,其不可能成为知识,也许只是错误的信念或虚假的信念。对于被确证为真的信念,我们还需要分析其因果性。有些专家认为,大数据主要反映客观世界的相关性,因而不需要研究其因果性。笔者不认同这种观点,原因在于,对于经验世界和网络世界来说,我们追求的是其客观性和普遍性,因果性分析是研究大数据知识客观性和普遍性的重要方法。大数据是经验世界和网络世界的镜像反映,虽然这种反映彰显更多的是相关性,但是作为对经验世界和网络世界反映的大数据知识,最终是要判断信念与经验世界的相符合性,而不是信念与大数据的相符合性。可见,我们必然需要对其中的因果性给予挖掘,并且确证过程的证据必须是真的和可靠的。可见,大数据知识的确证条件包括信念、真、确证、因果分析等。
从实践条件看,大数据知识能否转化为社会生产力,需要依靠一定的条件。首先,社会需要是第一位的。社会需要决定人类采集哪些方面的大数据。大数据平台建设、大数据采集、大数据分析与挖掘等需要很高的社会成本。如果没有社会需要,经验世界和网络世界中包含的大数据只能混乱地客观存在着,它的价值也很难被发现。其次,社会认知和社会支撑是很重要的。如政府、企业、社会组织等对大数据的认知和支撑是很重要的。再次,大数据知识的实践应用。大数据知识转化为精准预测、决策,并应用于经验世界和网络世界,是大数据知识实践的最终价值。如果大数据知识不能服务于经验世界和网络世界,而只是大数据而已或者只是大数据知识,那么人类发现大数据知识的积极性就不高,大数据知识也就没有太多的意义了。可见,大数据知识实践条件包括社会需要、社会支撑、大数据知识价值的彰显等。
三、大数据知识实现条件的特征
大数据时代,大数据知识的实现条件包括发现条件、确证条件和实践条件,分别用于解决大数据知识的发现问题、确证问题和实践应用问题。大数据知识既具有普遍知识的特征,也具有自身的显著特征。
第一,社会建构性。如果没有大数据技术,世界万物所包含的大数据就只能是凌乱地存在着,彼此之间的相关性也只能是凌乱地存在着。大数据技术使经验世界和网络世界运行所产生的大数据能够以即时数据的形式存储,并进行分析、挖掘和可视化,进而发现其所隐含的知识。大数据技术需要采集哪些大数据,是由社会需要所决定的,也就是说,社会建构的结果包括采集哪些大数据,建设怎样的大数据平台,需要哪些人才、资金等。另外,社会文化、制度、法律等方面的支撑也是社会建构的结果。大数据知识实现条件的社会建构性决定了大数据知识的选择性。只有被选择认为具有研究的必要性,才可能发现其中潜在的大数据知识,没有被选择的经验世界和网络世界并不能认为不包含知识,或者通过小数据也可以获得知识,而且一些经验世界,不具有大数据的4V特征,也没有必要通过大数据来发现知识。所以,对于社会建构,我们需要判断所研究的对象是否能够产生即时大数据,是否需要通过大数据技术来研究。
第二,普遍适用性。大数据知识像普遍知识一样,需要被表征、被确证和被实践应用,其实现条件是发现条件、确证条件和实践条件的统一。大数据知识虽然对其语境具有依赖性,但是它作为知识就具有知识最本质的特征,即对客观世界运行规律的真实反映。经验世界和网络世界每时每刻都在产生巨量的大数据。大数据知识的实现条件具有普遍适用性,即包括发现条件、确证条件和实践条件,而且不同条件所包含的内容同样也具有普遍适用性。正是这种普遍适用性凸显大数据知识作为知识形态的认可度。大数据如果不符合知识的确证条件,就不可能成为知识,也就不存在知识的实践应用。
第三,实现特殊性。大数据知识作为知识的新形态,其实现条件具有不同于经验、理性、实验等知识范式的特殊性。从本体看,大数据知识的本体不是传统意义上的经验世界,而是经验世界和网络世界被镜像的大数据,既与经验世界和网络世界直接相关,又不是经验世界和网络世界,是经验世界和网络世界与大数据的联合体,以经验世界和网络世界为最根本,以全样本的大数据为分析对象。传统意义上主体与客体是二元分离的,大数据不仅可以分析客观的经验世界和网络世界,还可以分析主观世界,如通过对主体社交语言、行为等相关大数据的分析,可以精准预测人的行为,目前此技术已运用于预测自杀倾向、犯罪倾向等。从认识看,传统认识论分析多是侧重主体通过概念、思维、语言等发现知识。大数据技术通过机器学习,减轻了人类的脑力劳动,其只需要根据可视化结果,结合主观判断和小数据知识,形成被语言表征的大数据潜在知识。从方法看,传统知识采用归纳、演绎、实验等方法获得。对于经验知识来讲,需要对知识的因果性进行分析。大数据知识来源于对密集型大数据的分析,发现知识的过程是通过相关性分析的。从实践看,传统知识应用于实践的目标是确定的。由于大数据发现知识的不确定性,使得大数据知识应用于实践解决哪些问题存在不确定性,而且发现应用大数据知识的成本有时很高。
第四,价值多元性。从知识论发展历程看,古代知识论主要从本体论和认识论上关注知识及知识的发现问题和确证问题,重点探讨知识的真和善。“苏格拉底把知识看作是道德的基础,认为人的德行来源于洞见,而洞见就是对善的认识” 〔4 〕。近代社会,在知识就是力量的文化背景下,知识论不仅追求知识的真,还关注知识的社会变革力量。第一次和第二次科学技术革命作为知识最主要的形态,不仅促进科学技术的重大变革,还引起第一次和第二次产业革命。现代社会,特别是20世纪90年代发展迅速的知识经济,彰显了知识的经济功能。大数据时代,“美国的沃尔玛公司通过数据挖掘,把啤酒与尿布放在一起卖,在飓风来临前把手电筒和蛋挞一起卖,显著提高了公司的销售额;谷歌通过大数据预测‘非典的大爆发;美国麻省理工学院的‘十亿价格项目编制的网上商品CPI、阿里巴巴编制的淘宝CPI,提前洞见2008年国际金融危机的爆发,等等” 〔5 〕,都是大数据知识应用的经典案例。作为当代知识论研究的重要领域,大数据知识的发现、确证与应用“充满了安全、隐私、公正、透明、平等、可及等人类终极价值” 〔6 〕,大数据知识的实现条件彰显其追求真、善、效、美等多元价值的特质。从发现条件看,大数据分析、挖掘不能侵犯个人隐私、商业秘密和国家秘密,这是从伦理视角规范大数据拥有者、使用者的行为,也是大数据知识追求善的价值体现。从确证条件看,大数据知识应彰显其与经验世界和网络世界运行规律的相符合性,这是追求真的价值体现。从实践条件看,大数据知识目前被广泛应用于社会治理、公共治理、企业治理中,正在通过大数据治理实现政府、企业治理数据化,这是大数据知识在实践层面的价值体现。与此同时,大数据知识应用于生态保护、医疗健康等领域,正在努力实现我们环境美、健康美等目标。所以说,要实现大数据知识的真、善、效、美等价值,我们需要不断完善其在发现、确证和实践等方面的条件。
第五,跨学科性。知识论研究知识的定义、性质、来源、获得手段、确证和效力等,其发展与知识本身的发展方式是紧密联系在一起的。从哲学研究视角看,传统意义上的知识论就是认识论。古代知识论研究大家多是从认识论视角研究知识如何通过人类的观察、理性、概念、归纳、逻辑、语言等被发现和表征的,这与古代知识发现方式有很大关系。古希腊知识的生产,如自然哲学的兴起、欧几里德的几何学等彰显人的主观能动性的发挥,所以,当时的知识论主要是从认识论层面研究知识如何被发现的问题。当代知识论的生存实践论、德性知识论转向与知识的实践转向、德性要求密切相关。大数据知识发现、确证和实践条件包括历史、技术、伦理、语言、实践等,所以,大数据知识的发现问题是多学科相融合的过程。大数据知识论研究应反映大数据知识发展的时代特质,而不能仅局限于认识论层面的分析。也就是说,大数据知识论应彰显大数据知识本身发展的特质,不能将大数据知识论人为地割裂为大数据知识认识论、大数据知识实践论,而应从多学科交叉视角进行研究,只不过是不同学科侧重点不同而已。
〔参 考 文 献〕
〔1〕胡 军.关于知识定义的分析〔J〕.华中科技大学学报(社会科学版),2008(4):13-23.
〔2〕黄欣荣.大数据哲学研究的背景、现状与路径〔J〕.哲学动态,2015(7):95-102.
〔3〕郝文武.知識伦理的终极追求和逻辑与结构〔J〕.华东师范大学学报(教育科学版),2015(1):1-10.
〔4〕戴景平.知识与德行的生成〔J〕.昭乌达蒙族师专学报(汉文哲学社会科学版),2003(6):14-15.
〔5〕张启良.大数据的基本知识及其比较〔J〕.统计与咨询,2016(1):37-39.
〔6〕宋吉鑫,魏玉东,王永峰.大数据伦理问题与治理研究述评〔J〕.理论界,2017(1):48-54.
责任编辑 芳 晔