社科研究中的大数据视域:概念辨析与维度建构*
2023-01-24贵州师范学院商学院郭建文
贵州师范学院商学院 郭建文
当前,对于大数据视域的误用、滥用现象较为严重,突出表现在三个方面。一是视域结构混乱,不同的人对大数据的理解不一导致视域结构不同,没有形成特定视域下分析问题应有的统一性;二是视域概念模糊,文中缺乏清晰地展现,只是笼统地将大数据的思维融入其中,没有明晰可辨的分析框架,视域与视角混淆;三是视域虚置,某些文献虽然面上表明其应用的是大数据视域,但是在具体研究时大数据的核心要素却没有得到应有的体现。鉴于此,本文立足大数据的特点及其时代内核,基于托马斯• 库恩范式理论对大数据视域的概念进行了界定,并对其维度进行逻辑建构,以作为当前社科研究中大数据视域引入的参考。
一、大数据的特点及其时代内核
(一)大数据及其特点
2008 年《Science》杂志出版的专刊中,大数据被定义为“代表着人类认知过程的进步,数据集的规模是无法在可容忍的时间内用目前的技术、方法和理论去获取、管理、处理的数据”。维克托•迈尔-舍恩伯格(Viktor Mayer-Schonberger)和肯尼思•库克耶(Kenneth Cukier)认为大数据是“当今社会所独有的一种新型能力:一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见”。尽管当前大数据的概念未获统一的认定,但大数据意味着数据海量、数据产生和处理的高速度、数据类型的多样性以及对传统数据处理技术能力的超越却是主流的认知。
关于大数据的特点,主要经历了从“3V”到“5V”的认识过程。自D.Laney的 “3V”界定后,国际数据公司IDC界定了大数据的四大特征:海量的数据规模(volume)、快速的数据流转和动态的数据体系(velocity)、多样的数据类型(variety)和巨大的数据价值(value)。IT巨头IBM提出了5V模式,除了包括规模性(Volume)、高速性(Velocity)、多样性(Variety),还包括价值性(Value)和精确性(Veracity)。
(二)大数据的时代内核
大数据的时代内核体现了大数据在经济社会生活中所凸显的鲜明属性,是大数据视域建构的基础。通过综合学者们的相关论述,大数据的时代内核主要包括以下六个方面。一是全数据替代样本数据。对事物的研究重点不在于抽样的精巧设计,而是尽力地萃取能够标识事物的各方面资料,通过简单的算法即可探寻事物的本真。二是混杂性替代精确性。由于绝大多数数据都是半结构化或非结构化,这就要求放弃对数据精确性的执迷,而容忍混杂性存在。三是相关性替代因果性。舍恩伯格认为,(在大数据时代)“知道‘是什么’就够了,没必要知道‘为什么’” 。根据其观点,在大数据时代相关关系的重要性要强于因果关系,在许多层面上探寻到事物间的相关关系就足以解决问题。四是量化替代经验。大数据时代过往难以处理的半结构、非结构性数据有了统一处理的可能,使得世界一切皆可量化,从而摆脱了对经验分析的依赖。五是数据的价值生命得以延展。小数据时代,数据的价值基本上体现在一次性应用上,大数据时代赋予了数据创造各种价值的可能,数据的价值已经突破了其原始价值的范畴,能够创造出超越其初始价值的价值。六是前所未有的数据统治力。数据的统治力得到彰显,成为与技术、思维鼎立共生的核心发展要素。
二、视域概念及其维度构成
(一)视域辨析
严格地说,视域一词并不是真正的学术体系用语,只能归于惯用语之列。因为在学术体系内视域一词尚缺乏严谨地考察,只是研究者将其作为与研究视角相提并论甚至混用的一个常用语。就字面意义来说,所谓视域,指的是视力所及的范围。在学术界,视域时常与视角相混,然而细究起来视域与视角存在本质的不同。视域指的是一定的范围,是平面视觉广度和最大视觉范围,而视角指的是观察事物的特定角度,其范围要小于视域。在学术范畴内,视域一般指的是基于某种理论而生发出的研究特定范围问题的方法、规则、视点,而视角的基点可以是特定的理论,也可以是视力聚焦之物,既可以以某种理论作为研究的视角,也可以将特定的研究对象或者该对象的某一侧面作为研究视角,故而二者存在根本的不同。
通过对科学研究领域内与研究方法方式相关的概念的考察,与视域关联度较高的学术用语当属“范式”。1962 年托马斯 •库恩(Thomas Samuel Kuhn)在《科学革命的结构》一书中阐述了范式的概念与理论。他认为,“范式是一种公认的模型和模式,是常规科学的理论基础和实践规范,是研究者在从事科学研究时共同遵守的世界观和行为方式,是共同接受的一组假说、理论、准则和方法的总和”。吉姆·格雷 ( J.Gray) 对科学范式的发展历程进行了研究,认为科学范式已经从经验科学范式、理论科学范式和计算科学范式,发展成当前的 “数据密集型科学范式”,也即第四范式。第四范式的提出与大数据概念被重视几乎同步,具有很强的大数据背景,可以说正是大数据推动了第四范式诞生。
范式是科学研究的特定阶段特定领域开展研究的通用模式,具有相对的普适性。视域是基于某一理论对客观事物或现象进行观察研究的工具,从既有文献对视域的应用来看,主要是基于某一理论出发对特定的问题开展研究,因此视域和范式存在一定的关联与区别。二者的相通之处在于都是对研究对象开展研究的工具性集合,规定、制约着研究的范围、进程。不同之处在于,视域基于某一特定理论出发,而范式覆盖的范围则更为宽泛,并没有与特定的应用型理论相结合,可以说是各个不同研究视域的内核抽象。因此特定的视域可以看作是范式的外延,范式则是视域的内涵。简而言之,视域就是范式在特定理论视角中的体现,是特定理论与研究范式的有机结合,视域中蕴含着范式的精髓,而范式需要视域去体现和发生作用。
(二)视域的维度构成
鉴于视域与范式的关系,分析特定视域的维度结构可以借鉴范式的相关理论。范式一般包括共同的基本理论(观点、方法)、共有的信念和某种自然观(含形而上学假定),其“基本原则可以在本体论、认识论和方法论三个层面表现出来,分别回答事物存在的真实性问题、知者与被知者之间的关系问题以及研究方法的理论体系问题”。由上,范式的内部结构主要由核心层、方法层、应用层组成。核心层主要包括基本的理论、观点、信念;方法层包括各种研究方法;应用层包括范式的具体应用。因此,作为范式基础上融入特定理论的视域,其在结构上应包括如下几个维度。
1.理论
理论维度指的是形成特定视域的理论、理念、观念和思维,这是特定视域的核心,决定了视域的学科眼界与视域的宽度和深度,是区分此视域非彼视域的关键。和视角不同,视域具有显著的认识本体的特征,是从本体的某一点出发去认识视域范围内的特定问题,而不是基于问题的某一部分出发展开分析。因此视域具有先在性和本体性,视域与问题两分,同一视域可以作用于不同的问题,而视域的本体即其核心层的理论。
2.方法
方法维度也即理论维度基础上特定视域内蕴的主流研究方法。不同的理论基础决定了研究的视界不一,理论本身的特质也决定了这一视域下应采用的研究方法的不同。方法是理论应用的载体,也是理论应用的形式化,任何视域都具有显著不同于其他视域的研究方法,因而研究方法作为视域的一个维度存在。3.视点
所谓视点维度指的是特定视域所关注的问题焦点,是该视域下研究问题时需重视的关键环节,也是解决相关问题的钥匙和着力的方向。视域标定的是视界范围,但是对于特定问题的研究必须要聚焦于相应重点。不同的视域由于核心理论不同,研究方法各异,对于同一个研究对象其关注的重点也各有不同,因而视点能够从一个方面反映视域的特征。4.举措
举措维度指的是特定视域在解决问题时所推崇的路径与方法,是特定视域下解决相关问题的基本观点。不同视域下对于同一问题的解决存在不同甚至相互矛盾的观点,比如对于社会稳定问题,治理视域下一般提出的解决办法是社会各部门的协同,而对于法治视域下的社会稳定问题则更为强调法治的规制作用。三、大数据视域的维度构成与结构特点
(一)大数据视域的维度构成
根据上面的分析,本文将大数据视域定义为通过大数据理论所能观察到的事物范围与聚焦的要素,是大数据思维基础上衍生出的一系列观念与视线的组合,是观察事物的一系列理论、规则、方法、视点以及实践应用构建而成的对社会问题、社会现象观察研究的一种模式和分析架构。综合视域维度构成分析并结合大数据理论自身特点,本文认为大数据视域的维度应包含如下方面。
1.数据
大数据理论是以数据为中心的理论体系,大数据思维与共识是大数据理论的基础。对大数据来说,数据是其根本,没有规模体量大、类型多样、产生速度超快的数据作为基础,大数据技术将成为无本之木、无源之水。因此,大数据视域的四个维度中,数据维度作为视域的理论层具有根本性的地位。因此,应用大数据的视域观察事物,首要的要关注与事物有关的数据,脱离数据维度的所谓大数据视域将会失去其赖以存在的基础。
2.量化
在视域的维度结构中,理论维度基本决定了方法维度。大数据视域以数据为核心,故而量化作为大数据视域的方法维度顺理成章。大数据技术是量化的技术,之所以应用大数据其中一个重要原因就是要在浩如烟海的数据中探求事物的规律性,从而摆脱经验主义、主观主义的局限与非理性。量化作为大数据视域的维度之一这是从大数据自身引致的。用大数据视域来观察、研究事物的发展规律,就必须要坚持量化的眼光,把握量化的技术。从现有文献来看,基于大数据的视域或视角的研究文献中,基本上都提到和应用了量化研究。这从一个层面证实了量化作为大数据视域维度之一的必要性。
3.相关
视域指的是一定的视力范围,但是通过视域对客观事物开展研究必须要聚焦于一定的视点。区别于小数据时代对于因果关系的执迷,大数据时代更为侧重对相关性的探寻,社会网络的形成使得整个世界成为一张无边无际的网,而这个网络中的任何一个节点的变化都可能因“蝴蝶效应”的存在而对网络和网络上的其他节点产生或大或小的影响。因此,在这一背景下,对事物因果性的追索更多地让位于相关性。从另一角度来讲,关注相关性实质上就是坚持系统的眼光,正因为系统性的存在使得事物之间存在各种形式的关联。因此,应用大数据视域来研究、分析问题时需要将视域的焦点聚焦在事物的相关性上,相关性即是大数据视域的视点维度。
4.预测
举措是视域中的问题解决之维,大数据在实用价值上与小数据的显著区别是大数据具有更强、更精准的预测能力,预测是大数据应用价值的核心体现。基于数据的分析不仅还原了事物的发展规律,更为重要的是基于研究的目的对事物的未来发展变化进行预测才能最终解决问题。能够做出精准的预测是大数据之所以得以存在和发展的秘诀,因而,预测是大数据视域的重要一维。
(二)大数据视域的维度构成特点
通过以上的分析,大数据视域的维度由数据、量化、相关和预测组成,四个维度的有机组合构成了多层次、多角度、立体式的大数据视域。首先,数据维度是大数据视域的基础;其次,量化是大数据的内在要求;再次,相关性是大数据分析的核心;最后,预测是大数据应用的价值归宿,同时也是实现机器学习、数据分析智能化的关键环节。大数据视域的特点主要表现在四个方面:一是数据的基础性。对于大数据视域而言,其理论的核心是与大数据有关的各种原理。二是量化的全面性。即应用大数据视域研究问题时要全面地使用量化的方法。三是相关的普遍性。即通过大数据视域探寻事物的发展规律时,最为普遍的研究导向就是去找寻事物内外部的相关关系。四是预测的核心性。应用大数据视域开展社会问题研究时解决问题的着眼点在防范、将问题消除在萌芽状态,故而预测的核心性凸显。