论大数据语境下的科学史研究
2017-04-03诸玉峰李树雪
诸玉峰,李树雪
(1.太原武宿综合保税区 管理委员会,山西 太原 030032;2.山西大学 科学技术史研究所,山西 太原 030006)
论大数据语境下的科学史研究
诸玉峰1,李树雪2
(1.太原武宿综合保税区 管理委员会,山西 太原 030032;2.山西大学 科学技术史研究所,山西 太原 030006)
传统的科学史研究,一般只注重科学发展的内在逻辑,或是着重探讨科学事件的外在因素,这样的研究格局造成了长期的内外史分裂而没有合理的解释路径。虽然科学史的文化解释正在兴起,但是面临着科学史等同于文化史的局面。为改变这一局面,具备诸多优势的大数据技术分析方法无疑可为科学史解释新格局提供理论与实践支持,促成科学史解释的转向。
大数据;语境;科学史;转向
科学对人类社会文明的推动作用是不容怀疑的。正因如此,科学技术便有了与人类其他社会活动完全不同的特征,从而其历史似乎也与其他学科的历史的研究方式、研究内容等有所不同。特别在我国,科学技术史作为一级学科建制而与历史学平行,这一突出地位使科学史的学科独立性与自主性得到了充分发挥。事实上,科学史一直是作为一种“特殊的”历史去描述的,尤其是当科学与文明交织在一起时,只有将科学置于文明的演进中去研究才有语境意义,这也正是李约瑟的成功之处。然而,科学史研究格局在20世纪中后期发生了内史向外史的转变,以致随着文化解释力的不断增强,有学者主张“科学是文化的重要组成部分”[1]3-5,提倡从文化的角度去阐释科学史。可在具体的研究中,科学是有形的,而文化是无形的,从文化解释科学的发展历史有一定的缺陷。因为从历史语境的角度讲,科学一直是特殊人物从事的特殊智力活动,内容的独特性决定了其历史的特殊性,历史的独特性造就解释的多元性。近年来,大数据技术分析在经济学、决策学、社会学等领域创新了方法,必将引发人文社科领域研究的转向。从人类社会演进来看,科学知识的获得都是建立在一定数据基础上的理论归纳,从大数据中总结规律而得到理论,理论再应用于实践。依据这一逻辑判断,不难理解科学大多是具有相关性而非因果性,这种相关性体现在不同的时期数据的“量”有所不同。所以说,随着大数据时代的到来,大数据技术分析必然给科学史研究带来新的解释路径而成为今后研究的方法论基础。
一 大数据分析的史学优势
进入“大数据”(Big Data)时代,是信息技术发展的必然结果。早在20世纪80年代就有学者指出人类的第三次浪潮就是从工业社会跨入信息社会,尽管在当时看来是一件久远的事情,但没想到在计算机发展的短短几十年,世界就发生了巨大的变化。“知识爆炸”是人类进入21世纪后的典型特征,致使复杂性思维替代简单性设计成为科学研究的主流,学科的交叉与融合产生了新的学科,如建立在统计基础上的生物数学,在短短的几十年就发展起来,有些学者甚至声称未来是生物数学的世纪。科学也从简单学科发展为复杂科学,复杂性思维渗透到各学科中,面对复杂性问题的处理而产生了“黑箱”理论。所有横断科学的出现,其理论或是学科自身都与大数据有关,几乎都是建立在一定数据分析基础上的统计规律,复杂性科学提供了新思维,但是面对一些现象,利用复杂性方法却得不到合理性解释。大数据技术分析弥补了复杂性思维的不足,成为分析事态发展、解释发生与发展的有效工具。
这种建立在大数据基础上的技术分析工具,以不同学科大数据的不同标准来分析科学事件:从计算机专业来讲,也许面对海量的数据才能称为大数据;对于经济学来讲,通过进行对比或是统计能得出结论的“一定量”数据就可以说是大数据;对于人来说,需要借助工具而不能通过人脑处理的数据就应该是大数据。所以说,大数据是一个广义的概念,难以下一个确切的定义。目前,从狭义的字面来理解的话,它应该与小数据相对应,意指数据量特别巨大、多样化、复杂化、纵向化,或是从仪器、感觉、网络交易、邮件、视频、数据流等其他数据源可获得的数据集合。[2]435显然这样的数据集合已远远超出人脑的处理能力,须借助计算机等工具才能进行处理。
传统的科学史已经形成了相当数量的研究成果,这些研究成果就是一个个的数据集合,大多的数据集合已超过了学者自身处理的能力范围,所以利用大数据分析技术,可以有效地分析科学史可以做什么样的研究,怎么去研究等问题;另一方面,还可以通过关注科学家在科研活动中的一系列数据分析,得出新的认识与理解,得出新的结论,实现新的解释路径,从而展示其独特的优势。
(一)科学事件分析的整体优势
大数据技术分析与小数据分析不同之处在于,对关注对象的处理方式不同。小数据时代的数据处理由于处理能力受限,采样只能选取有代表性的样品,这样就会影响统计的准确性,这种抽样统计的分析方法带来的结果只能反映出部分情况,有一定的随机性,是一种简单性科学思想的体现,这一点就像传统科学史研究一样。而大数据时代的数据分析基于全体数据,是一种总体分析而不是局部,单个数据是大数据集合的元素,整体与部分是一种集合与元素的关系。
这样的思路运用于科学史研究,则会对科学事件做整体分析,而不是从局部去“透视”。比如,要解释“哥白尼革命”,传统的解释方法往往只是关注了地心说与日心说及其相关理论,而用大数据分析方法,就要围绕日心说提出前后不同的天文学家的一系列数据,对其进行总体分析,然后得出结论:为什么日心说可以代替地心说成为新的天文学理论。李约瑟先生对中国古代科技史的研究正是站在中国古代文明与科学技术发展的总体框架中才得到了对中国古代科学技术史的全面理解,尽管现在有的学者对李约瑟先生的编史思想提出了质疑,认为他是基于西方科学的立场去从事中国古代科技史的研究,因此是一种辉格式的解释。但是科学的发展是在一定历史语境下的产物,是基于长期“观察数据”上的积累,比如中国古代的“天学”,完全是建立在长期对日月星辰观察数据上得出的结论。从大数据的角度去看待中国古代的科学技术,便不再是一种辉格式解释。
事实上,中国古代科学技术的发展,更多呈现的是阶段性高峰的特点,换句话说就是由一个个科学事件组成而没有成体系的特征,正如现在史学界认可的北宋时期是一个高峰。而且大多科技成果是一代代科学家长期观察、记录、研究的结果,这些数据记录虽然现在无法再去还原,但可以肯定地说,这正是数据发展的结果,那么如果要还原古代的科技,通过还原“数据”分析无疑是一种很好的方法。中国古代科技如此,西方的科学发展也是如此。牛顿的力学定律就是来源于伽利略最初的实验,没有伽利略的一系列实验数据,也可能就没有了后面的力学定律。所以科学的发展实际是建立在数据分析基础上的,对数据进行研究正是大数据技术分析的优势。
(二)创新科学史研究方法
自然科学方法用在社会科学上,本身就是一种创新。大数据技术分析首先是在自然科学的研究上取得了成功,然后借鉴到社会科学上。科学史中的计量科学史就是一种对群体研究的方法,但是这种方法与数据技术分析是有差别的。
从历史语境看,科学史开始时是以学科史的方式进行的,而且是由不同的学科的“专家”来完成,其目的是为了记录当时做实验或是研究的情况。这一境况的打破是在科学史研究接受孔德实证主义的哲学思想后,于1837年出版的《归纳科学史》形成了综合科学史的研究格局。于是科学史由传统的科学家研究转向了科学史学家与科学家共同研究的局面。这一局面到目前还在一定形式上存在,不过已出现了严重的分化:以前由科学家从事的科学史研究,逐步发展为职业科学史学家与科学家共存的局面,同时对科学史的理论研究在逐步加深,科学编史学也从“隐”学变成了“显”学。职业科学史学家的研究使得学科间的交叉与融合成为了可能,从而使科学史出现多元解释的新格局。
大数据技术分析无疑为这种新格局增添了新的解释方式而凸显优势。大数据技术分析以量化的方式去探讨科学史解释的可靠性与可行性,从而得出的结论是较为确定的。比如,要研究古代戏台的扩声原理,传统的方法是通过文献考证与现场测试的方式进行,而现在可以建立数据模型,用计算机进行3D立体模型,输入一系列的数据后得出声音的传播效果。当然这种分析方法得出的舞台音效只能说是以无限逼迫的方法最大限度地“还原”当时的真实情况,肯定不是真实情况,但是其结论已比单纯的理论分析要可靠得多。这就是大数据分析的优势,为科学史的开放研究提供了数据基础,其结论要比传统的定性分析可靠得多。
(三)科学史研究的认识论优势
传统的科学史研究,存在一定程度上的认识论偏差,这种认识论差异是由于不同的科学史学家对科学史的认识不同所造成的,这也导致了科学编史学研究上的逻辑路径不同,从而形成了科学史的内史与外史不同的研究风格。这种局面之所以一直存在,就是因为对科学的认知不同导致难以在内外史之间保持合理的张力,或是说科学史学家在对科学的认知上存在着认识论分歧。
科学史关注的科学,与科学哲学不同,其注重的是“历史上”的科学,是具体的、实在的科学。由于不同的学科其内涵与特征不同,那么科学史在面对具体学科史时就会有不同的研究方法,简单的理解就是自然科学史有自然科学史的研究方法,社会科学史有社会科学史的研究方法,难以用相同的方法去研究不同学科的历史。然而,科学史的方法论研究却要从认识论的基底出发去寻求一种科学史统一的研究方法,这是科学编史学重要的研究内容,也是科学史哲学的核心内容,但是几十年来,在理论界还没有这样的方法论出现。
大数据技术分析方法的出现,无疑为科学史研究注入了活力,而且这种活力是不可想象的。因为科学,不论是什么时候的科学,都与数据相关,古希腊如此,中国古代科学亦然,近代实验科学更是如此。科学离不开数据,没有数据的更新就没有科学的发展,没有科学的发展就没有科学史,所以科学史离不开数据。只有从对数据的分析中去重新认识科学,为科学的划界提供新的理据,科学史研究才能转换新的视角。这样一来,大数据技术分析无疑为科学史研究实现认识科学的本质提供认识论基础,完成科学史研究在历史的长河中回答“科学是什么?科学是怎么在现实中生存的?”这一任务。
依此逻辑分析,面对大数据时代的到来,科学史传统的研究格局有可能被打破,大数据技术分析将科学的发展历程放在数据分析的基底上,重新认识传统科学史研究的不合理一面,将科学置于数据发展的变化更迭上,不再考虑科学发展的因素分析,以淡化和消解科学史的内外史的区别与界限,从而实现科学史的新解释,体现其认识论与方法论优势。
二 大数据引发科学史的解释学转向
一般而言,在“科学”概念之前,人类对自然的探究是建立在经验与考证基础之上的,科学概念出现以后,科学的实证传统得到了认可。正因如此,实证主义科学哲学曾长期主导了科学史的研究。实证主义的科学就是指人类知识的实证积累,科学史自然就成了实证科学的积累史。比如,地心说与日心说之争,地心说的主张在当时盛行时,是通过长期的观察而得出的,长期观察积累的数据,在当时来说就是一种对“大数据”统计的结果;那么当日心说提出时,其同样是经过长期观察和计算得出的,类似的中国古代的科学与技术知识大多是长期积累的结果。所以说,数据是科学发展的逻辑基础,没有了数据,科学便失去了核心支柱。然而,传统科学史研究的内史解释、外史解释、综合史解释等都没有考虑到数据变化引发的科学发展,而只是注重了科学发展的内在逻辑与相关因素的影响,这正是传统研究的缺陷,而大数据技术分析方法则可以有效地克服这一不足。
为什么大数据技术分析可以弥补传统研究的不足?大数据技术分析的相关性、整体性、社会性等特征,正是人文社科研究方法最需要的特征。科学史作为一门特殊的人文学科,不仅要从具体学科的自身发展去理解,而且要注重从学科间的相关性去阐释,更要从社会的整体性去把握。从目前及未来的发展来看,大数据技术分析不仅仅只为了一些价值或是利益,而会越来越成为一种社会组织形态,即“数据化”科学。[3]23其实,早在十几年前,科学界已从模拟技术开始发展数据技术。比如以前的音箱音量调节是通过电位器改变电阻来实现,没有量化的概念,而后来出现了数字化技术,从而实现了音箱音声大小的数字控制,这是最基本的数据化。未来的发展,也许一切都可以数据化,包括我们个人信息的数据化,这是证明“你是你”的最核心数据。所以说,大数据会渗透到科学史的研究中,就像大数据进入到我们的日常生活一样,会产生最合理的方法,从而引发科学史研究方法的转向。
就以具体的学科为例,现在发展势头非常好的“生物数学”,无疑是大数据时代的产物,那么研究它的历史同样要从大数据的角度去研究。生物数学是生物科学与数学结合而成,在大数据统计的基础上,建立数据模型,可以解决诸多以前在生物学领域无法解释的问题。因此这一学科的产生并不是像数学在物理中的应用那么简单,所以对其定义也不能简单地说就是数学在生物中的应用。历史地讲,正是在对生物中的一些现象进行统计分析或是建模的过程中逐步发展了生物数学,或是称应用数学,才在20世纪的70年代正式建立了生物数学,并有可能掀起下一个科学的浪潮,尤其是其中的种群分析更是大数据的体现。
生物数学的发展是建立在大数据基础上的,其实古代科学或是近代科学大多是建立在数据基础上的,只不过是当时没有计算机去处理这些数据,但是从人类智力的角度来说,当时语境下的数据就是大数据。比如,中国古代浑天仪的发明,就是在对天体长期的观察上建造的,虽然现在已经失传了,但是根据文献记载可以想象当时的数据记录。据考证,浑天仪的发明者是阆中人落下闳,后又被我国东汉天文学家张衡所改进。浑天仪主体是几层均可运转的圆圈,最外层周长一丈四尺六寸。各层分别刻着内、外规,南、北极,黄、赤道,二十四节气,二十八列宿,还有“中”“外”星辰和日、月、五纬等天象。仪上附着两个漏壶,壶底有孔,滴水推动圆圈,圆圈按着刻度慢慢转动,于是各种天文现象便赫然展现在人们眼前。(百度百科)如此复杂的结构致使今天都难以复制,但是从中我们可以想见没有一定时间的观察与记录,不可能制造出这么复杂的仪器。那么站在当时的语境来考虑,浑天仪的制造绝对是“大数据语境”下的产物。
所以说,大数据技术分析方法站在科学事件的相关性、科学史解释的社会性、整体性、研究方法的数据化立场,不仅为古代科学的发展提供了解释语境,同样对现代科学的发展也具有解释力,从而会引发科学史研究的转向。
三 大数据技术分析观照下的科学史
大数据技术分析与科学史研究的相关性是考察大数据语境下科学史研究转向的逻辑基础。因为,传统科学史观主导的科学基础是因果性事实,或是说“科学始于问题”,其突出特点是在对“现象”的解释中探讨其因果性关系,尤其是近代科学革命以前的科学,大多是以解释现象发生的原因而产生了不同的科学知识,尽管有些“科学”后来被证明是错误的,但至少在当时是“正确”的理论解释,比如化学中的“燃素说”与“氧化说”的更替,都是在大量的实验数据基础上形成的。所以说,任何一门自然学科都是基于一定的数据而发展起来的。因此,科学始于数据也就有了理据,这便为科学的重新划界提供了一种现实可行的标准,从而引发对科学史的另一研究路径。
(一)重新理解科学
对于科学是什么的问题,可以说到目前为止还没有一个令人满意的答案,这是因为科学在发展的过程中,不同的学科具备不同的特色,要想寻求一个统一的标准几乎是不可能的。基于这一认识,一切科学是追究现象之间的因果关系倒成了一种可以依赖的定义,因为不论什么样的学科都是为了寻求对该领域中发生的一些现象的解释,较为完善的解释就可认为是“科学的”。
然而,18世纪英国哲学家休谟否定科学的因果性,认为因果性只不过是思想中的习惯性联想,而不是现实中的客观实在。这样的观点不仅在哲学界,而且在科学界也产生了很大的影响。因为科学就是在解释事件的因果性中发展的,如果没有了因果性几乎就没有了科学。直到现在科学无论解释还是研究,不论是D-N解释模型,还是其他一些解释模型都有其一定的合理性。
可是这种合理性是与语境相关的,在不同的语境下可能会出现不合理的一面。比如,在氧化说产生以前,燃素说长期占据着统治地位,其对燃烧现象的解释也得到了大多数人的认可,但是在氧化说出现后,燃素说便显示出不合理性,而不能成为科学理论了。在科学史上,类似这样的例子举不胜举,所以科学与非科学的界限是什么、什么样的理论才可以称为科学等一系列元理论问题,长期困扰着学界。
大数据技术分析超越科学的因果性问题,其重点放在了相关性,认为科学是始于对数据的分析和统计。有些学者认为,因果性诉求是小数据时代的产物,在大数据时代,科学追求的是现象间的相关性,而非因果性。相关比因果更重要。[4]35这就是说,科学要从关注因果关系的研究转向关注相关关系的研究,我们可以没必要知道是“因推果”还是“果推因”,只要知道研究对象是否具有相关关系就可以了。因而,科学研究的内在逻辑性将会发生很大的变化,况且科学的划界标准变了,科学史的内容自然会发生很大的变化。
这样一来,对于中国古代有无科学这样一个问题,自然就在某种程度得到了解决,因为科学的划界标准不再以当代西方的科学标准为依据了,而是以现象间的相关性为特征,中国古代的数学、天文学(天学)、农学以及地学等方面的知识都与当时人们的生活相关,只是在不同的时期,观察所得到的数据不同,在不断丰富的数据中,中国古代的科学技术得到了极大的发展。
(二)科学史方法的变革
实证主义框架下的科学史研究,曾一度将自然科学的研究方法引入到科学史的研究中,产生了很大的影响,而且为当时科学寻求社会地位以及政府的政策支持提供了方法论和认识论基础。方法好多是来自于自然科学的研究方法,比如计量科学史的研究就是来自自然科学的统计方法。其实,计量科学史的研究已经有了科学史研究“数据化”的成功方法,只是这样的方法仅对于一些研究可以运用,有的学者就是在对科学史文章的统计中得出了20世纪科学史的三次转向,还有依托计量的方法去研究科学发展的态势,并得出了可靠的结论。[5]这里只能说是可靠,因为作者只对发表在两种杂志的文章作了统计分析——《科学》(Science)和《自然》(Nature),而对全球近万种杂志上的其他科学类的文章没有做分析,其权威性自然打了折扣。所以,其对象的选取值得最优化和权威化。再者当面对中国古代科学史的时候,计量方法简直无用武之地。因此说,计量方法尽管是一种数据化的研究方法,但有一定局限性,这也是其发展受限的原因。
那么,面对大数据时代的科学史研究,在方法论层面的思考或在具体方法上的应用,虽然与传统的方法不可能大相径庭或是彻底抛弃传统研究方法,但是大数据技术分析会突出自然科学方法在科学史研究中的数据分析。比如,对于古代钟的传声研究,现行的研究方法往往是建立在通过史料来看当时的铸造技术或是声学传播方面的研究,如果用大数据分析的方法,就会采取现在的全息成像技术对研究主体进行数据采集,用计算机模拟技术建立模型,理论上计算其声音的传播速度与距离,然后利用现有的声音测试技术测定钟声的波长、速度等等,从而验证古代铜钟或是铁钟的冶炼技术以及对声学原理的掌握程度。这,是一种全新的研究。
所以说,大数据技术分析是要针对科学史上个别的或是独立的,特别是某个科学史人物的科学成果进行分析,这样由于思考问题的出发点不同,分析过程不同,有可能会得出与以前结论不同的结果,这个结果有可能比以前的结论更能真实地还原科学发展的历史。
(三)科学史的分期研究
正是由于科学史与一般的历史不同,所以对科学史如何分期长期以来一直争论不休,现在已到了不争的地步,因为一般来说,科学史都是按历史的分期原则去做出评判,其实这不合理。因为科学的发展并不是普通人所从事的职业,而是一些特殊人物在特殊的环境中所形成的事业,这一点可以从科学家的数量所占人口的比例中得出,这是一方面。另一方面, 科学知识是有地域之分的,科学的发展并不均衡,不同的地方产生了不同的学科或是知识点,最后系统化的科学是后人根据不同的定理、定律而组合在一起,形成了现在的教材或是专业书籍。当然也有个别例子,如欧式几何在形成时,就以五个公设进行推衍而形成了我们称为平面几何的专业知识,但是在传统的科学分类中,自然科学是不包括数学的。那么,这就是说,科学的发展史已经向我们表明,科学的发展其自身的内在规律,这种规律并不能以人类社会的一般规律去概括或是去描述。
大数据技术分析无疑为科学史的分期提供了一种思路。如前所述,科学技术可以以数据的多少来标识,那么从这点出发,就可以把科学的发展以无数据、小数据、中数据以及大数据来进行划分。这样的划分,使科学技术的特征很明显地表现出来。比如,中国古代的科学技术基本处于无数据或是小数据状态,中国古代的定性研究远超定量研究。这也正是中国古代科学没有走向近代科学的主要原因。
(四)科学史的内外史论争
科学史的内外史之争,似乎从来都没有过结论,以至于现在对这一问题都熟视无睹了,因为社会建构论对科学研究的渗透使得这一问题好像得到了解决。事实上,社会建构论的科学史研究固然有其合理性的一面,但是过分强调科学的社会建构对于科学发展的内在逻辑肯定是一种冲击,所以并不是一剂良药。
科学史在进入21世纪后,从国内外发表的文章来看,研究呈多元化趋势,讨论科学史的内外史之争、辉格式解释、科学史的研究方法等问题的文章明显减少,而大多文章走向了对知识点的深入挖掘,这似乎是一个好现象,是关于科学史研究的理性回归,但是从理论研究的角度来看,这并不是一件好事情。因为一个学科如果没有一定的理论支撑,这个学科的整体发展水平不会太高。科学史更是如此,如果没有对科学史进行一些“形而上”的思考,那么对这一学科的整体建设是无益的。比如,中国科学史的研究,经过第一代学人李俨和钱宝琮等学者所倡导的“范式”,基本解决了关于“古代科学是什么”的问题;第二代学人如吴文俊先生倡导的“范式”试图解决“古代科学怎么样”的问题,甚至还提出了“第三条道路”——为什么研究古代科学。[6]基于这样的认识逻辑,不难理解,尽管中国科学技术史的研究没有对内外史进行过争论,但实际上已经意识到以前的中国古代科学技术史研究是一种内史式研究,现在要走向外史式研究了,但是有一个问题很明显地摆在学界面前:这就是在动摇了传统的研究范式后,应该以哪种范式去重新审视中国古代的科学技术?
无疑,吴文俊先生倡导的“古证复原”思路是非常正确的。那么要复原就要有数据,不仅在数学的古证复原上需要数据,要还原当时的计算过程,其他方面照样如此。例如,想复原一件晋式青铜器,如果没有对当时的数据进行分析,就不可能做到还原。这样一来对数据的分析研究就成了科学技术史的主要内容。
这样,对科学史的研究一大部分内容集中在了数据是怎么产生的、当时已具备了什么样的数据、这些数据对后期研究的影响是什么时,自然就消解了科学史的内外史争论,同时也为避免科学史的辉格式解释提供了可行的方案。
(五)地方性知识的身份认同
科学史研究中的地方性知识一直是学界争论的一个论域,始终没有得到科学史界的认可,其身份始终难以确认。比如,中国的中医药知识,虽然《黄帝内经》成书的具体日子不清楚、作者是不是黄帝也没有定论,但是其中所蕴含的中医保健理论,到今天仍可运用。类似这样的知识还有很多,那么从科学史的角度来说地方性知识有没有科学地位,一直是有争论的,所以才有学者说出“中医不是科学”的观点。
事实上,把中医药知识排队在科学之外,完全是建立在西方科学认知的标准上的。西方近代实验科学的确立把科学的标准建立在理性与逻辑基础上,特别是逻辑实证主义强调理论的逻辑表述与经验的证实。科学就是经验基础上的证实,虽然波普尔的证伪主义反驳了这一认识,但是科学始于问题、观察渗透理论还是一直盛行。再者,人类哲学的简单性原则在中国表现为“天道崇简”,在西方表现也很突出,如还原论,主张科学理论不管有多么复杂,都可以还原到逻辑起点。物理主义认为各门学科存在还原关系,物理学是所有学科的基础,任何学科最后都可以还原到物理学。
但是,后现代哲学完全颠覆了上述有代表性的理论,以一种批判理性的态度去反思科学,尤其是交叉科学的出现使具体学科划分越来越细。现在据不完全统计,科学的分支学科有400多种,这使得科学不再由传统的物理学、化学、生物学等一些最基础的科目组成,而是交叉学科、边缘学科、横断学科等复杂性学科迅速发展起来,这样对科学的思维不能再以一种简单的方式进行,而是以强调科学知识的语境性、地方性与多样性为基础,一种新的科学世界观——复杂性范式发展起来,成为一种新的认知模式,虽然复杂性范式还没有一个统一的研究理论[7]104-119,但是也打破了传统科学的统一性。像物理化学与化学物理这两门学科,分别是物理学与化学学科一级学科下设的二级学科,但是其又有自己学科独特的研究内涵,类似这样的二级、三级学科很多,因而科学是以复杂性方式去处理,那么科学史也要以复杂性思维去思考,否则一定会失去其研究基础。这样一来,我们会发现科学史不再是单一的,而是多元化的、非线性的,传统的固定模式不可能达到合理解释。特别是计算机出现以后,面对信息量的大增,传统的手工方式一定会被计算机代替,大量的数据可以通过计算机去处理,这种方式的转变,就如同手工技术被机械技术代替一样,具有革命性的意义。
这种革命性的转变,使得对科学知识的认知同样发生革命性的转变,人们会发现,科学知识是一种与地方性紧密结合而且是与语境相关的知识,知识的产生与发展是一种语境理解,或者说是一种数据增长式的语境理解。比如中国的中医,就是典型的地方性知识,即使是在中国,不同的地方也有不同的中医理论,这是因为中医理论主要是讲养生与健身,而在不同的地区由于气候与水土不同,导致人的体质不同,那么养生的方式也不同,所以这些理论的获得是建立在长期积累的基础上,这种长期积累就是一种“大数据”。所以中医也是科学,其本身就是在不断修正中发展,这与科学的本质是一致的。
大数据语境下的科学史研究远不止这些,本文的列举只是一个部分。大数据技术分析与语境分析方法相结合,会产生对科学史进而对科学的一种全新认识,而且这种认识会逐步得到学界的认可。这是因为,大数据技术分析不仅仅是一种方法论,更是一种认识论,从本质上对科学产生与发生的内在逻辑与机理进行分析,尤其是结合“万物皆数”的思想,对思维创新、传统认知都将发生很大的影响,致使人文科学研究也会产生转向。从这一认识线索出发,不难发现大数据技术分析语境下的科学史研究,有其内在的逻辑意义与广博的方法论意义。
四 余思
将科学置于数据分析语境下去研究,会出现与传统认识路径完全不同的分析基底。传统的科学史研究着眼点是基于科学史事件的合理性解释,尽管这种解释由过去的单纯线性描述发展到当代的多元文化解释,但是其对科学的认识还是基于科学哲学的分析机理。先确定什么是科学,再从科学的定义出发去规划科学史的研究,这正是柯瓦雷的编史特征。在经历了库恩的历史主义渗透后,科学史发生了从实证主义到历史主义、再从社会建构论到后现代主义科学史的多元文化解释的转换,这使得科学史的研究领域出现了不同的学术主张,造成了纷繁复杂的局面,尽快结束这种局面,使科学史回归到正确的学术轨道上来,正是科学史理论界苦苦寻求的目标之一。尽管现在文化解释似乎占据了上风,但是这种解释方式或多或少存在缺陷,以致存在不合理性,因为科学与文化的等同本身就存在着一定的风险性,没有深入揭示科学的“数据”本质。从这一逻辑起点出发,大数据技术分析则为科学史研究揭示科学的本质内涵提供了方法与认识论基础。
(一)大数据技术分析促使科学史研究多元化
当代科学史研究的一个显著特征就是多元化,这种多元化不仅体现在科学史内容的多元化,也体现在研究方法的多元化,还体现在认识路径的多元化。历史地看,任何一次科学或是技术革命都会给人类的意识形态带来变化,虽然这种变化是在科学影响到一定程度,经过一定时期才能表现出来。历史上重大的科学变革对人们思想观念的影响是非常巨大的,其内涵已超越了科学事件本身。大数据技术分析不仅可以分析科学事件本身的影响,还可以从量上分析受影响的群体,这个群体是知识界,还有社会界,也许还有政界等等。以往的科学史研究很少注意这方面的研究,即使涉及了这一方面的研究也是很泛的一些内容,不会专门去进行。然而这一方面的研究对科学的发展方向、速度与内容的影响很大,因为科学史不仅有其内在的逻辑发展,更多的是受到外界的影响,尤其是当代的科学更是如此,也正因如此才会从多元文化的角度去寻求多重解释,这种多重解释正是大数据技术分析解释科学史的任务,也是实现科学史价值的有效途径。
(二)大数据技术分析会更加关注时代价值与人文关怀
科学史研究的价值,很重要的一点就是时代价值,尽管萨顿当时论述到科学史的价值时,主张科学史的哲学与历史的双重价值,但随着对科学史认识的不断深入,学界不再只关注科学史本身的价值,而是从多元的角度关注科学史的时代价值与人文价值,这两种价值如果没有数据的统计分析则难以做到有理、有据地分析。现在在中国的学术界兴起了中国古代科技资源、中国古代传统文化的现代价值研究,是时代的需要,但也体现了学科内部发展的需要。这样做的目的很明显,会将科学史的研究从学科理论、定义、定理、概念等“器物”层面转向“理念”层面。就拿中国古代科技资源来说,中国古代文明在漫长的发展路程中,不仅创造了丰富的科学技术知识,其中蕴含的哲学理念、发展理念、科学理念更是今天要重新去认识的战略资源。中国古代哲学中的“天人合一”“天道崇简”“比类推理”等理念,不正在今天的诸多学科的发展实践中体现出来了吗?中国古代传统文化的巨大指导力,正是倡导绿色、和谐发展的思想资源。然而文化的无形性在某种程度上是不好体现的,只有将其附着在中国古代科技资源上,才能表现出来,这样可以通过模型化的设计,实现科学史从学科内涵研究转向对于人的研究,从人与人、人与物的关系的模型研究中发现科学史的人文价值。
(三)大数据技术分析实现科学史的“模型化”
科学史的计量研究在一定的范围内是比较成功的方法,因此而得到了科学史研究的认可。但是这种研究的不足之处是不能穷尽所有的数据,而且也不能通过模型化设计去做出进一步的演进分析。因此,大数据技术分析在对科学史的“数据化”采集的基础上,通过“模型化”设计去完成对科学史的研究,是与传统计量科学史研究最大的不同之处。
模型化研究是自然科学研究的重要工具,在物理学、化学、生物学等诸多领域都有应用,自然科学的研究方法在科学史研究中经常用到,但是模型化的方法现在还没有涉及,这是未来的一个研究方向。通过模型化的方法,不仅可以建立科学史内容的模型,而且可以建立科学家人物模型,以及科学对后期影响人物的模型,通过这样不同的模型设计实现一种全新的科学史研究。这,也许正是未来科学史研究的创新模式。
[1]阿伽西.科学与文化[M].邬晓燕,译.北京:中国人民大学出版社,2006.
[2]Floridi L.Big data and their epistemological challenge [J].Philosophy & Technology,2012(25):435-437.
[3]韩 晗.论“大数据”与人文研究的转向[J].晋阳学刊,2014(3):22-25.
[4]〔美〕冯启思.数据统治世界:如何在数据统计中挖掘商机与做出决策[M].曲玉彬,译.北京:中国人民大学出版社,2013.
[5]王保红.20世纪科学发展的态势计量分析[M].北京:科学出版社,2016.
[6]曲安京. 科学史的第三条道路 [R]. 国际数学家大会.北京,2002.
[7]Morcol G. What is Complexity? Postmodernist or Postitivist?[J].Emergence,2001,3(1):104-119.
(责任编辑 郭庆华)
On the History of Science under the Context of Big Data
ZHU Yu-feng1,LI Shu-xue2
(1.AdministrativeCommittee,TaiyuanWusuComprehensiveBondedZone,Taiyuan030032,China;2.InstituteforHistoryofScienceandTechnology,ShanxiUniversity,Taiyuan030006,China)
Generally, the traditional research on history of science focuses only on the internal logic of scientific development, or places more emphasis on the discussion on the external factors in the scientific events. Such research model resulted in the long-standing division between the internal history and external history without rational explanation path.Although the cultural interpretation of history of science is now in session,it still faces the situation that history of science equals to history of culture. To change this, the analytical method of big data technology undoubtedly provides theoretic and practical supports for the new explanation structure of history of science. It has several advantages for achieving the transformation of interpretation of history of science.
big data;context;history of science;transformation
10.13451/j.cnki.shanxi.univ(phil.soc.).2017.01.017
2016-11-19
国家社会科学基金一般项目“语境论科学观的编史学意义研究”(11BZX023)
诸玉峰(1988-),男,江苏无锡人,太原武宿综合保税区管理委员会,主要从事科学史研究; 李树雪(1968-),男,内蒙古集宁人,博士,山西大学科学技术史研究所教授,主要从事科学编史学研究。
N09;K061
A
1000-5935(2017)01-0127-06