APP下载

数字人文视野下的中国现代化研究
——以教育早期现代化研究为对象

2023-01-03敏,

关键词:人文现代化数据库

马 敏, 薛 勤

(华中师范大学 中国近代史研究所, 湖北 武汉 430079)

近年来,新文科战略的开展为繁荣我国哲学社会科学提供了助力,人文社会科学的转型与发展也成为热门议题。作为人文社会科学的基础性学科之一,史学研究如何在新文科战略中寻找变革方向成为重要命题。数字人文研究恰与强调将科技融入科学研究,从而实现研究方法与内容创新的新文科发展不谋而合。因此,本文试图通过对数字史学发展脉络的梳理,以教育早期现代化研究为切入点,通过阐释教育早期现代化指标体系的构建设想,探讨大数据时代中国现代化研究的新理念和新方法。

一、数字人文的兴起及其在史学领域的发展

在“数字人文”(Digital Humanities)作为一个新名词出现前,“人文计算”(Humanities Computing)被认为是对“运用数字技术进行人文研究”的精确表达。最早的人文计算始于语言学研究,可追溯到1949年意大利学者罗伯托·布撒(Roberto Busa)及其助手利用电脑建立的托马斯·阿奎那著作索引。1970年代后,随着个人计算机的出现和普及,人文计算从文本创建、维护及存储逐步深入到文本编码、数据库建设中来,在文字或文字材料数字化的基础上,把模拟数据转化成二进制码,以用于电脑处理数据进行量化分析(1)维克托·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,杭州:浙江人民出版社,2013年,第104页。。当前,大数据时代下海量数据的记录、存储及挖掘又为人文计算研究带来了重大变革。人文计算的研究对象从基础文本扩充至影像、图形、声音等内容。“数字人文”逐步取代“人文计算”被学术界广泛接受。近十年,数字人文得到了长足发展,其内容由最初的数字化古籍数据库、量化分析及建立分析工具等,扩展到文物3D模型、图库视觉化、文本标识及分析等(2)Matthew K. Gold,Lauren F. Klein,Debates in the Digital Humanities,Minneapolis:University of Minnesota Press,2016,p.ix.。虽然到目前为止,学术界对“数字人文”的基本概念仍存在广泛争议,但是对数字人文与传统人文的差异性认知总体上是清晰的。传统人文研究主要通过经验式的文本分析,对价值、理念及其深层意义进行个人主观判断。数字人文则是通过对文字或文字材料,乃至影像、图形、声音等泛人文知识内容的数据化,运用数字技术手段得出相对客观的分析结果,帮助研究者对研究对象进行相对准确的、不受偏见影响的理解和阐释,同时也能发现传统研究中受人脑思维局限无法观察和认知的新知识和新认识。不同于以往传统人文研究大多是单打独斗式工作,数字人文研究多采用不同学者间、多学科间合作性、跨学科的模式。经过长期发展,国内外学者在数字人文领域已有诸多尝试,并产生了颇有影响力的成果。

(一)国际数字人文研究的发展

数字人文在国外起步较早,发展程度较高。就史学领域来看,目前已经形成了许多相对成熟的数字人文项目平台和团队。具有代表性的有美国哈佛大学费正清研究中心包弼德(Peter Bol)研究团队,该团队自1990年代初期开始构建“中国历代人物传记资料库”(China Biographical Database,CBDB),截至2021年12月,该数据库涵盖了从唐代到晚清民国时期约515,488人的传记资料,是一个研究人物社会关系、群体传记和生命史的工具平台;美国匹兹堡大学图书馆自2018年建立的“数字村庄”(Contemporary Chinese Village Gazetteers Data,CCVG)项目,该数据库目前已收集1000部方志(村志)包含1800个村庄的数据,有助于了解现当代中国农村社会结构、人口和家庭等等。与此同时,国际数字人文学术共同体也在不断产生,包括欧洲数字人文协会(1973年)、加拿大数字人文学会(1986年)、数字人文组织联盟(2005年)、日本数字人文协会(2011年)、澳洲数字人文学会(2011年)等等。这些机构致力于支持国际数字人文的发展,通过举办学术年会推动数字人文领域的国际交流与合作。其中代表性的有由数字人文组织联盟每年举办一次的数字人文会议(Digital Humanities Conference)、加拿大数字人文学会每年举办一次的加拿大数字人文学会年会(Annual Meeting of Canadian Society for Digital Humanities)等。此外,欧洲数字人文协会和数字人文组织联盟分别创办了《数字人文学刊》(DigitalScholarshipintheHumanities)和《数字人文季刊》(DigitalHumanitiesQuarterly)。

(二)中国数字人文研究的兴起

中国数字人文研究肇兴于台湾地区。20世纪80年代,随着信息技术的发展,台湾“中央研究院”自1984年7月开始推动“史籍自动化计划”,建立二十五史全文数据库,探索将文本转化成数字化内容。1998年,受美国国会图书馆的“美国记忆”计划和联合国教科文组织的“世界记忆工程”的影响,台湾“国科会”分别启动实施了“数字博物馆专案计划”、“国家典藏数字计划”和“国际数字图书馆计划”,以期借助当时台湾科技发展的相对优势,加速文化资讯产业升级,推动学术转型与发展。此后,台湾方面根据整体发展的需要,对上述三项计划进行整合,并在2008年将其与2003年推出的“数位学习科技计划”合并为“数位典藏与数位学习计划”。此计划注重呈现台湾文化与自然的多样性,促成典藏内容与技术融入产业、教育、研究与社会发展,以推动典藏成果国际化。2007年,台湾“中央研究院”专门成立了“数位典藏内容与技术专题中心”负责该计划。至2012年,台湾初步完成了一批数字典藏系统平台与资料库的建设。这也是台湾学界开始探究数字人文研究的基础。自2009年起,台湾每年举办“数位典藏与数位人文国际研讨会”(DADH),为数字人文学者提供交流与争鸣的平台,见证台湾数字人文由“数位文献”向“数字人文”的转型与发展历程(3)邱伟云:《我国台湾数字人文研究进程(2009—2017)》,《图书馆论坛》2020年第7期。。专业化的数字人文机构在这一转型时期发挥了重要作用。如台湾大学的“数位典藏研究发展中心”(2012年起更名为“数位人文研究中心”),其工作重点由推动典藏品数位化与资料库建置、研发数位人文所需的理论、系统、技术和工具,进一步扩展为开创并推展台湾数位人文研究,推动数字典藏与数位人文的国际合作。2013年,台湾“中央研究院”设立的“数位典藏内容与技术专题中心”改组为数位文化中心,其目的即以该中心跨领域、跨学科、跨单位的定位,推动人文学研究的数位转向。

相对于台湾地区,大陆的数字人文研究虽然起步较晚,但发展迅速。除了大量文本检索型数据库的建设外,大陆人文学者还在诸多领域开展了将计算机技术与人文研究深入结合的研究实践。例如80年代末,考古学者即开始将计算机技术引入研究中,不仅开始了考古学文献情报检索系统的建设工作,还注重运用计算机技术对各种遗存进行不同层次的类型学研究和对遗存单位的排序与分期(4)腾铭予:《计算机与考古学——计算机技术在中国考古学领域的应用》,《吉林大学社会科学学报》1997年第3期。。在文学研究中,钱钟书从1984年便开始倡导把计算机技术引入中国古典文献的搜集、疏证和整理中来,并规划指导了“中国古典数字工程”(5)胡小伟:《钱钟书与中国古典数字工程》,《中华读书报》2010年12月8日,第15版。,完成了建设“《论语》数据库”、“全唐诗索引生成系统”等工作。当前,计算机技术已深入到对古代文学经典文本进行高效和深度分析,例如北京大学李铎研发了“《全宋诗》分析系统”、“《全唐诗》分析系统”、“《资治通鉴》分析系统”,北京大学杜晓勤研发的“中国古典诗文声律分析系统”等(6)刘石、孙茂松:《大数据时代的古典文学研究》,《光明日报》2018年10月15日,第13版。。2015年,在中国山东举办的第22届国际历史科学大会中专门以“历史学的数字化转向”为主题进行了国际数字人文研究的相关探讨,进一步推动了大陆人文社科学界对于数字人文、大数据等概念的探讨和关注,国内数字人文发展也迎来了蓬勃发展期。国内各高校和研究机构纷纷成立专门的数字人文研究平台以专注探索各种数字信息技术在人文领域的运用及人文社科研究范式的创新。自2019年始,国内每年定期举办中国数字人文大会,搭建数字人文研究成果的交流平台。各高校及相关数字人文平台亦纷纷举办数字人文相关学术活动,同时通过专业研究人才的培养及期刊建设,提升数字人文影响力。

(三)数字史学的发展

数字人文的发展是人文学科在各自领域具体研究实践的共同结果,其发展也必须尊重各学科传统研究基础和固有特性。学界一般认为数字史学就是指在历史分析、展示与研究中对数字媒体和技术的应用,通常被认为是计量史学和计量经济史的延伸。可见,将数字技术应用于历史研究已有诸多实践。

事实上,在“数字人文”概念出现前,历史上丰富的调查统计资料早就引起了中国史学家的注意并将其用于研究。较早被关注的是《史记》中的《货殖列传》,以及《汉书》及历代史书中的《食货志》、《地理志》等文献中保存的有关人口、田亩、赋役、物价、贸易乃至气候、地理等大量的统计数据;近年来,晚清逐渐兴起的经济调查、文化调查、社会调查、政治调查保存的数据资料也获得了越来越多的注意。梁启超于1922年便提出了“历史统计学”的概念,将统计学法则引入史料整理和推论中。此外,他还将地理和年代作为研究历史变迁的两个坐标,并于1924年发表了《近代学风之地理的分布》一文。潘光旦于1930年底至1931年初在《中国画家的分布、移殖与遗传》一文中探讨了中国画家的时代分布和地理分布的变迁。梁方仲在1935年利用明代户口、田地、田赋等材料,发表了《明代户口田地及田赋统计》一文,在此基础上,于80年代初出版了《中国历代户口、田地、田赋统计》,推动了中国社会经济史的量化分析。章开沅于1984年在《关于改进研究中国资产阶级方法的若干意见》中就指明了人口等统计资料在中国近现代史研究中的重要价值。陈春声在1985年发表《统计分析方法在史学研究中的运用》一文,阐述计量统计方法对大量数字新史料的独特作用(7)陈春声:《统计分析方法在史学研究中的运用》,《学术研究》1985年第3期。。马敏从1997年就开始关注中国近代社会发展指标体系,提倡运用统计数据进行长时段研究,并且尝试构建了1912—1949年民国时期社会发展指标体系(8)马敏、陆汉文:《建构民国时期(1912—1949)社会发展指标体系的几点思考》,《华中师范大学学报》(人文社会科学版)2001年第1期;马敏、陆汉文:《民国时期政府统计工作与统计资料述论》,《华中师范大学学报》(人文社会科学版)2005年第6期。。李伯重将量化研究和比较研究方法结合起来运用于江南经济史的研究,并认为大数据研究方法将引领历史研究走向科学化(9)李伯重:《大数据与历史学科学化》,《北京日报》2017年7月10日,第15版。。

由此可见,传统历史研究已经蕴含了相对原始的数字化概念。随着时代进步,历史学者对于历史计量的思考和探究也随之深入。近年国内计算机技术的蓬勃发展助力数字史学取得了多方面的进展。

数据库建设的全面展开是数字史学蓬勃发展的特征之一。信息技术革命引发了史料革命,数据库建设成为处理海量史料的重要方法。目前国内数据库建设大致分为两种。其一是史料型文献数据库,它们大多通过OCR技术实现纸质史料的电子化或可检索化。具有代表性的有“二十五史全文检索系统”、“国家清史工程数字资源总库”、北京爱如生公司开发的“中国基本古籍数据库”、“中国方志库”等。史料是史学研究的基础,历史研究者十分重视史料的发掘与积累。此类数据库的建设及共享转变了传统史学研究搜集史料的方式和途径,为研究者提供了较大便利。其二是研究型量化数据库。从发展路径来看,大陆地区量化数据库及数据平台的建设初期深受国际及港台地区数字人文学者及其研究团队的影响。例如哈佛大学与北京大学中国古代史研究中心合作开发的CBDB项目;香港科技大学李中清-康文林研究团队构建的多个量化数据库(10)李中清-康文林研究团队开发的数据库有基于八旗户口册与清代皇室族谱资料建设的“中国多代人口系统数据库(CMGPD)”、收集了来自中国35所高校的40万份大学生档案记录,以及包含有大量中国留学生档案及出版资料的“中国大学生数据库(CUSD)”、包含有400万余条官员信息的“中国历史官员量化数据库(CGED)”、包含有中国四个省两万余户阶级成分登记表等数据的“中国农村革命数据库—四清(CRRD-SQ)”等。;陈志武研究团队构建的清代刑科题本数据库等。GIS技术融入历史地理研究的探索在史学领域发展相对早。最著名的有复旦大学历史地理研究中心与美国哈佛大学等机构合作研发的中国历史地理信息系统。该系统以著名历史地理学家谭其骧所编《中国历史地图集》为基础数据源,运用GIS技术,使时空量化分析成为可能。此类历史地理信息平台集数据集及分析应用为一体,结合传统历史学、考古学等学科,在历史地理信息的复原与展示外,丰富了历史地理学分析与阐释的途径。

数据库的发展演变也反映了史学研究理念和研究方法的转型。量化数据库与史料型数据库的区别在于,不局限于利用OCR技术将图片材料文本化成为可检索的数据库,而是从研究问题出发,利用分析样本系统性和结构化的特点,自行构建可以用数据分析软件进行量化分析的数据库。由此,我们可以窥见量化史学大体是在提出研究问题的基础上,通过搜集史料数据,利用数理模型进行相关性分析、因果推论性分析,从而得出结论。这是对传统史学研究方法的补充,也是对传统历史研究理念的创新。

目前,史学界已有诸多运用数字人文方法的优秀成果。如李中清、梁晨等通过北京大学和苏州大学的大学生学籍卡片建立的大学生量化数据库,发现基础教育的推广、统一高考招生制度的建立以及重点中学的设置等制度安排共同推动了新中国社会阶级的流动(11)梁晨、张浩、李中清等:《无声的革命:北京大学、苏州大学学生社会来源研究,1949—2002》,北京:生活·读书·新知三联书店,2013年。。金观涛、刘青峰等通过构建“中国近现代思想史专业数据库(1830—1930)”,收集涵括清末民初近代期刊、晚清档案、清季经世文编、清末民初士大夫著述、晚清来华外人中文著译、西学教科书等六大类文献,以关键词例句为中心,对中国近现代史上的关键概念做了梳理(12)金观涛、刘青峰:《观念史研究:中国现代重要政治术语的形成》,北京:法律出版社,2010年。。诸如此类的研究打破了传统史料鸿沟,通过多学科的交叉合作突破单一学科研究者的认知,探索了历史学“数字转向”的不同路径,拓宽了传统史学的研究思路和视野。然而,由于学科壁垒和研究成果水平良莠不齐等原因,学界亦出现了不少对数字史学的批评之声。这就要求数字人文学者在研究过程中既要注重开创新问题、新思维、新视野,也要注重传承传统研究的学术方法和学术积累(13)马建强:《计算历史学:大数据时代的历史研究》,《学术论坛》2015年第12期。。

整体来看,目前史学搭载大数据时代高速发展的计算机技术,已在一定程度上突破了对史料简单电子化的利用,通过将文本结构化处理,搭建数据库、建立历史地理信息系统、进行社会网络分析等更深层次的史料挖掘,帮助史学家从更普遍、更深层的角度发现隐藏的史实与规律,开展更具普遍意义的国际比较。因此数字人文在结合历史资料系统研究人类社会长期变化与延续等大问题上的作用是突出的(14)梁晨、董浩、李中清:《量化数据库与历史研究》,《历史研究》2015年第2期。。这也是本文设想利用数字人文研究方法进行中国早期现代化研究的初衷。

二、中国早期现代化研究的现状

中国现代化研究是历史研究的重要命题,它与现代化建设在中国的历史演进密切相关。按照中国现代化发展的历程,为了区分新中国建立前后的现代化,我们一般将1949年以前的现代化称为早期现代化,把新中国成立后的现代化称为现代化(15)章开沅、罗福惠:《比较中的审视:中国早期现代化研究》,杭州:浙江人民出版社,1993年,第29页。。而中国现代化研究的发展史在新中国成立前后也呈现了不同面相。

(一)1949年以前中国现代化研究的兴起及发展态势

虽然现代化理论形成于20世纪50—60年代的西方,但在此前,中国知识界已经开始对“现代化”问题展开讨论,并通过自身实践提出了现代化概念和观点(16)罗荣渠:《从“西化”到现代化——“五四”以来现代化思潮演变的反思》,《人民日报》1989年2月21日,第6版。。20世纪20年代,受五四思潮的影响,在中西文化观的激烈争论中已经偶有出现对“现代化”的探讨;1929年,胡适在英文文章《文化的冲突》一文中,正式使用了“一心一意的现代化”的提法。20世纪30年代,“现代化”正式作为一个新名词于《申报月刊》的“中国现代化问题号”特刊中出现。这应该是“现代化”首次正式作为新概念出现(17)罗荣渠:《从“西化”到现代化——“五四”以来现代化思潮演变的反思》。。这一时期,基于对中国发展道路问题的探讨,学人大多将“现代化”与“西化”、“资本主义化”联系在一起。现代化研究集中于对现代化历史实践的考察和探讨,其解释模式大多倾向于“传统与现代”二元对立。具有代表性的是蒋廷黻运用现代化视角分析中国近代社会变革,他认为“近代史是全世界的欧化史,中国近代史就是中华民族近代化的历史,也即是中华民族接受欧洲文化的历史”(18)欧阳军喜:《蒋廷黻与中国近代史研究二题》,《复旦学报》(社会科学版)2001年第2期。。这初步构建了中国近代史研究的现代化范式。但此时学人在运用“现代化范式”解释中国近代史时过多受西方观念的干扰,并未深入总结中国现代化进程独有的历史经验并形成自己的现代化理论。随着第二次世界大战的爆发,革命成为当时中国社会的主要任务,“革命史范式”也成为历史研究的主流,国内现代化研究逐渐式微。二战后,西方对现代化理论做了全面系统地论述,正式形成了后来我们所熟知的现代化理论,这一理论迅速影响了世界多国的哲学社会科学发展。而1949年新中国成立后,中国共产党领导中国人民走上了一条崭新的社会主义现代化建设探索之路。由于经验不足,早期社会主义现代化建设整体上在曲折中缓慢前进。中国人民在思想上长期受阶级斗争理论的影响,国内阶级斗争热情空前高涨,“革命”成为人民生活的主题,革命史观在历史研究中也取得了绝对的支配地位,现代化研究几乎停滞。

(二)改革开放以后中国现代化研究的重启与突破

1978年十一届三中全会后,随着社会主义现代化建设目标的重新确立及现代化实践的不断深入,中国现代化建设探索出了一条不同于西方现代化发展的道路。因此,自20世纪80年代中期以来,与现实联系紧密的史学研究视角也从以往传统革命史范式转向现代化史范式,中国现代化研究开始重启并且获得了国家相关部门的大力支持,出现了多种形式的丰硕成果。北京大学罗荣渠将中国现代化进程纳入到世界现代化进程之中,在研究国外现代化各派理论的基础之上,运用马克思主义理论,力图构建符合中国国情的马克思主义现代化理论体系;华中师范大学章开沅主持了国家“七五”规划项目“中外近代化比较研究”,用比较现代化的视角,对中国早期现代化进程的各个层面,包括政治发展与变革、工农业和对外贸易、文化传承与传播方式、中外关系等重新给以探讨。二者从不同视角分析中国现代化,前者由世界看中国,后者由中国看世界,两相参照,互为补充(19)章开沅:《寻求历史与现实的契合》,林被甸,董正华编:《罗荣渠与现代化研究》,北京:北京大学出版社,1997年,第7页。。张琢创造性地提出了“九死一生”理论,反映了中国现代化发展乃至社会发展的历史机遇与现实曲折,并通过中西方现代化特点的比较对中国现代化做了中长期预测(20)张琢:《九死一生——中国现代化的坎坷历程和中长期预测》,北京:中国社会科学出版社,1992年。。虞和平对中国现代化进行了整体性研究,深入探讨了中国现代化历史进程的各种理论问题,尤其是对“早期现代化”、“传统与现代的关系”、“内因与外因”等理论通过中国现代化历程与马克思主义现代化思想融会贯通,推进了对中国现代化历程的认知深度(21)虞和平主编:《中国现代化历程》,南京:江苏人民出版社,2001年。。这些代表性研究成果在国内外产生了重要影响,为中国现代化史研究奠定了坚实基础。概而言之,在改革开放之后“现代化叙事”成为史学的重要研究范式。中国现代化研究在总结中国特色社会主义现代化建设的丰富经验的基础上不仅实现了“西化”论的突破,还通过对西方现代化理论的反思,确立了传统与现代二元互动的解释模式。

早期现代化作为现代化进程中的一个阶段,也是中国现代化研究的重要内容。自20世纪80年代以来有不少对各领域早期现代化的专门探讨。主要有章开沅和罗福惠主编的《比较中的审视:中国早期现代化研究》(杭州:浙江人民出版社,1993年)、虞和平的《商会与中国早期现代化》(上海:上海人民出版社,1993年)、周积明的《最初的纪元:中国早期现代化研究》(北京:高等教育出版社,1996年)、周建波的《洋务运动与中国早期现代化思潮》(哈尔滨:黑龙江教育出版社,2001年)、刘会军主编的《近代以来中外关系与中国现代化》(长春:吉林大学出版社,2006年)等等。这些研究成果以现代化视角探讨了近代中国社会发展的各个方面,开辟了诸多具有较强现代性的研究领域,丰富了中国近代史研究(22)虞和平:《中国现代化研究的解释体系和内容结构——由编写〈中国现代化历程〉而想到的几点体会》,《广东社会科学》2003年第2期。。教育现代化研究便是其中之一。20世纪90年代以来,受现代化理论的引入和中国教育现代化实践发展的双重影响,以现代化视角解释近代中国教育由传统向近代转变与发展也逐步成为教育史研究的学术范式,以浙江大学田正平及其研究团队为代表的学者开始以现代化视角解释中国近代教育发展历程,产出了“中国教育近代化研究丛书”、“近代教育与社会变迁丛书”、“中外教育交流史研究”、“教育交流与教育现代化研究丛书”等系列成果。其研究将教育史视为一种教育变革的历史过程,尤为看重教育机构、教育理论、教育制度、教育群体等变革主题在这一过程中的意义,并将其置于广阔的历史背景中加以系统分析(23)刘来兵:《视阈融合与历史构境——中国教育史学实践范式研究》,武汉:华中科技大学出版社,2013年,138-141页。,构建了教育现代化的解释模式,奠定了教育早期现代化研究的坚实基础并为后续诸多相关成果提供了解释模式的参考。

(三)新时代中国早期现代化研究的推进与创新

2012年党的十八大之后,在中国共产党领导之下,我国坚持以经济建设为中心,坚持改革开放,经济和国家综合实力实现了前所未有的快速发展,中国特色社会主义建设在这一时期迈入了从富起来到强起来的新阶段。既有的以西方现代化建设经验为蓝本的现代化理论已然不能覆盖世界现代化建设的全部过程和成果。中国式的社会主义现代化建设经验对以资本主义为核心的西方现代化理论体系也提出了挑战。因此,新的现代化理论突破是未来“中国式现代化新道路”发展的迫切需要。虽然以罗荣渠和章开沅为代表的学者在1980年代已经意识到西方现代化理论的局限性,但纵观目前中国现代化研究成果,总体上仍然缺乏系统性和理论原创性,尚未能真正形成比较成熟的马克思主义现代化理论学派。在当前史学研究中,我们必须立足中国现代化实践,深化中国现代化研究,对现代化的中国经验、中国道路和中国方案进行系统、全面的理论概括与总结,创造出以中国经验为内核的原创性“中国理论”(24)马敏:《中国式现代化新道路的历史演进及前瞻》,《历史研究》2021年第6期。。2021年7月1日,习近平总书记在庆祝中国共产党成立100周年大会上创造性地提出了“中国式现代化新道路”的伟大科学论断。这一论断对现代化的中国实践和中国道路进行了高度概括,同时也为中国现代化研究指明了新方向。

当代中国是历史中国的延续和发展(25)习近平:《在纪念孔子诞辰2565周年国际学术研讨会暨国际儒学联合会第五届会员大会开幕会上的讲话(2014年9月24日)》,《人民日报》2014年9月25日,第2版。。虽然,改革开放后40多年来的巨大发展和成功经验是中国式现代化道路最宝贵的财富,也是当前中国现代化研究需要继续深入的重点。但是,中国式现代化新道路是在近代以来的早期现代化尝试及改革开放后中国式现代化道路共同作用下发展的。即便真正意义上的中国现代化建设是在改革开放后才逐渐展开的,近代中国社会的改良与自救措施也导致了某些现代化因素的出现与成长,它们对于中国现代化道路也有着不可忽视的影响。因此,研究中国式现代化必须回溯历史,了解中国式现代化的来龙去脉,通过对新中国成立前后不同时期中国现代化道路的历史回顾与纵向比较,厘清中国式现代化道路的历史起源和相关特征,才能从根本上真正认识中国式现代化(26)马敏:《中国式现代化新道路的历史演进及前瞻》。。

从前述内容来看,传统人文研究下,中国早期现代化乃至现代化研究都取得了很大的成绩,不论从宏观的全局把握,抑或是对区域个体已有相对深入且充分的探讨。现代化研究吸引了来自经济学、政治学、文学、社会学等多领域学者从不同学科视角进行阐释研究,已然成为一种多学科的协同研究。历史学家通过与其他学科对话,不断开拓研究视野、融合研究方法,转换研究角度、更新研究手段,研究成果受到了多学科专家的认可,产生了巨大影响。这也为促进文科学术视野和研究范式转换,推动文科研究内容与方法的融合创新提供了有益的实践借鉴。

近年来,随着数字人文在史学领域的发展,数字技术的发展和研究方法的创新也为早期现代化研究带来了新生机。从史料上来看,以往历史资料难以获得在当前数据库蓬勃发展的基础上已十分便捷,有利于我们更为广泛搜集相关史料。而受数字人文理念的影响,近年来学界对于历史数据的整理也更为重视。以国家图书馆为代表的出版机构推出了一系列历史调查及统计资料,其中包括民国时期社会调查、经济调查、教育统计、司法统计、国情统计、经济统计、社会统计资料等等。这批资料大致包含了清末至民国以来官方及民间团体对现代化过程中的工业、商业与贸易、人口、金融、财政与物价、气象与水文、文化及教育等诸多方面的统计。它们的集中出版为进一步引入定量研究方法,结合量化指标的“科学性”、“客观性”、“可比性”等,为既有中国早期现代化史研究进行补充提供了可能。从技术手段上来讲,随着计算机技术的发展,众多数字分析工具有利于我们更好地处理大规模史料,而在数据库基础上采用量化工具,对于分析大规模的系统性、连续性历史材料非常有效(27)梁晨、董浩、李中清:《量化数据库与历史研究》。。这使得我们能够通过这种方式更加系统地、细致地看到不同时期现代化进程的历史关联,并且可以进行有效对比。

三、数字人文视野下教育早期现代化研究的设想

基于以上诸多研究成果的梳理,可以看到20世纪80年代以来现代化研究重启后,学界对于中国早期现代化的丰富内涵已有一定的认识。中国早期现代化历程经历了现代化的准备阶段和向现代社会过渡的阶段,在这一历程中传统与现代之间出现了新、旧质素之间错综复杂的关系与彼此冲突、消长、沟通、融合的过程(28)李俭主编:《新范式和新史学——虞和平与中国近代史研究》,郑州:大象出版社,2018年,第104-105页。。同新中国成立后的现代化相比,中国早期现代化呈现出更加复杂的面相,其特点很难通过特定时段及特定领域的个案研究进行总结。因此,在传统定性研究中,关于中国早期现代化的特点总有不同的断论。而数字人文研究中量化数据库的开发与研究对于补充和进一步深入早期现代化研究颇有优势。

首先,量化数据库能有效利用大规模材料。量化数据库所需要的数据通常是系统化、结构化的资料,中国早期现代化史具有相当丰富的数据基础。鸦片战争以后,随着西方统计理论和统计方法传入中国并被国人逐渐接受,自19世纪末开始,国内开始出现科学的、系统的统计数据。民国以后,国内逐步建立从中央到地方的统计组织,推行统计法制,并应用欧美的统计理论和方法,形成了一批涉及人口、农业、工业、国际贸易、物价调查和物价指数、教育、社会及卫生等统计数据。这些统计调查数据数量巨大,范围极其广泛,内容也极为丰富,具有很高的史料价值。以教育统计资料为例。我国最早的教育统计源于光绪三十二年(1906)由学部支持的调查统计,当时由学部总务司案牍科兼办统计工作,故有清末三次教育统计图表留世。民国建立后,教育部即在总务厅设置统计科管理统计事宜,但不久后即因减政被裁撤,统计事宜改由文书科兼办,1918年又恢复旧制;1927年南京国民政府成立后,全国教育文化事业统归大学院管理,调查统计工作归文化事业处处理;1929年大学院改为教育部,在总务司专设统计科办理教育统计工作。此后,随着战争爆发,政府财政紧缩,教育部统计科被归并,统计工作改由各司处兼办;1935年后教育部总务司统计科仍行恢复,但规定各种统计工作仍由各司处兼办,关于统计行政事务,则归统计科办理。

民国教育部下设总务司、高等教育司、普通教育司、社会教育司、蒙藏教育司、秘书室、督学室、参事室等,各司室均有专人兼办统计工作。其中高等教育司办理全国公私立大学独立学院及专科学校统计,国外留学统计,全国学术籍贯及学术团体统计,每年度由教育部将调查表格直接交由各校级机关团体填报;普通教育司办理全国中等教育及初等教育统计,中等教育统计内分为中学、师范学校、职业学校三种,每年度由教育部拟定各种调查表交由各省市教育局仿印后分发给各县市教育局或县政府转饬各校填报;社会教育司主要办理全国各种社会教育机关统计,包括一般社会教育机关如教育馆、图书馆、美术馆、体育场等,以及学校类社会教育机关如民众学校,农业、工业、商业等补习学校及聋哑学校等,每年度由教育部拟定各种调查表格交由各省市教育厅局印发各县市,再行转发各机关调查填报(29)王万钟:《统计消息:教育部统计组织及事业》,《实业统计》1935年第3卷第2期。。由此可见,民国时期教育统计大都通过通讯调查的方式,其调查结果及数据质量亦参差不齐,在利用时需要加以甄别。

从现存民国教育统计调查的统计对象看,基本包含有高等教育、中等教育、国民教育和社会教育等内容,其中高等教育统计内容较为详细,中等教育、初等教育和社会教育调查内容较简单。从统计时间上看,主要集中在1928—1940年之间,其中1928年至1935年间统计数据较为完整,包括高等教育、中等教育、初等教育、社会教育等全国和各地方调查报告;其中地方性统计调查报告较零散,时间连贯性及地区完整性不足,南方地区尤其是上海、南京在内的江浙地区的统计数据相对较丰富,北方地区数据较少,其中北平、河北等省份数据较多。从统计内容看,高等教育统计对象包含全国专科以上学校、国外留学者和学术机关及团体,统计内容涵盖以上机构及团体的概况,中等教育统计对象为各省市公私立中等学校,统计内容包括各省市学校数量及类型统计,学生及教师基本概况,学校财政情况等;初等教育统计对象包括各省市公私立初级小学及幼稚园,统计内容包括在校学生人数及性别比例,教职工概况,各学校经费情况等(30)王燕来选编:《民国教育统计资料汇编》,北京:国家图书馆出版社,2010年;王燕来、谷韶军编:《民国教育统计资料续编》,北京:国家图书馆出版社,2012年。。战时由于政局不稳,国家教育受到了严重影响。因此1936年后,各省市教育统计工作也受到波及,统计内容也发生了变化。战时教育统计内容新增战事以来全国专科以上学校之变迁、战区专科以上学校生员之救济、战区中小学教职员之救济、战区社教工作人员之救济以及战后各级教育之救济经费等内容(31)《教部发表战时各项教育统计》,《总汇报》1939年11月13日,第4版。。

教育统计对于当时当地教育事业之发展有着密切的关系。其任务“不仅在表现数字,为事实之纪载,并在着眼分析、综合、比较,以观察其间变化之状况,与因果之关系,而为研究并确定教育方针之资料”(32)郑贞文:《教育与统计之关系》,《福建省统计时报》1935年第1卷第5期。。因此,系统整理近代教育统计资料对拓宽我国早期教育现代化的研究路径十分重要。基于教育统计数据,我们可以构建“近代教育统计数据库”,帮助我们将庞杂的数据通过数据库集合起来以便充分利用。

在具体史料选择上,我们从目前已经结集出版的《民国教育统计资料汇编》、《民国教育统计资料续编》出发,结合民国教育调查报告,通过获取民国各地区教育发展概况的结构化数据,例如某地区学校总数(小学、中学、民众学校等数量)、学生总数(包括小学、中学私塾、民众学校中男女生学生数量)、教育经费岁入岁出、学校教职工人数(小学、中学私塾、民众学校中男女教职员数量)等。在数据库构建过程中将中其解构成单个变量,从而形成具有一定规模和时间跨度的数据集。在进行数据甄别和选择时必须严格遵循史料的真实性和客观性,对不同数据来源进行标注,以便后期分析阐释。这与传统史学研究对史料进行考据的观念也是一致的。同时,这种结构化数据库的建立,可以达到传统研究难以企及的史料规模,不论是从时间跨度还是空间跨度而言,该数据库都能突破个体研究者的局限,帮助研究者宏观把握早期现代化过程中教育状况的全貌。

其次,量化数据库可以实现不同材料间的链接,通过分析软件,发现传统阅读无法探知的新知识和新现象(33)梁晨:《量化数据库:“数字人文”推动历史研究之关键》,《江海学刊》2017年第2期。。如前文所述,教育事业的发展十分复杂,多种类型的统计数据仍需进一步归纳成系统的指标才能宏观把握每个时段教育发展之状况。过去这些社会调查及统计数据散见于各处,缺乏系统整理,但是已有部分学者注意到其重要价值并将其有效地利用在学术研究中,并在此基础上通过指标体系的构建对这些数据进行条理性整理分析。例如虞和平曾提出通过工业化程度、国民收入状况、城市化和人口素质等指标体系的构建和分析,呈现近代中国现代化概况;马敏、陆汉文等通过经济指标、城市化指标、交通指标、人口与社会保障指标、家庭与妇女发展指标、社会组织与公共秩序指标、新闻出版指标、教育指标、价值观指标等内容构建了社会发展指标体系,探讨民国时期社会发展水平的实际状况。上述研究都注意在定性研究的基础之上,利用民国时期调查和统计资料加以定量分析,提高研究成果的科学性和准确性,也为我们深入中国现代化史研究提供了借鉴。但整体而言,囿于史料体量及数字分析技术的局限,这些清末民国社会调查的“整体的史料价值乃至学术认知价值,迄今为止,也还没有得到学界足够的认识和应有的重视”(34)黄兴涛、夏明方主编:《清末民国社会调查与现代社会科学的兴起》,福州:福建教育出版社,2008年,第5页。。

就现代化史研究而言,虽然上述学者在早期现代化研究中提出构建现代化指标体系展现了对于长时段、整体史研究的关照。但在当前大数据时代下,“长时段”概念已经发生了转变,美国学者乔·古尔迪也认为我们这个时代独有的大数据资源使长时段研究已经不同于最初的设定,新的长时段是具备多种选择的学术生态背景下萌生的(35)乔·古尔迪、大卫·阿米蒂奇:《历史学宣言》,孙岳译,上海:格致出版社/上海人民出版社,2017年,第9页。。同时,随着史料种类及范围的扩充和数字分析技术的进步,早期现代化史研究可利用的史料也发生了变化。因此,运用清末民国社会调查和统计资料构建量化数据库,在此基础上通过结构化数据统计描述,反映近代以来中国现代化过程中不同历史时期、不同区域、不同领域的历时性变化,以真实客观的数据反映中国现代化的发展水平与艰难历程,用事实和数据证明中国共产党带领中国人民从新民主主义革命、社会主义革命到社会主义建设的探索及改革开放所取得的伟大成就,对于深化早期现代化史研究很有意义。

关于教育早期现代化指标体系,学界也已有诸多尝试。马敏等在构建民国社会发展指标体系中将教育指标作为反映文化教育与心理状况的重要指标之一(36)马敏、陆汉文:《建构民国时期(1912—1949)社会发展指标体系的几点思考》。。通过考察教育经费占国民生产总值比重、新式教育人数占受教育人数比重、识字人口占总人口比重、适龄青年受高等教育和中等教育比重等4项指标概括民国教育事业的发展状况。耿之矗以传统为对照,以西方发达国家的教育为指向,以中国教育实践为依据,提出了一套近代教育现代化指标体系(37)耿之矗:《近代教育现代化指标体系探索》,《教育评论》2013年第2期。。通过保障标准、实践标准、成就及影响标准等三类一级指标考察近代教育的现代化发展。然而,教育现代化实质上是十分复杂的,教育发展离不开政治、经济、社会等各方面的协调发展。在数字人文兴起,大数据和人工智能手段更为进步的当下,量化数据库之间的互相链接可以帮助我们构筑一套更为有效反映早期教育现代化发展的指标体系。例如,我们拟构建的“近代教育统计数据库”可以与同时期人口调查数据库进行匹配,帮助我们了解民国时期教育发展程度;还可通过与相关的GIS项目合作,获取地理数据,深入理解全国不同区域学校的具体分布;此外,该数据库还可与“民国大学生信息数据库”进行匹配,理解中国教育现代化过程中的公平性及教育获得的情况等。

因此,基于以上数据库构建的设想,结合目前教育现代化指标体系构建的基本情况与近代教育发展状况,我们拟尝试构建一套适用于中国早期现代化时期的教育现代化指标体系,主要包括:(1)教育机会与保障指标:教育是一个人基本的权利,教育现代化的一个重要的体现是满足所有人接受教育的权利。受生产力发展不足和传统文化影响,古代社会教育尤其是学校教育具有明显的阶级性,社会教育更加稀缺。教育现代化最重要的内容即包含教育的世俗化、普及化、民主化、多元化。因此,通过统计各省市县学校的数量及各类学校的占比、学生人数占总人口的比重、男女学生比例、留学生占比、教职工人数及师生人数比等作为教育机会与保障指标的主要内容。(2)教育投入与管理指标:教育发展离不开政府对教育的投入与管理。在本项指标内,我们拟从财政性教育经费的投入占国民生产总值的比重、学校的岁入与岁出比、课程体系及教育制度等方面进行考察。(3)教育质量及效益指标:近代以来教育改革对传统社会影响颇深,但由于近代以来国内战乱不断,教育质量及效益在各阶段有着不同的表现,因此,我们通过对识字率、毕业生情况、精英人才的相关调查等指标考察教育质量及效益,等等。

通过以上数据库和指标体系的构建,不光能深化传统定性研究中重点关注的教育群体、教育机构乃至教育制度的研究,加深对上述主体为研究对象的理解,同时还能很好地将教育早期现代化研究纳入到现代化研究的叙述体系中,将其与中国早期现代化过程中其他领域的发展进行横向比较(38)我们目前正在构建“中国现代化进程历史大数据库”,拟将与中国现代化有关的经济、社会生活等内容纳入到数据库中。在建子库包括“中国商会数据库”、“中国近代教会大学数据库”、“中国博览会数据库”、“中国近代宗教统计数据库”、“近代教育统计数据库”等。,深入理解中国早期现代化发展历程。

四、结语

数字人文浪潮使历史学面临着前所未有的冲击。研究方式、研究内容乃至问题意识的转变促使史学研究者不得不重新思考大数据时代数字史学的发展趋向。中国现代化研究是史学研究传统命题,在新时代背景下被赋予了重要使命,历史研究者需要以自身实践为本,充分发挥自身学科优势和研究专长,勇于尝试发掘数字人文视野下传统命题的新生机。

教育现代化是一个不断发展的概念,早期中国教育现代化的标准与现阶段现代化有明显的不同。我们通过构建早期教育现代化指标体系,试图将其与当前教育现代化指标体系进行一定程度的衔接,以期能从宏观层面整体地、科学地、准确地、客观地,勾勒出近代以来中国教育现代化的变化与发展。教育现代化是中国现代化最重要的组成部分之一。中国式现代化发展道路留存下了丰富史料和数据,当前数字技术的不断成熟和数字人文领域研究方法的创新,使现代化研究相关的史料规模、史料呈现方式及史料方法都与传统人文研究呈现出不同的特点。

猜你喜欢

人文现代化数据库
美在山水,魂在人文
最朴素的人文
基本实现现代化需要补足哪些短板?
《农业现代化研究》第五届编委会
中国现代化何以起飞和推进
——评《中国现代化论》
数据库
人文社科
数据库
数据库
数据库