APP下载

数字化史料的构成及其价值意义

2021-12-04张晓校杨梦宇

北方论丛 2021年5期

张晓校 杨梦宇

自第22届国际历史科学大会提出“历史学的数字化转向”议题以来(1)玛丽亚塔·希耶塔拉:《历史学的数字化转向》,《世界历史》2016年第1期。依笔者理解,“历史学的数字化撰写”是长久以来国外学术界热议的人文科学“计算转向”(Computational Turn)的回应(David M. Berry, Understanding Digital Humanities, Palgrave Macmillan,2012,p.39.)。 “数字化史学”是数字人文的结晶,数字人文“是一个研究、探索、教学和创意的领域,涉及计算和人文学科的交叉”(Matthew K. Gold, Debates in the Digital Humanities, University of Minnesota Press,2012,p.4.)。还有西方学者把数字人文表述为:“一个学者们运用计算机技术探索传统人文问题的焦点学科。”(Matthew K. Gold, Debates in the Digital Humanities, University of Minnesota Press,2012,p.12.)根据这些议论,“数字化史学”应与交叉学科的意义联系在一起。,国内史学界一直关注数字化史学及其进展。数字化生活的帷幕已经开启,依靠数字化技术生成的资料资源(以各种专业数据库为代表)为扩大学术交流,促进学术发展提供了强大支持。其中,与“数字人文”“历史学的数字化转向”关系密切的是数字化史料的生成。数字化史料对于数字化史学意义特殊,研究数字化史学,应从数字化史料开始,数字化史学是建立在数字化史料基础之上的;只有实现了史料的数字化“转向”,历史学的数字化“转向”方能完成。就“数字化史学”发展线索而言,数字化史料是“历史学的数字化转向”的“先行者”。

数字化史学及其缘起,与电子计算机为代表的信息技术发展有直接关系。20世纪80年代,年鉴学派历史学家雅克·勒高夫在讨论“当代对记忆的颠覆”时,专门强调了计算机对于“历史的进程起到了巨大的推动作用”,“史学经历了一场真正的文献革命……档案记忆已被一种新兴的记忆所颠覆”[1]103,104。今天,勒高夫所言“文献革命”通过数字化史料得以确证,“新兴的记忆”说明的是对历史记忆、记载的表述不再囿于传统模式,揭示了史料的“新兴”意义,有助于我们对新型的数字化、无纸化史料价值的认知,体悟“数字人文”的背景下,数字化史料的“转向”在助力历史学“数字化转向”中发挥的重要作用。

一、史料数字化

与纸质文本史料为主的传统史料比较,数字化史料“海纳百川”,容量巨大,彰显诸多特长,正在成为或已经成为历史学书写的主打资料,已在历史学某些专业领域大展身手。名目繁多的无纸化电子文本、数字化资料日益渗入历史学研究实践,数字化史料及其各种电子文本,从无到有,从小到大,其中很大一部分由历史学传统的基础资料生成。历史学学习、研究实践中,颇受青睐的数字化史料是从史料数字化开始的:先有史料的数字化,后有数字化史料,数字化史料是建立在史料数字化基础之上的。

所谓史料数字化指的是,利用数字化技术,对传统意义上的以纸质文本为主的史料载体的原初形态、外在形式进行(扫描)加工、整理、复制、压缩,使之成为电子计算机等仪器设备存贮的信息,生成了与传统史料存在方式、阅读方式、储存方式截然不同的史料——“数字化了”(Digitized)的史料。“数字化了”的史料运用数字化技术,对流布已久的(纸质)史料文本二次加工、整理,使之转变为数字化文本、电子文本,成为电子扫描和镜像版史料,与文本原始内容一致,只是外在形态发生了改变(2)美国学者认为,“数字化了的(digitized)”指的是那些纸质、胶片等载体转换成为数字化形式的载体。Christine L. Borgman, From Gutenberg to the Global Information Infrastructure:Access to Information in the Networked World, The MIT Press., Cambridge, Massachusetts,2203, p.64.。包括历史学资料在内的“大多数人文学科的数字资源均始于数字化阶段”[2]47,即数字化史料的前期必经阶段。“数字化了”的史料与传统史料文本的最大差异是,外在形态发生了根本性改变,成为电子产品、数字化产品,变身“新兴的记忆”载体,堪称史料载体、媒介的革命性变革。比较“未被数字化”的史料,“数字化了”的史料完成了向数字化文本、电子文本的过渡。史料数字化不仅仅是一般意义上的外在形态的加工乃至升级,而且以“无纸化”形态在虚拟空间储存,可在互联网上传播,用途多样化[3]64。言及“数字化了”的史料,人们一直对其种种优点津津乐道:搜索快捷精准、便于携带和保存、体积小容量大、“光速”的网络传播与传递等等。然而,除了能够体验或经验的、人们耳熟能详的优长之外,更有对历史学发展的内在影响。讨论和关注(已有)史料数字化便捷、多样性、多元化等基本问题或基础性研究可圈可点,但这些表象背后的深层次问题,如对历史学发展进步的助力,如何从传播学意义上解读史料数字化对历史学改变性作用等等,既是史学界关注的重点,也意味着研究走向深入,走向具体的新的领域。史料数字化外在形式、载体变化显而易见,但内在含义远非单纯技术层面的电子化、信息化、数字化,催生新的方法,产生新的思想是可期可待的结果。

史料数字化的优势、特长克服了纸质文本史料某些缺陷、不足。数字化技术把浩如烟海的纸质文本传统史料,通过数字化压缩、编码,制成玲珑的光盘,带来的便捷人们赞誉有加。《四库全书》、“二十四史”不再是价格昂贵,占据浩大物理空间的卷帙浩繁的纸质巨著,拥有者、阅读者大幅度增加。远不止于某些史料巨制的光盘版、数字文本的问世,互联网、数据库、“云盘”中各种史料数字化文本,很大程度上更改了人们的阅读与书写的习惯,电子书写、数字化阅读深入日常生活。数字化拉开了新的生活模式的帷幕,开启了历史学学习、书写的“无纸化”时代。不同类型的数据库、数字化图书馆(线上图书馆(3)有西方学者认为:“实体图书馆将被数字化图书馆取代,图书管理员将被数字化图书馆管理员所取代。”(Christine L. Borgman,From Gutenberg to the Global Information Infrastructure:Access to Information in the Networked World, The MIT Press., Cambridge, Massachusetts,2003, Preface.)此种观点未免有些“危言耸听”,但却揭示了数字化的某些“难以抗拒”性,“图书馆无处不在”(Anne Burdick, Johanna Drucker,Peter Lunenfeild, Todd Presner, Jeffrey Schnapp,Digital_Humanities, MIT,2012.p.95.),在数字化时代成为现实。、阅览室)、档案馆、博物馆已“司空见惯”[2]47,成为历史学工作者挖掘史料的“富矿”,寻觅乃至跨国搜集为我所用的资料,是大多数历史学工作者的日常工作。世界史研究领域,数字化文本利用率、使用率绝对不低于纸质文本。历史学各个学科专业领域,数据库给世界史研究学习带来影响和推动前所未有。据统计,“国内主要图书馆购买的以及可免费利用的外文专业数据库资源,已超过千种。这些数据库就文献类型而言,可分为图书、期刊、学位论文与会议论文、报纸、档案、统计资料、报告、书目与文摘、图片、音视频等。就收入内容而言,历史学涉及史学理论、世界通史与断代史、地区国别史(涉及70个左右的国家)”[4]。各种数据库中的数字化史料,对世界史研究、学习产生了积极影响,提供了前所未有的资料资源,世界史学研究的进步很大程度得益于数字化资源。尤其是从前很难读到,几无可能更多人读到的(各种语言的)史料,因史料完成了数字化,普及率、阅读率大幅度提高,世界史研究质量同步提升。正因如此,有学者充分肯定史料数据库助力世界史研究:“我们已经很难想象,如果没有诸如JSTOR、Gale等数据库,世界史研究在中国的学术语境下如何展开。”[5]中国史研究同样得益于数据库及其“数字化了”的各种史料,而且中国史的史料数据库建设的规模、速度、种类等,世界史望尘莫及。正是由于史料数字化,历史学工作者有了更多机会,接触到了“前数字化时代”无法接触的原始资料和其他学术成果,阅读范围、阅读效率和数量有较大提升,对历史学影响之积极有目共睹。人们不得不感叹:“虽然互联网传输数据还不到半个世纪,万维网也只是90年代方才问世,但思考它们‘生产’的大量数据却令人惊诧。”[6]37

各种纸质文本史料、传统史料的数字化,是“数字人文”的一部分,体现的是“乘船出海”的逻辑——借助数字化技术的发展,是蓬勃向上的数字化生活在历史学领域内的具体呈现。数字化史料发展速度快,传播范围广,普及程度高,为“前数字化时代”无法想象。在数字化浪潮强势推动下,纸质文本为载体的传统史料,大多数完成了向数字化的华丽转身,传统史料同纸质载体第一次发生大规模分离,质量数量显现出超越性态势。时下,越来越多的纸质文本“被数字化”,各出版商主动顺应数字化时代潮流,出版纸质文本(史料)的同时,推出数字化版本(如“四库全书电子版”)。各种纸质文本史料的数字化,得到了出版界、历史学界的支持和认可。尽管有人声称阅读数字化史料文本,缺乏阅读纸质文本的厚重感觉,但丝毫没有影响使用者的数量与日俱增。宣称历史学研究“须臾离不开”“被数字化了”的史料,难免夸大其词,但史料数字化无可逆转的潮流却是不争的事实。史料数字化的外在形态颠覆了传统史料的概念,为古老的历史学注入了活力,尤其是史料的搜集与获得堪称巨大飞跃,更为后续的数字化史料做了成功的铺垫。

二、数字化史料的构成

史料数字化——“数字化了”的史料属于数字化史料的一部分,但与数字化史料相比是“被动”“被加工”的,即原有、已有各种史料“被”数字化,是现成、既成史料的“二次加工”或复制,是传统史料的无纸化、“非纸化”。数字化史料不仅包括已有“数字化了”的史料,也有许多“原创”性较强的史料;即除了“被动”的、已经“数字化了”的史料外,另有一系列“主动”的、借助数字化技术生成“创造”的、新增加的各种新型新兴史料,数字化史料“家族”完善、浩大。如果把史料数字化比作“新瓶装老酒”,那么数字化史料这一“新瓶”中,既装“老酒”——“数字化了”已有、既有史料,又盛着“新酒”——某些“原创”、带有较多“创造性”的各种史料。

从数字化史料生成脉络而言,前期大规模完成的史料数字化是数字化史料的先行实践,是数字化史料的基础组成部分。在边界极大拓宽的数字化史料“家族”中(4)涉及“数字环境中各种新兴工作能够也应该跨越现有的知识边界……”(Matthew K. Gold, Debates in the Digital Humanities, University of Minnesota Press,2012,p.455.)的议论,说明数字化时代知识的边界已经不是难以逾越鸿沟。,作为“新成员”的新型与新兴数字化史料值得关注。其中有的是“狭义”的史料——出自专业、职业历史学家之手,直接、纯粹用于历史学研究的各种资料,注入了历史学专业工作者的理性和自觉。纸质文本、“非纸质”文本资料(影像、音频等作品)兼而有之,史料边界较为清晰。有的则是“广义”的史料——出自专业与非专业、职业与非职业历史学工作者之手(创作和“制作”主体多元化),以“非纸质”资料信息为主,比“狭义”史料的边界更加宽泛,佐证的是柯林伍德“一切皆可作史料”[7]49。某种意义上说,史料数字化涵盖的主要是“狭义”的史料,数字化史料则“无所不包”:“狭义”的史料和已“数字化了”的传统史料,各种名目的现代信息技术特征鲜明的、可用于历史研究的资料等。数字化时代,和“狭义”的史料相比,“广义”的史料囊括甚多,人类的声音和影像、思想和行动、生活和文化、各种社会活动等等,全部被数字化,均成为无纸化文本的数字化史料(5)数字史料整体上是对传统的超越,比较典型的事例是“数字艺术、建筑、音乐、电影、戏剧、新媒体,以及相关各个领域”(Matthew K. Gold, Debates in the Digital Humanities, University of Minnesota Press,2012,p.43.)。数字化对传统史料外在形态的改变,是数字化技术的加工过程和结果。。而且数字化史料是一个开放性系统,历史学家关于“现在物理世界中的一切事物都是对过去的证据”(6)[英]沃尔什著,何兆武、张文杰译:《历史哲学导论》,广西师范大学出版社2001年版,第80页。有关数字化史料中新“成员”的“证据”属性,历史学工作者早已习以为常的各种实物史料证据,能从另一个侧面证明这一点。比如,旧石器时代粗陋的石器,某某朝代的衣服,某个历史时期的生活用具等等(实物史料),都垂直地反映出所在时代的风貌。据此,当下各种数字化媒体生成的作品成为历史证据并不意外。的论述,坚定地支持了“广义”史料的概念。

一般而言,数字化史料大略由如下三部分构成:

第一,兼有“完成时”“进行时”特点的数字化史料。遍布互联网与历史学相关的网站(如专门的历史专业网站网址)及其一直处于更新状态的各种信息资料、(专业和非专业)数据库,特别是那些专门的解密档案数据库等等。其中的“完成时”以各种专业数据库、大数据、数字化图书馆(7)数字化图书馆除了各种电子图书、“被数字化”的图书文本之外,还包括各种数据、静态或动态的声像资料等。(开放性图书馆)和(线上)档案馆、博物馆、一系列已经“被数字化了”的传统纸质文本史料为主,成为数字化史料不竭之源。“数字化的资料来源范围范畴广大,包括图书馆、档案馆、博物馆的各种馆藏和个人收藏,还包括(但不仅限于)书籍、手稿、地图、照片、摄影幻灯片、乐谱手稿、木刻版画、素描、油画、考古遗址、考古发现设计图纸、建筑插图、设计规划、文件信件、报纸和纸草”等[2]48,可谓应有尽有,史料价值毋庸置疑。当然,还应侧重关注的史料“集散地”是图书馆。今天,许多“图书馆已经将数以百万册的藏书数字化,并通过互联网服务开放馆藏,让拥有数字化授权的公众利用这些藏书。一些档案馆也步其后尘,放宽了使用限制”[6]46。所谓“进行时”,则主要指各种名目的学术网址网站的与历史学研究、学习关系密切的信息资源“在路上”——不断充实,持续扩大,以及前文提到的出版界不断推出、配套推出的各种图书的数字化版本,尤其是数字化出版方兴未艾(8)例如:商务印书馆建有数字出版中心,一些大学出版社也紧跟潮流,建有数字化出版中心,如中南大学出版社数字化出版中心等。许多出版单位将数字出版视为产业升级的重要选择,设置数字出版部门是对时代潮流的回应。,数字化史料的出版络绎不绝,所占出版比重日益加大,数字化史料获得了永不枯竭的 “源头活水”,始终处于“进行”状态(9)西方学者认为:“电子出版将变得更加举足轻重,但仅限于服务于特定目的的某些资料。”(Christine L. Borgman,From Gutenberg to the Global Information Infrastructure:Access to Information in the Networked World, The MIT Press., Cambridge, Massachusetts,2003, p.2.)但那些用于学术研究的各种资料,电子出版物一直呈增加势头。。在数字化史料结构中,属于“完成时”“进行时”的数字化史料是所有数字化史料的基础,是率先完成的“数字化了”的部分,以“狭义”史料所占比重较大,是颇受欢迎、利用率比较高的数字化史料。

第二,“过去时”“现在时”特点同时具备的数字化史料。主要包括各级政府和部门、公私单位、产业门类、学校教育等,在互联网公开的各类报告、统计数据、重大事项公布、各种(官方公布)财政预算和支出等方面有史料价值的数据资料。这些信息数据滚动发布,内容日新月异,相关数据库亦随之(最大限度地)充实更新。数字化办公和电子政务公开背景下,诸多过去的纸质文本(公开的官方文件、公文)被数字化文本取代,某些属于政府颁布的重要数据、统计数字类资料资源,查找纸质文本并不方便,互联网却能够随时随地满足查阅、搜集需求。许多政府部门推行数字化办公,信息资料在互联网上获得十分常见。互联网所刊载发布的资料,包括全新、即时性内容,还涵盖了许多“已发布过”的数据信息,从“过去时”“现在时”两个方面提供信息资源、史料资源。除了各个网站、网址的信息资源、资料资源外,以电视为主角的大众传媒和一些官方非官方网站网址,公私微博刊载、发布的新闻类信息,各种微信推送,其中包括大量声音影像资料(10)20个世纪90年代,英国历史学家艾文斯曾经指出:“广播、电影、录像放映机、摄像机、影印机、缩微胶卷、传真机、电子数据库(electronic database)、因特网和全球宽带联网(World-Wide Web),对未来历史学家来说,都是一种新形式的资料源”。[德]德罗伊森著,胡昌智译:《历史知识理论》,北京大学出版社2006年版,第18页。,史料内容更加丰富。这些资料信息今天是“现在时”,明天就是“过去时”——顺理成章地成为史料。但此类史料中的一大部分“广义”史料特点突出,是数字化史料开放性的表现。在此,应特别关注大数据资料价值,“如今,我们生活在大数据时代,从人类基因组编码到各级政府机构每年发布的数字的各类报告,可谓无奇不有、体大类杂”[8]110-111。所以,无论过去,还是现在,大数据彰显“庞大”“巨大”特征,是数字化史料重要组成部分,是历史学工作者着意利用的史料。

第三,凸显“未来时”特点的数字化史料。具有“未来时”特征的数字化史料,大多数属于“广义”的史料范畴,即眼下暂时尚未被人视为史料,而日后作为史料没有争议的信息资料,姑且称为“未来时”的史料。这些资料主要来自名目繁多的全媒体、自媒体、微媒体、融媒体等多种新媒体拍摄、录制的新闻影像、音频视频,公私微博发布的信息,微信中手机有意无意之间的抓拍,乃至遍布街头巷尾的“天眼工程”,以电视为代表的大众传播媒体等,构成了来源宽泛的、层出不穷的资料信息源,属于数字化史料中的新型新兴史料——“与生俱来”的数字(11)此处的数字化是Digital而非Digitized。史料。这些对现实生活的“实录”,相当一部分用于社会治理或社会管理,但却是日后研究社会史、生活史不可多得的珍贵资料,某些影像资料成为重大社会、历史事件的“拐点”“关键点”亦不足为奇。其中,电视传媒播报的各类新闻值得特别提及。“昨天的新闻就是今天的历史”,同理,“今天的新闻就是明天的历史”。新闻信息的史料性向来为人们所重视,大众传媒中的新闻以声像为主,记录了饮食男女、风俗民情、社会自然、各种变故、天文地理等,为日后研究历史难得的第一手资料。凡此种种,一系列属于新型新兴史料“未来时”特征明显,“原创性”强,尤其那些未经加工整理的资料,堪称原始信息(数据)(12)这些信息是“天生数字”(born digital)的、在多种语境中的数字化史料(David M. Berry, Understanding Digital Humanities, Palgrave Macmillan,2012,p.2.),属于“广义”的史料。,未来研究历史时援引这些信息资料,“第一手”属性似不会存在争议。这些信息资源数量巨大,多侧面反映出人类社会生活容量的增大,以及数字化生活对方方面面的影响。关于如何界定这些信息资源的史料性,有人提出疑义。前文所及柯林伍德“一切皆可作史料”的论述,实际上是“一切能够佐证历史的资料都是史料”的另一种表达(13)前文所说“广义”的数字化史料系统的开放性,主要通过第二类第三类数字化史料表现出来。。此类信息资料出自各行各业,创作(制作)者来自四面八方,难以用专业素质标准衡量,但“原汁原味”的原始性,用作证明历史的证据有可信之处。

以上三类史料及其“成员”是数字化史料“基本构件”,各具千秋,与传统史料、“数字化了”的史料不同之处是,数字化史料包括许多传统史料中不曾包含的内容或成分,如各种原创、创作的音像、音频、视频、传真照片等信息资料(14)学术界有“视觉转向”(Melissa Terras, Julianne Nyhan, Edward Vanhoutte, Defining Digital Humanities : A Reader, Ashgate,2013.p.179.)之说。所谓“视觉转向”实际上包含了阅读方式的变化,即对史料阅读不止是书面文字阅读,更有伴随数字化技术生成的图像、影像、视频等方面的阅读。。诚然,传统史料也含有一定数量的影视、影音、图像等资料,但所占比重寥寥。数字化时代的各种影像影音资料技术含量高,清晰逼真,作为“新兴的记忆载体”——新兴新型史料,会在未来的历史研究中发挥超出书面文字的作用。一系列数字化技术特征鲜明的“非书面的资料”[9]382成为史料家族、大数据的“新成员”,拓宽了史料的边界,史料获得空前的扩充。和传统史料样态相比,数字化史料内容丰富多彩,生动形象,“声情并茂”,是对传统史料质和量的超越性进步,是时代特色鲜明的“新兴的记忆”。数字化史料作为“新兴的记忆”载体,记忆功能的形象具体,为传统史料望尘莫及。正是拥有了这些独到的优势,数字化史料发展迅速,在“历史学的数字化转向”过程中发挥了重要作用。不妨认为,历史学的数字化转向,应从史料的数字化“转向”开始。

三、数字化史料的意义

数字化史料是历史学“转向”数字化的初期实践(15)许多数据库最初是把纸质文本电子化,之后扩展到电子文本。,构造的是历史学向数字化过渡的直达路径。数字化史料数量呈几何级数增加,定会促进历史学向数字化“转向”的跃迁。西方学者论曰:“数字化人文不应当全部是数字”[10]vii。同理,数字化史学也绝不是全部史学变成了“数字”。数字化技术对历史学研究的方法、理念等方面的影响,学术界一再议论,对数字化史料的关注无多,但对历史学研究、学习产生垂直影响的却是数字化史料。

数字化史料带给历史学研究实践两大直观性变化:史料资源扩张、历史学研究与学习“体量”(信息量)增大,展示了量的飞跃。数字化史料检索精准系统、专业性强等优长,非常具体的诠释了“文献革命”。历史学各个学科领域,数字化史料的使用频率与日俱增,数字化史学发展前景令人看好。“伴随各种图书馆和其他政府机构越来越多地将历史资料数字化、编目分类,使之成为可访问的资料,历史学家将会更多地使用和依赖‘与生俱来’的数据信息作为引用、分析的证据。”[11]65涵盖各式新型新兴史料在内的数字化史料,为历史学学术研究走向深入提供了有力支持。因一系列新兴新型史料“加盟”,数字化史料资源容量陡增,大数据的海量信息,某些研究领域能够实现对现有研究的突破。数字化史料的增容及其多样性和多元化,让历史学工作者获得了比从前更多选择与裁量的机会,并借此强化问题意识,开辟新的领域,提升研究质量揭示出“水到渠成”的必然。

第一,数字化史料对于历史学研习、数字化转向,带来的是“新工具、新叙事与新历史”[12]。借助数字化史料,历史学利用“新工具”(16)在历史学研究实践中,“新工具”主要指以电子计算机为代表的现代化书写和阅读设备。“伴随人们越来越依赖数字设备完成各种日常工作,这些现代化设备的快捷已广为人知。”(Ananda Mitra, Digital Communications : From E-mail to the Cyber Community, Chelsea House,2010.p,8.)“新工具”及其实践价值的意义值得关注。,研究、解读新的课题,从事新兴新型的历史阅读和历史书写。涉及数字化带给史学的“新”无法一一列举,但最大的“新”或许是与“无纸化”相关的各种“新”(17)大数据、各种数据库可谓“无纸化”缩影。。数字化史料是“无纸化”史料,由此产生的一系列连带结果是:越来越多的人习惯于“无纸化阅读”“无纸化书写”。没有依据言说历史学研究的“无纸化”时代已经到来,无法妄言“无纸化”书写和阅读是一场革命(18)西方学者所谓“数字革命”的说法(Charles Travis ,Alexander von Lünen,The Digital Arts and Humanities:Neogeography, Social Media and Big Data Integrations and Applications, Springer,2016,p.153.),在数字化阅读和书写方面得到了充分印证。,但与日俱增的“无纸化”阅读和书写却印证了“新工具”的影响力、穿透力,说明历史学的数字化“转向”已经和数字化生活一样,正在向我们走来。至于“新叙事与新历史”,因数字化史料中若干新兴新型史料弥补传统史料的不足,历史叙事进入一个新阶段;借助新的数字化史料,进行新型历史书写,创作“新历史”不应是意外。

数字化史料、大数据等为历史学研究学习提供了多于“前数字化时代”的资料,历史学工作者利用传统史料的同时,充分遴选、裁量数字化史料,“双管齐下”,效果必定是积极的。数字化之于历史学,人们关注最多的是检索快捷。面对大数据、数据库浩如烟海的信息数据,传统的人工或手工分类几乎是难以逾越的障碍,但运用数字化技术则简便易行。历史学研究走向深入有赖于史料的支持,特别是新兴新型数字化史料提供的支持。数字化史料的利用率逐步提高,加固了历史学学术研究的资料基础,与历史学研究密切相关的信息总容量大幅度增加。

第二,促进新兴研究领域和新学术增长点产生。数字化史学本身即已揭示出“交叉性”——史学、史料与数字化技术的有机结合(19)有人把电子计算机在历史学研究中的运用视为交叉学科。早在20世纪50年代后期,考古学家便把电子计算机用于考古学研究(Susan Schreibman, Ray Siemens, John Unsworth,A Companion to Digital Humanities,Blackwell,2016,p.21. )。据此可知,历史学是比较早的运用电子计算机的学科专业。。关于数字化史学,有学者解释为一种学术实践;也有人认为,是一种研究方法,即将数字化技术、信息技术引入历史学;还有认为,数字化史学是一门学科(20)“数字人文在过去的十年间逐渐发展成为一门新的科学,这意味着任何人,无论是学者还是普通人,都可以借助数字手段尝试一下长时段史的建构。”见[美]乔·古尔迪怀特、[英]大卫·阿米蒂奇著,孙岳译:《历史学宣言》,世纪出版有限公司、格致出版社、世纪出版集团、上海人民出版社2017年版,第111页。。笔者比较倾向的观点是数字化史学是一个研究领域。在这一领域内,存在多个研究方向,数字化史料即为其中之一。此外,诸如平台设置、软件应用、大数据的利用、数据库开发建设等,也是数字化史学的分内之事。诚然不可以把数字化史学简单解释为“数字化”+“历史学”,数字化史料也不简单等于“数字化”+“史料”,但数字化技术渗入历史学领域是不可逆的事实。新兴新型数字化史料增多,必然促进历史学工作者产生新思考、新认识、新观点,使用新资料阐释新理论,进而生成新的学术增长点。超文本克服了传统文献线性组织和叙事方式,能够采取复杂的“非线性”方式,完成比从前更复杂的历史书写,完成纸质文本无法达到细致、精确,促进历史学迈向新的高度。数字化对历史学产生的影响侧重表现在技术层面。运用精准快速的检索,查寻到更多的史料,予以统计归纳,为深入开展研究创造了条件。

学术界一直议论数字化时代史学的研究方法、研究视角和模式等等,其实,数字化史料的最大影响之一,是对历史学专业学科建设产生的影响和推动,对打破各个领域之间的壁垒将产生积极作用。例如,计量史学、量化研究一直有人在议论倡导,如果没有大数据、数据库的支持,没有精准的检索和众多数据资料为依托,计量、量化困难重重。此外,运用大数据“旧题新做”“小题大做”,对已有的结论和研究成果补充订正,应是题中应有之意。通过利用大数据,一些属于资料性的“疑难问题”至少存在值得期待的答案。还比如,按照我们的理解,数字化史料不再是“狭义”的史料,与之相一致,历史学工作者运用新型(“广义”的)数字化史料完成的各类数字化作品——视频、图像、音频、软件直至应用3D打印技术复制古代器物等,应被视为与纸质文本等同的“成果”。

第三,时间和空间成本的节约。数字化史料节约经济成本、节省物理空间已有学者予以论述;另有学者从经济成本角度,肯定了数字化史料阅读和使用成本降低带来的益处(21)美国学者认为,数字化给历史学改变了搜集资料的速度和成本(见宇牟振:《数字历史的兴起:西方史学中的书写新趋势》,《史学理论研究》2015年第3期)。众多属于公共资源的数据库、档案馆、线上图书馆等降低了时间和经济成本,极大地方便了历史学研究。。但在历史学研究、学习实践中,运用数字化史料节约时间和空间成本尤其需要提及。人们一再褒奖的数字化史料的优势是检索迅速,史料的阅读者、使用者省却了繁复的手工操作,在最短的时间内,查阅、调阅(甚至可以跨洋调阅)所需资料,史料搜集、书写效率大幅度提高,自然节约了时间成本。传统史料存在、传递、使用(查阅)等均占据物理空间,而数字化史料占据的是虚拟空间,空间成本大大降低。绝大多数数字化史料通过互联网传输,或在互联网上占据空间,如各种专业数据库等。联网、数字化压缩了时空,在数字化史料这里得到了充分确证。“远程”“在线”普及程度极大提高后,阅读数字化史料摆脱空间束缚已为寻常小事,曾经难以逾越的自然地理空间阻隔——各种传统史料存在的物理空间——不再成为阅读的障碍,历史学工作者可在任何有互联网的地方获取所需资料,足不出户,遍览天下相关史料,不再是天方夜谭(22)有学者形象地说明了历史学学者足不出户,遍览天下文献的现状:“一位美国中世纪史专家,通过网上的图书馆、档案馆阅读到了原本需要到欧洲才能查阅的文献。”Melissa Terras, Julianne Nyhan, Edward Vanhoutte, Defining Digital Humanities : A Reader, Ashgate,2013,p.237.。对于历史学工作者而言,物理空间的节约包含着时间成本的降低,提高了史料使用效率意味着书写效率的提升。

第四,数字化史料的开放性。传统纸质文本史料或是出自学养天分雄厚的史家之手,或是专业专职历史学家的贡献。传统(“狭义”)史料边界清晰,即使没有森严的壁垒,那些“业余爱好者”“业余书写者”也很难涉足其中,史料系统的相对闭合性是明显的。(“广义”)数字化史料的生成过程说明:“历史也许不再属于历史学家的职业范围,而是属于历史的读者和业余爱好者的范围”[13]16。柯林武德更是直白地宣称:“某种意义上讲,我们都是今天的历史学家。”[9]34史料作者群体的开放性,意味着更多的人参与到数字化史料的书写(“制作”)活动中,或者说,各种名目的(“广义”的)史料,需要历史学工作者“圈外”的人参与新兴新型史料的书写(制作)。数字化史料对传统史料的颠覆性影响之一,即是打破了传统史料的封闭系统,让史料进入了互联网的开放空间。数字化史料的开放性主要有三方面原因促成:首先,数字化史料中的某些新型新兴史料依托互联网平台、微信社交平台等开放性平台存在发展决定了史料构成的开放性。其次,内容是开放的,数字化史料中的某些信息资料没有专业要求,亦无硬性规定,许多内容不是以“史料”身份出现的。最后,数字化史料中的某些资料信息出自不同层次的作者、“创作”者,反映出作者群体的开放性,即众多非历史学家参与数字化史料建设。

第五,特殊意义的“拾遗补阙”。谈及数字化史料,多数人都会把目光集中在集约化、集成化、数据库、大数据等层面,但数字化史料还有一个极其特殊的“拾遗补阙”意义。那些属于批量次、成规模的史料在数字化史料过程中充当“主角”毫无异议,一些零散、散落民间,分布在私人手中的某些珍贵史料则不易数字化,甚至很难出版发行,遑论形成规模。比如,一些出土文献、石刻碑铭及其拓片、字画古董、单本杂志、报纸、手稿(片段),以及各种珍贵文献的片段等史料价值不菲,传统的大众传媒几无办法,和历史研究者、学习者见面的机会微乎其微。这些难以进入数据库、集约化的史料经过数字化技术加工(23)这些加工包括拍照、古代器物的3D制作、古代文献扫描、借助科技手段的阅读等等。David M. Berry, Understanding Digital Humanities, Palgrave Macmillan,2012,p.423.,变身数字化史料之后通过互联网和微信发布,不仅拥有了复见天日的机会,而且充实了专业工作者专业研究,发挥了庞大的数据库发挥不到的作用。

数字化史料益处多多,可圈可点,但其负面因素的影响也不可视而不见。首先,近乎势不可当的史料数字化抑或数字化史料,还不具备全部取代传统文本史料的主客观条件。数字化史料不等于数字化史学,无法寄希望数字化史料将各种文献资料“尽收眼底”,大数据也不意味着“一网打尽”。尽管史料数字化发展多年,但仍有相当一部分纸质文本史料没有实现数字化,完成这些史料的数字化,任务依然艰巨,传承深厚且根深蒂固的纸质文本不存在被彻底取代的可能,遑论那些只用于私人收藏、自赏的孤本、善本。近些年,各个国家的解密档案相继公布上网,或进入各种数据库,成为数字化史料中颇受青睐的第一手资料。但由于种种原因,总有一部分档案不能挂在网上,必须依赖人工查阅,手工摘抄记录。数字化图书馆、在线图书馆业已被大多数图书馆所实践,但数字化永远不能取代合理的、有序的馆藏管理[2]48。据此可知,数字化技术对纸质文本史料的改造、加工不可能是全盘彻底的。数字化史料不是所有史料的代名词,总有“非数字化”史料等待着历史学工作者,以传统方式阅读理解。所以,数字化时代的历史学工作者将要长期做下去的功课是:要游走于数字化史料和纸质文本史料之间,在两者之间取长补短,“择优录用”。

其次,“设备”(机器)阅读很难克服的短板的。数字化技术催生数字化史料的同时,还催生了无纸化书写、电子阅读、数字化阅读,形成了当代特殊的“屏幕文化”(screen culture)[6]12。“无纸化”的阅读与书写,本质上是依赖硬件设备设施(机器)的阅读与书写。尤其是阅读,离开设施设备(机器),数字化史料阅读无从谈起。数字化史料的生成、阅读、使用等,均与“设备”和软硬件紧密相连。数字化史料作为资源,使用、利用“需要额外的基础设施(如数据库、网站前端、解压软件和附加的教学用具)”[2]48。大数据、数据库造就了数字化史料的集约化、集成化,海量信息资料为历史学研究者、使用者赞誉有加。然而,与海量信息相对应的是“海量阅读”,真正能够做到“海量阅读”实属不易(24)数字化时代,“几乎每天我们都要面对新的数字化史料,规模之大,是我们难以想象的”(David M. Berry, Understanding Digital Humanities, Palgrave Macmillan,2012,p.2.)。更有学者将线上阅读称为“阅读大爆炸”(Katherine Bode, Paul Longley Arthur,Advancing Digital Humanities: Research, Methods, Theories, Palgrave Macmillan, 2014,p.274.),旨在说明知识容量的剧增。。数字化史料数量积累的突飞猛进,让人怀疑史料如此之多,不免顾此失彼。大数据、数据库诚然提供了海量信息,但对于历史学研究而言,尚且达不到“一切让数据说话”的程度,学术现实和纯粹的“量化”的标准还有较大的距离。“我们生产数据的速度已经超过了我们储存数据的能力,也超过了以有意义的方法对数据进行分类、分析和归档的能力。”[6]37“信息爆炸”时代,信息的生成速度,让人的阅读速度和能力逊色许多。

再次,高科技产品的双刃剑效应。数字化史料是高科技产品,依赖数字化技术生成,各种形式的新型新兴史料,始终存在着利用高科技手段造假、伪造的伪学术行为。传统史料在数字化过程中,各种文档可以编辑、复制、扫描、合并、改变物理形态等,蓄意剪辑,原始文本发生人为的变化等等,偶有出现。此外,高科技手段成为某些人投机取巧,蒙骗世人的“利器”。比如,各种电子计算机所拥有的各种复制、粘贴等,为个别人“巧妙”利用,“省时省力”程度被人讽刺为高科技含量的“剪刀加糨糊”“升级版”“数字化版”。来势汹汹的数字化技术不是万能的,在历史学领域,许多新技术、新方法大多是完善了旧方法,而不是颠覆了旧方法[3]。前文已述,数字化史料中某些属于“广义”范畴的史料,在开放性的空间内,创作者、“制作”者出身迥异,目的不一,专业知识背景参差不齐,发布作品难保质量整齐划一,对进入各种数据库、互联网、微信群的各种信息和作品画一个问号,不数多余。精准检索是数字化史料的一大优势,一向为人称道,但某些通过关键词获得的史料,亦需要斟酌考辨,难免史料被割裂或因片段化无法反映所研究客体的全貌。面对科技含量较高、数字化技术特征明显的假冒伪劣,广大历史学工作者恪守辨伪求真的自觉没有过时,研究者的主体地位不应被削弱;同时也会面对“道高一尺魔高一丈”的魔咒。尤其各种史料信息依赖互联网生成与发展,但“互联网世界是一个拼凑的世界”,“就像实体教育领域一样,不平等现象比比皆是,不同的、相互竞争的利益集团将持续争夺(网络)控制权。”[6]46需要强调的是,不同的利益追求主体,都会借助互联网发布自己的观点,将自己的价值观、政治主张注入研究中,这些存在都是不能忽视的。

最后,一些属于新型新兴的史料没有明确界定,缺乏共识性的规范。将大量的、来自不同领域的影像影音等“非纸质”“非传统”的信息资料纳入史料范畴,认定这些信息资料属于“宏观”意义上的史料,似乎没有更多的争议。但对于这些信息资料的“史料”如何援引使用,鲜有人尝试,亦无范例和规则。例如,经过数字化技术生成的各种影音影响资料如何引征、标识等,尚无约定俗成的规范。一些声音、影像、图片资料,经过数字化技术处理后,总有些许失真是应当顾及的。互联网信息有自成系统的部分(如各种统计数字等),而更多的信息资料“碎片化”特征屡遭诟病,加之网络时有鱼龙混杂乱象丛生,一些人降低了对互联网信息的信任度。数字化史料中属于新型新兴史料中,占有相当比重的内容不具备完整性、系统性特征,许多只是片段或“横断面”,难以期待其中蕴含厚重的思想,凡此种种,都证明了数字化史料中的新型资料存在诸多短板。

四、结语

2012年,一位美国学者言称,数字人文作为“新的学科和领域”是“新的浪潮”[14]29。同年,另一位学者强调,数字人文是“学术生态系统中关键要素”[15]Ⅹ。“数字化史学”无疑是数字化人文的组成部分,历史学迈向数字化不仅仅是被动地接受“新浪潮”的推动,更有主动适应之意义,而且和诸多人文社会科学学科专业一样,是受到电子计算机影响的“多样化新兴领域”[16]223,且以不同的方式看待现存事物[14]29,32。时下,国内的历史学正在“转向”全方位数字化,数字化技术手段为历史学拓展了研究方法和认知领域,积极作用毋庸赘言。“数字人文学科代表了人文学科视野的重大扩展,因为它将人类的价值、表征和实践解说、意义建构策略、复杂性和模糊性带入了世界的每一个经验与知识领域。数字人文是一种全球的、跨历史的、跨媒体的意义建构、知识的创造方法。”[6]结合历史学研究实践,不难理解数字化之于历史学既有学术界一直关注的方法论、模式、范式等层面的意义,也应强调历史学的原点是史料。数字化史料是新的知识领域(25)“数字时代不仅提供了新的研究方法,而且在对社会产生重大影响的同时,产生了新的领域和问题。” Farina Madita Dobrick , Jana Fischer Lutz M. Hagen,Research Ethics:in the Digital Age Ethics for the Social Sciences and Humanities in Times of Mediatization and Digitization, Springer VS,2018, p.16.,尤其针对传统史料的封闭性,数字化史料及其史料资源具备了开放性特征,不啻为历史学研究的“福音”。关于数字化的对历史学方法论的影响,学术界多有议论,其中包括了“媒介化和数字化增加了(定量)研究的数据量与可获得性,增加了科学分析的方法论机会”[17]1。数字化对历史学的影响及其作用,没有理由忽视“媒介化”提供的各种助力,尤其是各种社交平台的建立,无疑会大力加快数字化史学的步伐。但在实践中,“我们塑造了各种平台、工具和技术,平台、工具和技术也在塑造我们”[6]86。这种现实意味着,数字化时代的历史学工作者不止是被动适应科学技术进步,还需要主动掌握数字化基本的技能与方法(26)比如,电子计算机技术能够提供新的方法、新的发现、新的结果等(David M. Berry, Understanding Digital Humanities, Palgrave Macmillan,2012,p.34.),这些对于历史学研究与发展至关重要。,那些熟练掌握相关技术技能的历史学者,无疑会比他人获得多于他人的先机。“数字时代提供了促进社会科学发展的新的研究方法和可能性”[17]1。数字化史料风生水起,方兴未艾。然而,专业人士热议的数字化史料到底能够催生什么样、什么性质的新的专业领域(27)西方学者指出,各种社交媒体平台的广泛使用,“导致人文和社会科学领域研究项目增多……。”(Katherine Bode, Paul Longley Arthur,Advancing Digital Humanities: Research, Methods, Theories, Palgrave Macmillan, 2014,p.113.)原因在于,数字化技术拓宽人类的认知视野,增加了知识的容量,问题自然随之增多。,以及有待深入探讨数字化史料的空间价值意义等问题,至今还没有令人满意的答案,“数字化史学”能够对这些问题给予较多的关注。