“抗战文献数据平台”的前景
2018-09-20石岩
南方周末记者 石岩
“这类文献以前档案馆看不上眼,又进不了图书馆,大多散落在民间或后人手里。如果能成规模地收集,可以极大丰富根据地史研究。”
南方周末记者 石岩
发自北京
2018年9月2日,抗日战争与近代中日关系文献数据平台正式上线,向全球免费开放。这个平台向社会各方提供了大量历史信息:
1933年陈翰笙、唐文礼主持“六省农村调查”,记录了红军到达陕北之前一年,绥德一带的土地关系、政治捐税情况。抗战时期,各大战役的战地纪实、作战计划和战后总结,国共双方如何开展军事训练,如何对待战俘,处于前线的第二战区如何实现国共合作,国民政府在日军占领区的政府架构,在平台收录的史料中都有体现。
1937年,红军将领黄克功因恋爱纠纷枪杀陕北公学女学员。公审大会上,陪审员就黄该杀该留的唇枪舌剑被特写《陕北的恋爱故事》生动地记录下来。该文连同抗日根据地独具美学特色的版画一起,刊登于读书生活出版社出版的《在祖国的原野上》,传递着根据地的民主气息。
国民政府的国家纪念日被1944年出版的《纪念节日史话》囊括其中,林林总总的纪念日不失为勉力凝聚国家想象的主观努力。
文字史料是数据平台的重头,但不是唯一,图片、音频等栏目体现了一种让历史可听、可看的努力。该平台是国家社科基金“抗日战争专项工程”24项中最大的一个,2016年起共获2000万元资助。这也是中国社科院近代史研究所前所长步平的夙愿。他一直提议建立相关文献数据平台,为广大研究者提供文献,力争超越著名的日本亚洲历史资料中心。
2018年9月8日,中国社科院近代史研究所副所长金以林接受南方周末专访。金以林团队是抗日战争与近代中日关系文献数据平台(下称“抗战文献数据平台”)的创建者。
民间蕴藏的史料多到你无法想象
南方周末:“抗战文献数据平台”的架构是怎样的?
金以林:平台架构大致分几个专栏:图书、报刊、档案、音视频等。有学者希望我们多上线一些档案,但根据国家档案法规定,档案开放要经过一定审查,现在暂时还有困难。但我们想通过民间众筹来突破。社科院亚太研究所陈晖女士的父亲陈田鹤先生谱写过许多抗战歌曲,并自费制作音频,还有一批战时创作留下的手稿。陈老师无偿捐赠给平台,现已上线,研究音乐史的学者会很感兴趣。广西一名历史爱好者专门收藏战时广西青年军的文献,也愿意分享这批史料。民间蕴藏的史料多到你无法想象。前段时间,我们研究所的李志毓去东北参加田野调查,在佳木斯下面的一个小农场,发现了一批远征军的小册子和个人档案。东北的农场最初是1950年代王震将军率领十万军人转业组成的,其中几百人是国民党新一军的“解放战士”。他们留下了一批日记、个人档案,何时参加国民党,为什么去“中印缅”打仗,什么情况下被俘等等,清清楚楚记录在案。我们正组织人去扫描。这几百人的档案,足够做非常有意思的专题研究,也可丰富我们对基层军队的了解。
“红色文献”专栏是我们平台的一大特色。八路军总部曾经设在山西长治的武乡县,那里有一个展览馆,馆藏相当丰富,有许多根据地编印的教授八路军、民兵如何打地雷战、地道战的小册子,有《论持久战》的不同版本,还有一些油印小报,如太岳军区三分区《战斗报》等。这类文献以前档案馆看不上眼,又进不了图书馆,大多散落在民间或后人手里。如果能成规模地收集,可以极大丰富根据地史研究。这个工作很紧迫,许多当事人子女年事已高,三代、四代是否会继续保留这批珍贵文献,很难说。
南方周末:目前平台搜集的各种史料,哪块是特色所在?
金以林:目前最大的优长是上线的报纸,可以说全球都找不到哪家机构有超过400种民国时期报纸可供线上浏览,更不要说免费开放。这批报纸至少有三分之一是大报,指连续发行三年以上的。像《申报》从晚清一直到新中国成立前,六七十年,共二十多万页。
南方周末:《申报》数据库似乎一般的大学都有。
金以林:《申报》全文检索数据库非常好,但很贵,只有很少有实力的大学才会购买,而且离开校园网就无法使用。“抗战文献数据平台”上的《申报》,在全球任何一个角落,打开电脑连上网络就可以看。最初有很多读者拼命下载,生怕像其他网站,过几天就看不到了。一些朋友还特意找我,要求多开放些下载量。我只好反复说明:“放心吧,永久免费开放。”本来我们不限制下载页数,但合作方“百度云”表示占用的带宽太多了,像《申报》下载过万次,就相当于下载近3000万张高清图片。“百度云”也是在做公益,免费提供服务,只收很少的运营维护费。为此,我们规定一个账号一个月只能下载2000页。我自己是“史料控”,有十多个硬盘,找份资料真累。当你下载完两三百万页文献,又不可能将检索平台下载,想用时自己都找不到,还不如直接到平台查阅。
一个重要的经验是:数据库发展到相当规模后,不用专业公司提供服务,总想自己开发,早晚会废掉。为落实此事,我至少写了五份报告,来消除各种顾虑:泄密怎么办?让百度做,不等于将点击量都给了百度?最后我举了个例子:任何一家出版社大都拥有自己出版物的版权,但出版社不必办印刷厂,更不用建造纸厂。我们的平台就是一个独立网站。
图书目前的重点是1949年前的出版物,还有大量新中国各级机构整理出版的档案史料集,也非常有价值。但涉及知识产权的编辑权,最近十年出版的文件集,特别是许多大套文献还不能上线,比如辽宁省档案馆的张学良档案汇编。国民党军事委员作战厅、参谋部、战区会战总结等等,都盖着“秘密”“机密”印戳。
图片方面,目前我们研究所收藏的抗战图片至少有十万张,但还没来得及编目,说实话也比较费钱,有一定专业训练才可以完成著录。图片数据库至少要有三个标准:有足够大的量;图片要清晰;有清楚的来源,包括图片蕴含的信息——时间、地点、人物、事件等,要有清晰的描述。网上常有很多历史老照片,仅著录为“三十年代北平社会风貌”一类的话,对历史研究的意义不大。
我们还收集了参战各国的战时外交文献。各国政府大多做成微缩胶卷,一个卖二三百美元,一套资料有数百个胶卷。以往只有国内著名的大学或研究机构才买得起,我们同这些大学合作,出资将微卷转换成电子版,重新编目,至少可以上线300万页。不仅可以避免重复购买,还不必在指定微缩阅读机上费眼阅读。我们研究所还承担了“近代中国海外珍稀文献收集整理与研究”项目,比如复制哥伦比亚大学藏的顾维钧档案18万页,台北中国国民党党史馆一百余万页档案,其中大量涉及抗战时期,但因与对方的合作协议或著作权限制,我们不能上网公开,但可以在平台上开设一个栏目,把目录放在上面,谁要看都欢迎到近代史所查档。以后学者做研究,如果说档案藏在海外,我们看不到,那就说不通了。我们希望每个研究者都能做到:杨天石(注:中国社科院近代史所研究员,著名历史学者)老先生能看到什么,你就能看到什么,剩下对历史的解读,是学者自己的本事。
为什么不看全集?学生说大学图书馆没有
南方周末:为什么“抗战文献数据平台”要强调公益开放?
金以林:现有开放平台很多,但并不公益。很多收藏机构特别是商业机构都研发了很好的文献数据库,但需要购买才能阅读,且价格昂贵。还有很多机构为保护民国时期的文献,都在数字化,重复建设浪费巨大。A图书馆申请一笔政府经费完成部分馆藏文献保护,往往不会免费开放使用;B图书馆再申请一个课题,做完后也只在内部使用,或者要购买阅览权。我们最大的成就感是:平台上线的文献可以免费让全球的人看到。一位老先生同我讲,有一名报考他的博士生笔试成绩很好,但没有录取。面试时,老先生问学生:硕士论文做的什么题目?学生回答:孙中山的民生思想。再问学生看过什么书,回答《孙中山选集》。为什么不看全集?学生说他们大学图书馆没有。老先生考虑招进来后还要改造学生的学习方法,自己年龄大了,实在没有精力,最终放弃。这个学生真是可惜。虽说现在高校图书收藏好了许多,还有很多付费数据库,但一般学生利用起来仍很不方便。
有了这个平台,不仅研究者、大学生可以利用,中学生也可以利用。我儿子在北大附中上高中历史课,老师布置写小论文。他写了一篇解放军古宁头战役失败的原因,老师认为不错,还让他在全班做陈述。他完全不用靠图书馆,靠家里的藏书就可以。北大附中的其他学生也可以到北大图书馆、国家图书馆查阅各类历史资料,都是国内最好的图书馆。广大县乡学生哪有机会,为了课堂作业到城里的图书馆、档案馆查资料呢。
南方周末:公益开放会不会影响收费数据库的市场份额?你和团队搜集史料会遇到阻力吗?
金以林:可能会影响吧。但我想现在许多机构做扫描工作,其实都是各级政府支持的经费,也可以说都是花纳税人的钱,本应该公开共享。但他们做出来数据库也不容易,有时也要弥补其他经费不足。现在遇到的最大的困难有两点:经费不足,知识产权保护。许多已出版的非常好的档案文献资料,因有编辑权、版式权等限制,我们还不能全部上网。我们曾咨询了许多出版社的法律顾问,普华永道的专业律师,尽可能不影响著作权人的权益。
平台还有一个非常好的社会作用:可以避免大量重复建设和重复购买。许多机构收藏的文献,如果平台没有,我们可以协助数字化。民国时期出版的纸质文献,可以说借阅一次损坏一次。还有微缩胶卷,如果没有恒温恒湿保存条件,很容易脆化,在阅读器上旋转不小心就会折了,且只能同时供一人阅览。许多公立图书馆都有提供公共阅览的需求,以前要花钱到别的机构购买电子产品,现在我们送它,只要平台有,要多少送多少。前提是它愿意拿出一部分平台没有的馆藏文献分享。
宏观研究必须在微观基础上才能达成
南方周末:这个平台是按照“十四年抗战”的架构来搜集资料的,主体材料从1931年到1945年,其实也不止。
金以林:甲午战争跟中日关系有关吧,相关文献我们自然要收集。《毛泽东选集》不能只上线第三卷抗日战争,要上就四卷都上。战后日本教科书问题,历史认识问题,始终是影响中日关系的重要因素,我们当然也要花功夫收集。平台完全可以变成一个近现代中国的数据库,所以英文域名是www.modernhistory.org.cn。
南方周末:其实叫“抗战数据库”可能不如叫“战时中国”数据库更贴切。其中不仅有中共领导下的抗日根据地的史料,正面战场的情况,国民政府在敌占区的军政管理,也有沦陷区的情况。
金以林:“红色文献”是我们的特色之一。前面也提到,民间蕴藏的史料有很大挖掘潜力。正面战场、沦陷区的史料我们也搜集,比如上海沦陷后发行的地方小报《海报》《平报》。一般读者去复旦大学图书馆,恐怕也找不到这么全的报纸。这种小报能够反映沦陷区的社会经济文化民情。战时银行的各种统计报表,海关的进出口月报我们也扫描上线。把这些材料汇集起来,确实能对“战时中国”有更全面的了解。
南方周末:《抗战史料丛谈》是“抗战文献数据平台”微信公号文章的汇集。这本书涉及的地方抗战史料比较多,是否意味着全局性的抗战研究学界已经做得差不多,所以现在比较重视地方经验?
金以林:学界以往的一些全局性研究成果还存在许多概念化倾向。宏观研究必须在微观基础上才能达成,不能简单地定义、定性。碎片化有它的必要。我们只有把无穷的细节研究透,才可能高度概括出宏观叙事。最近几年,民间需求,学界研究的兴趣点也在慢慢转变,越做越细。首先是民间的冲击,有些历史爱好者从中日英文方方面面找文献,考证细节:交战双方武器弹药是什么材料制作的,枪弹的有效射程,服装是怎样的等等。有些内容不仅有趣,还很有说服力。传统的学院派研究思路往往关注国际关系,重要会议的决议等,太过宏观。理论上该不该如此,与实际上能不能做到时常脱节。关注细节很有必要,但普通爱好者往往缺乏专业训练,容易造成硬伤。最近几年成长起来的硕士、博士改变了这种状态,研究非常细致,有些博士论文讨论抗日根据地的后勤建设,详细论述医药如何保障,医生、护士如何培养,受伤战士治疗后如何重返战场或因伤势严重而重新就业等问题。这些细节研究能够推动抗战史走向深入,而“抗战文献数据平台”的丰富文献,可以提供扎实的史料基础。