影像史料数据库建设研究初探
2016-04-10敖雪峰
敖雪峰
(北京师范大学 历史学院, 北京 100875)
影像史料数据库建设研究初探
敖雪峰
(北京师范大学历史学院, 北京100875)
史料是历史学研究的基础,搜集整理史料,建立数字史料数据库,已经成为现代史料学的重要任务。以影像方式保存下来的历史资料是学习和研究历史的重要资源。搜集整理影像史料并构建相应的数字影像史料数据库,成为现代史料学发展的必然,也是史料库建设的新趋势。该文在国内外史料数据库研究现状和存在问题的基础上,结合北京师范大学历史影像实验室“近现代世界重大历史事件影像史料库”建设的实践成果,针对影像史料数据库建设过程中的史料搜集问题进行了分析,并就具体问题提出了相应的解决方案建议。
史料;实验室;影像;数据库
史料是历史学研究的源泉。著名的近现代史家傅斯年说过“史料即史学”[1],也就是说历史学研究的基础其实是对史料的搜集、整理与运用。傅斯年认为只要把材料整理好,则事实自然显明了[2]。也就是说应把史学研究建立在踏踏实实地挖掘史料上,而不是空泛的思考上。包含图片和视频在内的历史影像,作为传统文字媒介的补充,是记录,传承,表现历史的新型重要媒介。以影像方式保存下来的历史资料是学习和研究历史的重要资源,而影像作为一种载体,是近现代史料得以保存和传承的重要方式,已有的史料也可以通过数字化的方式以影像形式继续保存传承。因此,真实的历史影像无疑成为信息时代下史料的重要组成,是佐证历史史实的有力根据。通过对影像史料进行搜集整理并构建相应的数字史料数据库成为史料学发展的必然,也是史料库建设的新趋势。影像史料库建设问题不同于一般的史料数据库建设,由于其传播媒介的新颖特性与历史学的年代久远特性之间存在的巨大差异,导致影像史料的搜集变得困难。而影像史料搜集的渠道具有随意性和不正规性,因此导致史料的辨伪存真、史料来源时间、创建者等问题都变得扑朔迷离。而在后期数据库软件系统构建过程中,由于存储的多为图片和视频等多媒体格式,因此资源的格式标准、命名规则等问题也变得更加复杂。作为典型的多媒体数据库系统,超越文本关键词检索的基于内容的检索方法也是该过程中需要考虑的[3]。北京师范大学历史影像实验室,在倡导影像实践教学之余,一直致力于历史影像史料数据库的建设工作。本文在对影像史料数据库系统进行研究的基础上,针对以上具体问题提出了一系列具体解决方案。并在“近现代世界重大历史影像史料数据库”建设项目实践过程中,验证了这些解决方案的可行性。
1 国内外研究现状
随着信息时代的飞速发展,人类社会的方方面面,包括学习和研究都发生了巨大的变革[4]。信息资源变得极大丰富,其中的数字化史料也作为传统史料的重要补充,充斥在大量的微机、电子存储设备以及网络上,这对于基于史料的史学研究来说,其途径和方法都受到举足轻重的影响。传统史学家“上天入地下黄泉,动手动脚找材料”的研究模式已经悄然发生改变,史学家凭借信息检索技术可通过电脑获取部分或者全部数字史料资源,佐证自己的史学论点。
在国际上,数字史料数据库建设工程已经非常成熟,很多著名机构都建立了针对特定史段、特定历史类别的史料数据库。比如,研究世界古代史的学者们所熟知的洛布古典丛书数据库[5]。该数据库提供重要的希腊和拉丁文学作品,供访问者下载和在线浏览,作品涵盖内容广泛,其中包含史诗、抒情诗、悲剧和喜剧、历史、哲学以及宗教文化等,是研究世界古代史及古典学的重要史料来源。同时,该数据库对大部分入库的书籍提供了原始和英文翻译两种文本版式,从而方便来自不同地方的研究者。还有,以色列亚德韦希姆大屠杀纪念馆与美国谷歌公司合作,把世界最大规模的大屠杀史料上传互联网,同时,公众还可以经由相关网络组件与该大屠杀网络史料数据库进行互动交流。例如,口述自己的历史故事,发表评论,提供关于大屠杀的文件资料等,从而促进以色列大屠杀史料库的进一步完善[6]。再如,国外很多相关网站都提供两次世界大战的史料数据库[7-10],其中包含有关两次世界大战的文字史料、图片史料、口述史料等众多史料信息,这些都是研究世界大战的研究者宝贵的史料来源。
在国内,随着信息技术的快速发展,近年来各种各样的数字史料数据库也层出不穷。比如,著名的《四库全书》[11]《中国基本古籍库》[12]《二十五史》[13]等,均是历史学术圈内耳熟能详的电子史料库,不仅为中国古代历史学习者和研究者提供了宝贵史料来源,而且方便用户快速查询、浏览相关史料,极大提升了学习和研究效率。由首都师范大学、南京师范大学、四川师范大学、鞍山师范学院4所师范院校与北京国学时代文化传播有限公司共同研制的大型古籍专题数据库——《中国古代文学史电子史料库》[14],共收入从先秦到清代的中国文学典籍600多部,总字数达1亿5千多万,是研究古达文学史的重要数字化史料来源。台湾大学图书馆与国民党党史馆合作,进行史料档案微缩拍摄与数字化作业,并建置“中国国民党史料数据库”。数据库内容包括“特种档案”“汉口档案”“近代人物书札”“中央前五部档案”等类别,并可依人名、地名、年代、出生地等条件进行检索,方便查找数据[15]。由北京大学图书馆联合清华大学、南开大学、云南师范大学高校图书馆共同完成的“西南联大史料数据库”项目[16],建成了目录集中、资源分布式的联合型特色库,并形成了长期共建共享的建设机制和服务机制,总数据量近2万条,资料齐全、内容丰富,涵盖了西南联大教育思想、教育精神、西南联大人物、中国教育史等诸多领域,可供学者和研究人员进行学术研究,具有重大现时意义和学术研究价值。
2 现有史料数据库存在的问题分析
虽然国内外史料数据库建设成果都颇为丰厚,但综观起来,也存在一定的问题。主要问题在于史料数据库的基本史料数据还停留在传统史料界定模式中。在信息技术被引入历史学以前,传统史料可概括为4大类:第一类为书报,包括历史记录、历史著作、文献汇编和史部以外的群籍;第二类为文件,包括政府文件、团体文件和私人文件;第三类为实物,包括生产工具、生活资料和历史事件的遗迹;第四类为口碑,包括回忆录、调查记录、群众传说和文艺作品[17]。现有的史料数据库基本上都是由这几类传统史料的数字元文件构成。在信息多媒体技术和影音技术蓬勃发展的当代,影像史料作为传统史料的重要补充,已经成为历史学研究不可或缺的重要的基础史料来源,但史料数据库建设工程还是针对传统的史料,并没有将具有有力佐证历史史实意义的影像史料纳入史料数据库的基本数据范畴,这就使得影像史料数据库的研究工作和建设工作都相对滞后。影像史料库不同于传统的历史文献史料数据库,其中包含图片和视频格式的多媒体数据文件。这些多媒体数据文件本身具有格式多样、文件复杂、数据量大的特点,而且现有的影像史料具有分布不均、命名随意、无规则性等弊病。这些现实问题的存在都为影像史料的搜集与整理,相应数据库的建立、浏览和检索增加了难度。
3 影像史料搜集过程中的关键问题分析及解决方案
与传统史料数据库不同的是,影像史料数据库针对的是以图像和视频存储格式为主的历史资料。如今历史文献资料已经浩如烟海。相比文字史料的繁荣景象,记录真实历史场景的图片和视频要稀少得多;而在本来就为数不多的大集合里,还有相当一部分被相关机构收藏垄断,普通学者能够访问到的只占很少一部分;另外由于研究者本身的信息检索技术水平有限,即使面对面向大众公开的影像史料,研究者想要获取也是束手无策。
3.1影像形式的历史资料稀少
摄影技术于19世纪40年代才开始被发明[18],这意味着只有19世纪40年代之后发生的历史事件和场景才有可能以图像形式存世,因此影像史料所能涵盖的史段被限制在19世纪40年代到当代的这个史段内。现有为数不多的影像史料库建设工作,基本上都是针对近现代史或当代史展开,而对于更早的史段则显得有心无力。至于有关更早史段的图像或视频资料,大多是由后人根据文字史料进行艺术创造加工而成。这些人为创作的影像资料能否真正被称作史料还有待商榷,影像资料的历史性和艺术性鉴定是另外一个话题,在本文中不作分析。历史时间久远的特性与现代影音多媒体技术的新颖性存在天然的鸿沟,这使得影像史料的搜集被限定在特定的史段内。
在摄影技术发明之后,可以利用影像设备将相关历史人物或者历史事件的现实场景进行采集,这在以前是无法想象的。但是即使梦想终于得以变成现实,这种机会也是极其罕见的。特别是年代越久远,相关的影像资料越匮乏。年代久远的历史缺乏影像记录,主要由两个原因决定:首先,由于技术的成熟度还远远不够,人们的意识也处于萌芽阶段,导致采取影像记录史实的方式本身具有意识上和技术上的局限性,仅有及其少量的历史史实在特殊的机遇之下通过影像的方式被记录下来;其次,由于早期的影像存储条件有限,在进入数字时代以前,照片和视频以胶片方式保存[18],早期的胶片备份无法做到长期保存,这也导致很多老照片和旧视频处于破损毁坏,甚至消失的状态。
由于意识薄弱,技术缺乏,加之后期保存手段落后,针对年代久远的历史照片和视频极其稀少,这也是我们前期搜集工作无法逾越的障碍。针对影像资料匮乏的问题,虽然无法从根本上给予解决,但是可以通过图像复原技术和视频修复技术等对破损的影像进行修复再现。目前的图像复原技术主要针对数字图像[19],可以将早期胶片图像先进行数字化处理,然后通过数字图像修复技术对原始影像进行还原。另外,研究者应时刻怀抱忧患意识和紧迫感,对于即将损毁的珍稀影像能够做到及时抢救;否则,随着时间的流逝,此问题只会变得愈加严峻。对严格的史料界定范围来说,原始历史影像资料的集合已经确定,已无任何延拓发展的可能。但是如果可以扩大影像史料的定义范围,将部分后人对于之前历史进行艺术再加工而成的影像,如画像、纪录片、电视和电影等也称作影像史料的话,那么可以通过推动历史影像创作来丰富完善相关影像史料的规模。
3.2相关机构的垄断性收藏
随着摄影技术的日益革新和成熟,人们利用照片和录像的方式来记录当下正在发生的历史的意识和兴趣也大大加强,关于近现代史段的影像资料变得丰富起来,且越接近当代史段,相关历史影像资料愈加丰富。特别是1946年发明计算机以来,照片和视频也渐渐脱离胶片存储时代,朝着数字时代蓬勃发展[20]。数码照相机和数码摄像机的发明使得影像采集工作变得易如反掌,进一步促进了影像多媒体技术的飞速发展[21]。影像作为一种记录媒介,逐渐成为一种与书写文字互相抗衡的重要载体。近现代的许多重大历史事件,如两次世界大战和苏联解体等,除了诸多的文字记述,还有为数众多的照片和影像资料提供强有力的佐证。虽然关于近现代史段的影像资料本身比较丰富,但是由于存储不当,损毁而消失的也不在少数。特别是大量珍贵的史实影像被少部分影视机构和档案馆等机构独占,普通的研究者无法企及。研究者如果想要接触相关史料,需要具备巨大的财力和强大的人脉关系。对于专注于学术的史学研究项目而言,可供支配的经费是极其有限的,而且从事研究的学者本身惯于孤灯暗影,也无可利用的社交关系,这些现实因素使得影像史料搜集工作变得异常困难。
针对相关机构对历史影像资料进行垄断性收藏的问题,如何有效规避,要从两个方面进行考虑。一方面,可以呼吁政府对于史学研究机构,在政策上或财力上给予更大力度的支持,帮助研究机构从收藏机构获取其所需要的影像资料;另一方面,相关研究机构也可以扩大自己的社会影响力,寻求与资料拥有方的合作机会,通过沟通协商的方式从对方获取相关影像资料。而对于史学研究者个人,也要尽量摆脱传统的孤身奋战的研究模式,认识到合作才是解决问题的途径,创造必要的社交资源,不至于面对影像史料收藏方一筹莫展。
3.3信息检索技术限制
排除由于硬性因素无法访问的影像史料,目前普通研究者可以接触的影像资料大都保存在历史图书、图片集、视音频出版物、网络图片数据库、网络视频数据库、相关机构服务器以及个人服务器上。针对纸质的历史图书和图片集,一般可在研究机构的图书馆或档案馆中查找,与普通纸质文献图书的检索过程无异,不会对史学研究者造成太大的困扰。但是这部分保存的图片资源还是占少数,而且无法承载历史视频资源。视音频出版物可在市面上购置,技术上没有困难,但是真正出版发行的关于史实记载的视音频非常稀少。大多数历史图片及历史视频都以比较零散的状态分布在网络上。从浩如烟海的网络资源中,检索出与自己研究主题契合,提供佐证史论观点的影像史料,不仅需要扎实的史料分析能力,更需要较强的多媒体信息检索技能。但是纵观国内史学界,史学研究人才大多信息技术水平欠缺,专业信息检索技能尤其缺乏。首先,影像资料检索及获取工作本身的技术难度较大,对于普通的史学研究工作者来说掌握起来比较困难;其次,传统史学研究工作者对于新兴技术不重视,有些甚至还有抵触情绪,提升信息水平的意识比较薄弱。
要解决信息检索技术限制带来的搜集困难,需对传统历史学研究者灌输跨学科研究的观念,让他们意识到现代数字技术与历史学研究之间的密切关系,从而让其从主观上接受现代信息技术的重要性,努力操练,加强自身的影像资料以及数字资料的技术能力。研究机构应积极为乐于接受新技术的研究者提供必要的培训,帮助其尽快提升相关信息技能。当然,史学工作者也可以与技术工作者一块合作,将自己的需求告诉技术工作者,技术工作者则根据史学工作者提供的关键词对相关影像资料进行检索、扫描或下载等工作。但是,这样的合作是否能够成功,还建立在技术工作者的史学修为上。如果技术工作者没有相关的史学素养,可能根本无法理解史学工作者的研究需求,也达不到预期的检索效果。
4 结束语
本文针对历史影像史料数据库建设过程中的史料搜集问题展开分析探讨,在史料搜集实践过程中,发现主要存在原始影像资料匮乏,所有权机构对原始影像资料的垄断以及影像资料检索和获取技术较难3个问题,并针对这3个具体问题进行了分析和相关解决方案的探讨。通过分析研究,提出研究者需要努力提升多媒体信息检索以及影像修复等相关技术水平,同时积极寻求与所有权机构的合作,或者申请上级部门的支持,尽量将搜集过程中的困难降到最低。
[1]李勇.作为史学双翼的史料与理论——— 重读翦伯赞《历史哲学教程》《史料与史学》[J]. 淮北师范大学学报(哲学社会科学版), 2011,32(3):8-11.
[2]谢勤亮. 影像与历史: “影视史学”及其实践与试验[J]. 现代传播, 2007(2):79-83.
[3]王璐, 胡丽文. 基于内容的图像检索方法[J]. 现代情报, 2005(7):138-140.
[4]张凤英.当代史料数据库的建设[J].衡阳师范学院学报:社会科学版, 2000,21(1):106-108.
[5]顾钧. 用古籍拯救世道人心——洛布古典丛书百年[J].博览群书, 2011(6):53-55.
[6]京华时报. 以色列数字化大屠杀史料[EB/OL]. (2011-01-28). http://epaper.jinghua.cn/html/2011-01/28/content_627613.htm.
[7]Michael Duffy . First World War.com[EB/OL].[2014-12-23].http://firstworldwar.com.
[8] A&E Television Networks . World War I - Battles, Facts, Videos & Pictures[EB/OL].[2014-12-23]. http://www.history.com/topics/world-war-i .
[9] A&E Television Networks . World War II - Battles, Facts, Videos & Pictures[EB/OL].[2014-12-23]. http://www.history.com/topics/world-war-ii.
[10]SECONDWORLDWAR.CO.UK.Second World War[EB/OL].[2014-12-23]. http://secondworldwar.co.uk.
[11]汪受宽,刘凤强. 《四库全书》研究的回顾与思考[J]. 史学史研究, 2005(1):62-66.
[12]毛建军. 《中国基本古籍库 》的特色与启示——兼谈古籍全文数据库的标准与规范[J].管理学刊, 2009, 22(1):104-106.
[13]南开大学组合数学研究中心,天津永川软件技术有限公司.二十五史全文检索系统(网络版)[EB/OL].[2014-12-23] .http://202.114.65.57/net25.
[14]金辛. 《中国古代文学史电子史料库》简介[J]. 南京师范大学文学院学报, 2004(2):23.
[15]中国台湾大学图书馆,国民党党史馆. “国民党史料数据库”[J].数字与缩微影像,2008(2):38.
[16]北京大学图书馆.西南联大史料库[EB/OL].[2014-12-23].http://localsev.lib.pku.edu.cn/lianda/home/index.asp.
[17]黄海霞.史料与历史教学[J]. 教育教学论坛,2013(14):128-129.
[18]平占斌.意外的发现与发明[J]. 发明与创新,2009(4):17.
[19]郑慧颖.图像修复和视频修复算法的研究[D].长春:吉林大学,2009.
[20]李剑峰.计算机发明之前的计算[N].电脑报,2014-4-14(14).
[21]赵欣,张亮.开启数字影像时代数码相机及CCD发明的故事[J] .数字通信,2006(18):46-51.
Initial Exploration of the Construction of Imagery History Materials
AO Xuefeng
(School of History, Beijing Normal University, Beijing 100875, China)
History materials are the fundamental of the research in history discipline. It has become an important task to search and sort history materials and construct relative history material databases. The history materials which are stored in imagery form are important resources for studying and researching history. Searching and sorting imagery history materials and constructing relative databases are not only becoming necessary in the development in modern studying of history materials, but also the new trends of constructing history materials databases. This paper analyzed the problems of searching history materials and proposed corresponding solutions to these problems, combining the practical achievements of historiophoty laboratory, based on the research status at home and abroad,
history materials;laboratory;images and videos;databases
G482.0
A
10.3969/j.issn.1672-4550.2016.01.058
-------------------- 2015-01-08;修改日期: 2015-03-19
中央高校基本科研业务费专项资金(105579GK)。
敖雪峰(1984-),硕士,讲师,主要从事影像史学,教育技术与历史教学方面的工作。