APP下载

数字时代博物馆历史文献藏品的管理与应用
——以首都博物馆为例

2021-01-30

关键词:历史文献首都博物馆文书

杜 翔

(首都博物馆,北京 100045)

博物馆藏品是博物馆收藏的记录和反映人类社会及自然发展历程的实物证据,其中包括记录有信息与知识的、以纸张为物质载体的历史文献藏品,博物馆历史文献藏品长期以来一直处于封存状态,未能得到全面有效地保护、研究和利用.

随着计算机及网络技术的飞速发展,以知识为主导、以科技创新为动力的新世纪到来,“数字人文”概念的提出,为博物馆带来了一个全新的理念,在这样的背景下,博物馆如何适应时代发展的需要,运用“数字人文”新的方法和技术,对馆藏历史文献藏品进行有效的管理与应用,以达到资源共享,服务大众,服务社会的最终目的,是博物馆面临的新的问题.

1 博物馆历史文献的收藏与保护

关于历史文献,学界有三种解释:第一种是将历史文献等同于文献或古典文献;第二种是把历史文献视为文献或史料的一个组成部分,强调其专业属性和内容特性;第三种是将历史文献划分为广义和狭义两种,如谢玉杰、王继光认为“广义历史文献,系指一切文献;狭义历史文献即历史学科史料文献,其中历史学记注与撰述的典籍是狭义历史文献的主体”[1].

中国历史文献的积累主要有三个重要途径:一是官府档案文书的积存;二是历史撰述的日增;三是史书以外的各种撰述的发展.在史学中占有一定地位的历史文献应当包括四个方面的内容:历史思想、历史资料、历史编纂、历史文学[2].

由于历史文献是以其文字内容对历史进行各种阐述,让观者从各个侧面各个角度来认知历史,历史文献创作者的社会身份地位、其文化知识水平、思想意识等等因素对其文字内容的阐述势必会产生影响,同时历史文献的不同历史阶段中的政治文化等社会背景也会对文字内容产生影响,所以历史文献有着其特有的专业属性和内容特性,以及历史的局限性和多重性.

具体到博物馆中的历史文献应当包括在过去时间中产生的、具有一定年代性的古籍、简册、碑刻拓片、书画、照片、手稿、信札、经卷、牒谱、契约、票券、档案等等,与其他质材的文物相比,历史文献存在着些许不同,它不像其他质材的文物那样表达直观,可以一目了然,它是通过文字来表述和传递文化信息还原历史的,这是它的文献价值,同时又因其年代性而具有文物价值,双重价值属性使它成为博物馆文物所藏的另类,因此我们在对其使用过程中,应当注重其文字内容的研究,索取其要旨,充分挖掘其内在的历史文化信息,这才是博物馆历史文献真正价值之所在.

历史文献的材质主要是纸张,我国古代的造纸技术,在选择原料方面一般比较多地使用麻、竹、皮、草等原料或者其他植物纤维,宋苏易简《纸谱》“蜀人以麻,闽人以嫩竹,北人以桑皮,剡溪以藤,海人以苔,浙人以麦面稻秆,吴人以茧,楚人以楮为纸”[3]由于纸张易受潮、霉变、虫蛀、褪色、折污、易燃,对存放环境要求较高.

博物馆传统型文物藏品库房以“十防”(防震、防雷、防火、防盗、防虫、防尘、防潮、防干、防光、防污染)为基本要求,无法保障藏品始终处于一个适宜的温湿度环境中,而温湿度的变化对文物藏品材质的老化有着重要的影响,这主要是因为文物是由材料构成的,而材料都是由分子、原子按一定规律排列而成的,这些分子、原子在温湿度不适合或变化较快的环境里,会打破原来的排列规律,使材料老化变质.

建成于2005年的首都博物馆现代型藏品库房采用先进独特的智能化空调系统,可以根据不同材质的藏品库区提供不同的温湿度,将相对温湿度的变化幅度控制在2%以内,极大地保证了藏品存放安全.同时馆文物保护修复中心成立了环境监测组,负责检测文物藏品环境,将文物藏品环境数据报告给物业部,物业部根据数据调整环境控制设备,确保文物藏品处于合适的环境.根据文物藏品保护的要求,检测的环境指标包括:温湿度、光线、可吸入颗粒物、甲醛、苯、甲苯、二甲苯、氨气、臭氧、硫化氢、二氧化硫、一氧化氮、二氧化氮等[4].一般情况下,环境监测组的工作人员会定期监测文物藏品库房环境,对于展厅的文物每天要监测2~3次.

参照中华人民共和国国家标准《图书馆、博物馆、美术馆、展览馆卫生标准GB9669—996》中对纸质文物保存环境的建议指标[5]:温度16 ℃~18 ℃,相对湿度50%~55% RH.首都博物馆对纸质文物库房环境进行控制和监测,包括选用无紫外线的光源和控制环境的温度和相对湿度,一般温度18 ℃~22 ℃,湿度45%~55% RH,将相对温湿度的变化幅度控制在2%以内,对环境空气进行净化,控制有害气体含量,使库房环境达到国家标准,消除昆虫、微生物的孳生环境,使纸质文物处于良好的保藏环境中.

首都博物馆在纸质历史文献藏品入库之前,采取了药品杀虫法,使用由赤磷和铝粉烧制而成的磷化铝进行消毒,并在每年中国农历二十四节气中的第三个节气惊蛰前后,在纸质藏品库房内放置樟脑,有效地降低了虫蛀的几率,一旦发现有被虫蛀、霉菌沾染的纸质文物,及时用低温冷冻进行杀虫灭菌消毒处理.

近十年来,众多以“文献”命名的专题博物馆陆续出现,2018年中国博物馆协会成立“图文典籍与金石拓片”专业委员会,说明纸质历史文献藏品在博物馆界越来越受到重视.

2 纸本时代博物馆历史文献的研究与利用

首都博物馆自20世纪50年代末开始陆续收存了一批珍贵的历史文献——契约文书档案,时间跨度从清代到建国初期,历时300余年,数量众多,种类丰富,体系完备,能够较为全面地代表北京整个地区民间契约文书的概貌,是反映自清始北京地区社会经济状况的最原始文字记录,是见证区域文明发展的弥足珍贵的地方史料,是一座丰厚的学术资源宝库,这批历史文献长期处于封存状态.

20世纪90年代始,首都博物馆派专人对这批契约文书进行初步清理,2000年建立了契约藏品库房,进行系统的整理登记工作,将2万余件套契约文书大致分为地契、房契、析产书和其他合同四大类.

新馆建成并正式运营以后,首都博物馆对这批珍贵的历史文献资料进行了抢救性的整理挖掘工作,先后获得了国家清史编纂委员会、北京市哲学社会科学办公室、北京市文物局等国家机构专项经费的支持,完成国家清史编纂委员会、北京市哲学社会科学办公室两个课题《首都博物馆馆藏清代契约文书》《首都博物馆藏北京地区经济史资料整理与研究——窑契与经济合同文书》,并分别采取了影印和录文两种方式将课题成果结集出版问世.

为了最大限度地保存契约文字内容的完整性、真实性,在修补过程中一定要注意对字迹洇散、损伤严重的契约原件的恢复处理,若处理不好就会影响历史文献的整体意思,因为文字才是历史文献真正价值之所在,这是由历史文献具有特有的专业属性和内容特性所决定的.

3 “数字人文”与博物馆

近年来一个鲜为人知的概念“数字人文”被越来越多地提及,它源于20世纪40年代末期的“人文计算”,1949年意大利学者贝托·博萨首次将计算机技术用于编撰人文领域书籍,开启了计算机领域与人文社科领域合作的先河.随着互联网的出现、多媒体技术的发展、人文资料的数字化,人文计算逐渐拓展到历史学、文学、艺术学等领域.2004年美国学者约翰·昂斯沃思等在《与数字人文相随》一书中首次提出“数字人文”概念,并逐渐取代“人文计算”成为计算机在人文社科领域开展合作研究的代名词.

最早把“数字人文”这个概念带入博物馆领域的是美国人:2015年美国国会博物馆公布了开展一项名为“拯救我们的收藏”的在线资源服务[6],为人们保存、共享书籍、照片、论文及资料,并提供相应的存储、处理等信息服务,不可避免地用到了数字人文研究对数字信息的处理整合.2016年美国新媒体联盟的《地平线报告(博物馆版)》中首次明确提出了“数字人文技术”的概念[7].

那么究竟何谓“数字人文”呢?目前“数字人文”的概念尚无统一界定,采用较多的是王晓光教授的观点“数字人文实质是一种关于人文方式和研究方式的学术创新,通过把时代最新的科技、信息技术和人文研究结合起来,从源头上改变人们对知识的获取、理解、表述和呈现方式”[8].

相对于在数字人文领域已经取得了一定进展的图书馆、档案馆领域而言,博物馆领域的数字人文起步较晚,目前主要运用于博物馆数字化管理平台及展览展示技术,上海博物馆率先在文博界推出比较成功的案例:2018年由上海博物馆主持开发的博物馆数字化管理平台通过验收,并于同年5月3日开始投入运用,这是一个全面基于数据的数字化管理平台,在国内尚属首创;2018年12月7日至2019年3月10日“董其昌大展”在上海博物馆展出,“董其昌数字人文”书画专题是数字化管理平台系统的一个子项目,通过数据库的分析,可以清楚地知道董其昌生平、活动地区、游历轨迹、师友子侄学生关系网等信息,并将其可视化、立体化,令观者耳目一新.

4 数字时代的博物馆历史文献

就博物馆历史文献而言,同样面临着新技术的变革,过去很长一段时间里,我们主要依靠编制目录索引、撰写提要、制作缩微胶卷、复印和影印出版等方式来获取历史文献中的文化信息,虽然这些办法在那个传统的、相对隔绝的纸本时代是行之有效的,但人们获取信息渠道单一、有限,速度缓慢,同时繁复的触摸阅读、手抄笔录,费时费力不说,对纸张本身也有不小的损害.

历史文献在现代化藏品库房环境中,智能化空调系统虽然为它的收藏提供了良好的技术保障,但不可抗因素造成的损坏依然无时无刻不在销蚀着它,“数字人文”为解决这些问题提出了全新的方法和思路,最直接的体现是历史文献数字化和数据库建设,最典型的是将实体文献扫描为数字文献,并通过数据库来集中揭示,借助数字技术,实现历史文献的数字化存储和永久性保护,历史文献是一种特别稀有、不可再生的文化遗存,开展历史文献的数字化建设,加强历史文献管理与维护,是当前大数据时代博物馆历史文献最关键、最合理、最有效的保存途径和方式.

历史文献藏品的数字化工作实质上是一个将传统的纸本介质文书资料通过计算机技术转化为数字化信息资源的过程,并科学地揭示各资源之间的内在联系,实现高效查询,以达到资源共享、服务社会的最终目的.

一般讲,历史文献藏品的数字化工作主要包含两部分内容:数字化与数据化.

4.1 数字化

所谓数字化,就是通过运用拍照与扫描两种形式,将历史文献的物理形态转化为电子形态,其目的是为了建立图档,更加有利于保存.

文献藏品数字化是一道比较简单的工序,为了减少扫描对原文献的损伤,尽可能采用多种规格高档平板彩色扫描仪对原件进行扫描,比如:博爱Bookeye3非接触式书籍扫描仪、德国赛数公司(zeutschel)的Zeta自助型书刊扫描仪等.

在拍照或扫描的过程中要注意以下几点[9-10]:

首先,根据实际需求用灰度扫描或者彩色扫描两种.其次,要科学设置图像扫描相关参数,如色彩、扫描精度等,参数要与图像的显示分辨率相匹配,其中图像的分辨率最少也要达到150dpi;如果需要永久保存的,图像分辨率要达到300dpi;古籍文献的拍照像素最低要确保在2000万像素.第三,文件保存格式需要确保较高的共享度,最好是未经处理、未经压缩的数字底片RAW格式.第四,拍照的时候要注意拍摄的视角与光线的运用.第五,对扫描后的图像进行处理包括拼版、裁切等,以确保扫描后的图像是完整的,并能够系统、科学、完整地体现出文献的真实.

目前首都博物馆馆藏历史文献已全部经过数字化扫描,建立了电子图档,研究人员可以在首都博物馆信息综合平台上查阅,电子图档按地契、房契、析产契、流水账、其他分为五类.

4.2 数据化

数据化过程是建立数据库,主要进行以下2项工作:

首先,要对文献藏品进行主题文档编辑,建立全文数据库,等待上传平台备用.

数据化过程是一个比较复杂的过程,是数字人文研究的基础,通过使用成熟通用的数据库建设软件,按“契约文书分类标准”“契约文书元数据著录规则”对拍照或扫描的每一份契约文书进行元数据标引及内容分类,通过数据的后台管理和索引整理,最终形成通用的网络数据库.

其中描述元数据规范及著录标准问题较为关键,元数据又称中介数据(中继数据),即数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能.元数据是一种电子式目录,为了达到编制目录的目的,必须描述并收藏数据的内容或特色,进而达成协助数据检索的目的.

就契约文书而言,目前国内尚无统一的契约文书描述元数据的规范与标准,各机构分别制定自建元数据方案,在资源互操作与关联方面也较为薄弱.

首都博物馆契约文书涉及区域主要以北京地区为主,收藏集中,自成一体,尚未像敦煌文书、徽州文书那样形成专门的学科(流派),也没有像察合台文契约文书、清水江文书那样已经摸索出一套经验,因此在不考虑规范化、互操作性、资源关联等方面的前提下,也可以像敦煌文书、徽州文书、清水江文书已建或在建资料数据库采用自建元数据方案的做法,在数据库建设前要参照国家《专门数字对象描述元数据规范》制定“首都博物馆契约文书描述元数据规范”及“首都博物馆契约文书元数据著录规则”,经参阅陈洪波、杨存林、赵剑锋等人研究成果[11-13],笔者以为对于首都博物馆契约文书的核心元数据的抽取,可以考虑主要从以下几个方面内容入手:

(1)契约名称:采用“文书签订时间+立契人+文书类别”的格式顺序进行,与首都博物馆契约文书大帐格式相同,文书签订时间采用“年号+公元纪年”,数目在一人以上的立契人至少要写二个,并写明“等人”,文书类别一般注明红契、白契或文书名称,如执照、由单、收据等等;

(2)主要责任者:立契主体或文书的发布者及其所处时代;

(3)其他责任人:中人(证人等)及其所处时代;

(4)书写地:即立约地,采用“所属县+乡镇+自然村+归户”格式顺序;

(5)书写时间:采用“年号+公元纪年+月+日”格式顺序,注意契约文书时间一般按农历计,民国以后有按公历计;

(6)主题:有关契约文书的描述,与契约内容有关的主题词、关键词、分类名;

(7)载体形态:契约文书的纸张,著录契约类型或电子文件格式等;

(8)收藏历史:包括资源的持有者或现收藏者的收藏情况,如馆藏信息著录契约的典藏号、馆藏地址、允许使用的用户范围及其他复本信息等.

张洁李芳汤萌《契约文书描述元数据规范设计与应用》、赵思渊《地方历史文献的数字化、数据化与文本挖掘——以“中国地方历史文献数据库”为例》诸文[14-15],则从该类型资源的组织与互操作、兼容性、关联性等方面考虑,提出要设计易于使用与关联的契约文书描述元数据规范,为该类型资源的组织与互操作提供解决方案.实际上由于中国地域广袤,各种类文书分布散落,语种繁多,制定一个统一的契约文书描述元数据的规范与标准目前还是有一定困难的.

建立首都博物馆契约文书信息数据库是解决首都博物馆契约文书收藏、保护、开发、利用问题的最好出路,如果以首都博物馆全部契约做研究对象,建立《首都博物馆契约文书资源库》全文数据库,我们还要制定科学的分类方法和检索方式,数字化需要从更多角度进行,首都博物馆契约文书可以参考中国社会科学院历史研究所出版的《徽州文书类目》结合《中图法》的划分标准和编排体制进行要简单一些[16],分类整理是一项学术性很强的科研工作,需要一整套科学规范的分类著录体系和正确合理的工作方法,要求整理人员掌握丰富的历史知识和多种专门业务知识,这是历史文献数据化的基础.

第二项工作是选择或研发相应的平台,以供文献上传与检索.

经参考新疆大学图书馆建立“察合台文古籍和契约文书全文数据库”所采用的德赛(DESI)4.0及贵州凯里学院图书馆建立“清水江文书数据库”所采用清华同方TPI6.0等平台软件介绍[11-12],鉴于本馆已购置了同品牌的相关设备,建议可以考虑选择清华同方TPI6.0信息资源建设管理平台用于建设馆藏契约文书数据库,TPI6.0是清华同方技术有限公司生产的专业数据库制作管理系统,是一套基于网络平台上用于知识仓库创建、生产、管理维护和发布的工具软件系统,它是一套成熟通用的数据库建设软件,具有良好的可拓展性和强大的信息采集能力,能实现多种数据库格式的数据转换,与其他系统有很好的兼容性,可以实现馆藏契约文书的信息组织、原文存储与检索网络发布等多种功能.

由此可见,历史文献的数据化过程是一项非常复杂并且涉及面很广的系统工程,目前在将历史文献转化为文本信息时还存在着一些技术问题,主要是历史文献的文字问题,因为历史文献多数是由人手工进行记录和书写的,比如民间手书白契,所用文字存在着大量的简化字、繁体字、俗体字、异体字、通假字、讳字、僻字等,有的行书潦草,甚至用笔偷工减料,字迹奇形怪状,实难识别,只能根据上下文的意思猜,OCR识别技术目前也无法解决此类问题;同样古籍中的抄稿本也存在这个问题,需要进行文本核对,消耗许多人力和财力;此外历史文献中还存在不使用标点符号、不进行段落划分、从上到下进行书写等问题,不能简单地进行数据信息转化;同时历史文献中的各种资料没有统一的大小和尺寸标准,所属的朝代不同,各有各的形态等……所以说实现历史文献数字化过程中还是有很多问题需要解决的.

5 首都博物馆历史文献的“数字人文”研究构想

当前国外文献档案数字人文项目主要包括GIS历史地理可视化项目、语料库建设项目、历史资料库建设项目、社会及历史场景重建项目、档案数字化项目五大类[17],这些技术已经在国内文献档案数字人文研究方面得到应用.

首都博物馆清代契约文书、窑契、经济合同文书等部分已经得到有效的开发利用,计约6000件套左右,窑契部分最为完备,采用了影印与全文录入相结合的方式,如果作为首博“数字人文”研究的示范,窑契应该说有着比较好的基础,其他绝大部分契约只是经过了数字化图像处理,尚未数据化,如果将其全部开发利用,将是一项浩繁的巨大工程.

开展首都博物馆历史文献的“数字人文”研究项目,以基础较好的窑契为例:结合可视化理论及GIS地理信息系统、数字计算等“数字人文”技术相关理论与方法,基于《首都博物馆藏北京地区经济史资料整理与研究——窑契与经济合同文书》记录的门头沟窑契信息进行系统分析,通过从窑契中提取其信息,年代、窑址、窑主名等等,探寻窑契在门头沟地区分布的时空等分布差异及原因等情况,以此揭示出自清代到民国这一历史时期门头沟煤窑发展的些许概貌.

2020年藏品部马悦婷博士的论文《首都博物馆馆藏墓志出土地点的空间分析》为我们做出了良好的示范,通过提取馆藏魏晋——清代墓志出土地点的信息,利用Arcgis对墓志的位置信息进行重心计算、核密度分析和地貌分析等三种空间分析和地统计分析,以揭示出墓志分布的时空规律.

此外,蒋勤《基于石仓文书的清代物价数据库建设》、王哲《历史空间数据可视化与经济史研究—以近代中国粮食市场为例》、仲伟民、邱永志《数据估算与历史真实—中国史中GDP估算研究评述》、熊金武《量化历史:经济史学的新范式》诸文[18-21],为我们建立专题数据库进行量化分析研究提供了很好的范例,可以使研究人员对馆藏契约文书中的交易价格、银钱比价、度量衡及兑换关系、货币单位及兑换关系、土地房屋买卖分布特点、买卖方式等方面信息进行系统量化分析,也许能够发现靠传统文献阅读无法发现的隐藏在历史资料堆中的史实[15],为我们的学术研究提供新的视角和依据.

6 结语

历史文献已经成为多学科研究的新材料,特别像首都博物馆馆藏契约文书这类民间文化遗存,较为全面地代表北京整个地区民间契约文书的概貌,是反映自清始北京地区社会经济状况的最原始文字记录,是见证区域文明发展的弥足珍贵的地方史料,是一座丰厚的学术资源宝库,馆藏历史文书所提供的资料,不仅可以补充正史文献记载的不足,同时可以让我们复原一个丰富多彩的民间历史记忆,窥见活生生的民间社会生活,对探索从清代到建国初期历时300余年间北京地区基层社会实态,无疑具有非常重要的价值以及深远的意义.

但是,收藏的封闭性影响这批学术资源的有效利用,重收藏轻利用,使契约文书秘藏而不能服务大众,服务社会,对于研究者要想全面了解和利用这批珍贵的学术资源来进行研究较为困难,不能不说是一件憾事.

如果可以借助现代“数字人文”技术对此开发利用,进行大数据分析与研究,这对传统社会科学研究方法来说是一种全新的探索与尝试,“数字人文”不仅为我们保护馆藏历史文献提供了新的途径,也为本馆的文物研究开启了新的思路和方法,通过专题性数据库和综合性数据库的建立,挖掘馆藏文献的系统性和关联性等情况,对“碎片式”的文献与研究进行有机缀合,有助于全景式北京区域经济史的建构,为社会人文研究中方法与视野的演习贡献了一个不可多得的平台,这对于以研究北京地方史为主旨的首都博物馆来说是十分有利的,不仅可以丰富首都博物馆的展览内容,也可以提高首都博物馆的科研水平.

要注意的是,虽然在今后的历史文献数字化过程中,数字人文导向将是一个总的趋势:一方面计算机技术带来的革新使得研究者可以更高效率地建立并使用数据,给传统的社会人文学科研究方法带来深刻的变革;另一方面以“数字人文”这一理念的兴起引导了数据库建设、开发思路的转变,社会人文学科研究者不再是被动选择既有的数据库,同时也参与数据库建设过程,由其自身研究需要引导数据库开发,数据库开发过程也就成为其研究的一部分.数字时代,传统的社会人文学科确实遇到新的挑战,但是“大数据”终究只不过是一种新的更加有效的工具而已,不可能从根本上取代其客观主体——社会人文学科的研究者们,而是在符合学科特点的基础之上,社会人文学科与计算机学科等领域携手合作,更有效地利用信息技术,以推动相关学术研究的深化发展,这才是数字人文时代的真正意义所在[22].

猜你喜欢

历史文献首都博物馆文书
太行山文书精品选(17)
古陶瓷修复中有色补配材料筛选实验研究——以首都博物馆馆藏青花鱼藻纹大缸为例
监狱执法文书规范探讨
以博物馆受众为核心的微信运营模式探究——以首都博物馆为例
黑水城出土《宋西北边境军政文书》中“砲”类文书再讨论
历史文献在高中历史教学中的作用
首都博物馆画院2015年度中国画作品展
从历史文献看唐代官吏管理制度
关于回鹘文书中几个词的探讨
《英藏敦煌社会历史文献释录》(第一卷)补校