面向数据库建设的少数民族口述历史档案整理
2020-12-07邱志鹏高建辉黄天娇
邱志鹏 高建辉 黄天娇
摘 要 少数民族口述历史档案对民族历史传承和民族社会记忆有跨时代的意义和价值,是各族人民世代相传并视为其文化遗产组成部分的各种传统文化表现形式。该文分析了少数民族口述历史档案的理论研究和实践情况,提出基于数据库建设的少数民族口述历史档案整理原则和流程,探索出一套完整的整理方法和要求,在一定程度上推动我国少数民族口述历史档案的数字化保护和研究工作。
关键词 数据库 少数民族 口述历史档案 整理
中图分类号 G270.7 文献标识码 A 收稿日期 2020-03-26
★基金项目:国家社会科学基金项目“西南彝族口述历史资料搜集整理及其有声数据库建设”(项目编号:16XTQ008)。
★作者简介:邱志鹏,云南大学博士研究生在读,主要研究方向为档案学、历史文献学、民族档案管理等领域;高建辉,云南大学博士研究生在读,楚雄师范学院图书馆副研究馆员,主要研究方向为图书馆学、历史文献学、数字化与数据库建设等领域;黄天娇,云南大学硕士研究生在读,主要研究方向为民族档案学。
Abstract The oral historical archives of ethnic minorities have epoch-making significance and value for the inheritance of national history and the memory of national society. They are expressions of various traditional cultures that have been passed down from generation to generation and regarded as part of their cultural heritage. This paper analyzes the theoretical research and practice of the oral historical archives of ethnic minorities, puts forward the principles and procedures for the compilation of oral historical archives of ethnic minorities based on database construction, and explores a complete set of compilation methods and requirements, which promotes the digital protection and research work of ethnic minority oral historical archives in China to a certain extent.
Keyword database; ethnic minority; oral historical archives; compilation
一、少数民族口述历史档案整理工作概述
1.理论研究述评。近年来,随着口述史和口述档案研究的逐步深入,国内档案界的一些专家学者开始关注少数民族口述历史文化的传承与整理研究等热点问题。传统的少数民族口述历史档案整理工作方面,2013年,习晓耀阐述了纳西族东巴口述文献分类整理的发展、纳西族东巴口述文献分类整理的特点[1]。2018年,雷鲁嘉在其硕士论文中提出,少数民族口述档案整理工作不单单是对口述音频、视频的转录工作,同时也包括对采集到的相关资料,例如文字、照片等资料,进行整理[2]。2015年,解晓丽对裕固族口述档案进行分类整理,将其分为历史口述档案、伦理口述档案和民俗口述档案[3]。
基于数据库建设的少数民族口述历史档案整理方面,2011年,赵局建对云南少数民族口述档案数据库构建的意义、内容和原则进行了探讨[4]。2017年,冯云提出了在数字化语境下构建西藏自治区非物质文化遗产传承人口述史数据库抢救口述文化记忆的设想,并就数據库资源的采集、存储、管理、检索与利用以及所涉及的知识产权等问题进行了探讨[5]。可见,目前国内档案界对少数民族口述档案的整理研究较为零散,研究也只是对整理工作的某一环节或几个环节进行阐述,而没有较为系统全面地研究少数民族口述档案的整理工作。
2.实践工作述评。新中国成立以后,党和国家高度重视少数民族民间文艺的保护与整理工作。1958年,我国召开了第一次全国民间文学工作者代表大会,提出了我国少数民族口头文学遗产抢救问题,广泛收集与整理少数民族口述资料。20世纪60年代,湖南省成立“少数民族文学工作委员会”,收集了大量少数民族口述档案,并对其进行整理加工。2000年9月,中国社会科学院的重大项目“中国少数民族文学资料库”提出建立“少数民族口承史诗资料分库”和“活态神话资料分库”[6]。武陵山区少数民族口述历史档案丰富,目前已建立一个资源丰富、远程搜索的口述历史数据库,该库可为读者探索武陵山少数民族历史提供数据[7]。云南省少数民族口述历史档案丰富,经实地调研得知,云南省档案馆保存了15个少数民族口述历史档案,只有小部分进行后期整理,大多口述采访资料,例如采访录音、录像、原始照片等档案,还未加以规范化整理。楚雄师范学院图书馆建立的西南彝族口述历史资料数据库,内容丰富,整理规范,在国内处于领先地位。该资料数据库收录了大量的彝族口述历史资料,多以音频、视频呈现。数据库共分七个栏目,包括历史政治、语言与文学、歌谣与艺术等[8]。可见,我国少数民族口述档案实践工作取得了一定的成果,但整理主体较为单一,相关部门未出台系统的整理标准,且也未进行较为系统、全面的整理。
二、少数民族口述历史档案整理原则和流程
1.整理原则。少数民族口述历史档案整理工作应符合档案的管理要求,为实现价值创造有利条件,在整理少数民族口述历史档案时要遵循以下原则:
(1)以事件或人物为整理单位。按照少数民族实体档案的整理方法,口述访谈资料应单独建立全宗,那么全宗内档案应按“民族—人物”或“民族—事件”进行分类整理。少数民族口述历史档案内容主要涉及少数民族各种活动、少数民族历史事件、少数民族上层人士经历、少数民族非遗传承人的手工艺或技术要点等。在整理工作中,以事件或人物为整理单位,与采集内容相对应,符合采集内容和主题。同时以事件或人物为整理单位,分类方案清晰,易于操作,便于整理,有利于保持档案的原始性。
(2)保持口述记录材料的原始性。我国档案界在档案整理工作中遵循“充分利用原有基础,保持文件之间的历史联系”的原则。那么在整理少数民族口述历史档案时也要遵循该原则,还原“原汁原味”的记录材料。保持材料原始性主要体现在两个方面:第一是内容材料的原始性,第二是记录形式的原始性。在原始稿整理时,整理者最好选择最熟悉访谈情况和内容的专业人士,整理者不得任意增减口述者口述内容,需忠实口述者的原话,不可掺杂个人观点和意图,保持口述内容的原始性。记录形式上,在口述抄本原稿整理时应保持采访时的记录形式。
(3)符合档案管理要求,便于数据库建设。少数民族口述历史档案的整理应借鉴档案管理学的相关方法、措施、手段和原则,并根据少数民族口述历史档案的实际情况,探索出一套符合档案管理要求、便于计算机管理的科学方法。2018年1月1日开始实施的《口述史料采集与管理规范》中规定:“口述史料整理应符合档案管理要求,便于计算机管理或计算机辅助管理。”[9]随着档案信息化建设的发展,口述档案的数字化、网络化势在必行。在整理收集到的口述档案时,我们应按照国家档案局发布的相关标准,例如《中国档案机读目录格式》[10]《归档文件整理规则》《电子文件归档与管理规范》《数码照片归档与管理规范》等,进行口述档案的整理工作,为口述档案数据库的建设提供便捷的途径。
2.整理流程。通过反复实践和总结,基于数据库建设的少数民族口述历史档案整理流程如图1所示。该流程分为三个阶段:准备阶段、电子文件处理阶段和元数据生成阶段。在准备阶段,要明确整理内容,准备好数字化相关的软硬件设备,对原始档案进行数字化处理,制作口述文字记录稿,本階段是整理工作的基础,为后续工作提供了原始材料。电子文件处理阶段主要是对少数民族口述历史档案的电子文件进行编辑,形成适合于数据库检索和利用的新文件,处理环节包括规范化处理、按类分割和有序存储,本阶段可以决定数据库的数据规模和全文质量,为后续的著录工作奠定基础。元数据生成阶段是整理最重要的阶段,包括存储后档案的标引著录和数据的导入,其中著录工作是所有环节中消耗人力物力最多的环节,著录的质量直接决定了数据库检索、统计和利用等主要功能的使用效果,著录的详细程度和规范程度是数据库区别于数字资源库的重要标志。
三、少数民族口述历史档案整理方法和要求
1.前期准备,明确整理内容。少数民族口述历史档案由不同形式的载体组成,主要包括采集过程中形成的文字、照片、录音、录像[11],具体内容参见表1(见下页)。
少数民族口述历史档案按不同内容可分为基本信息记录材料、主题事件内容记录材料、实施情况材料[12],具体内容参见表2。
一份完整归档的少数民族口述历史档案还应包括访谈提纲、受访者的背景资料、报纸杂志和广播电视对受访者的相关报道、访谈时受访者提供的信函和受访者对口述资料的处理意见、访谈工作总结等。
2.原始档案的数字化处理。很多口述历史档案采集时就已经是数字化的,直接拷贝到计算机即可进行下一步的处理,但还有一部分历史年代久远的档案存储在磁带、录像带和纸质材料上,需要先对这部分档案进行数字化处理。对于磁带、录像带上生成的档案,利用u-matic、betacamd等录像带无损采集转换技术将磁带、录像带上的内容转换到计算机上。数字化之后除了要保留口述档案文件以外,还要记录档案的相关信息。口述纸质历史档案的数字化方式有扫描、拍照、文字识别和人工录入,鉴于口述档案的特点,采用人工录入较为常见。此外,还有部分口述记录稿是用少数民族文字撰写的,这类档案需要进行扫描和翻译后再人工录入为文本格式。数字化处理之后的文件保存目录为“文件格式—收集时间”。
3.制作口述文字记录稿。制作口述文字记录稿是指将采访时形成的原始录音、录像、临时记录稿等原始档案通过语音识别或听录的方式转录为文字记录材料,保存在计算机中。在这一过程中,采集者要对口述者的记录和原始档案进行认真核对、校正,避免由于口述者年龄、口齿、方言等因素造成的误差。进行文字记录整理时,对口述者以方言方音讲述的重要地名、人名、风俗等,应采用国际音标注音法标注[13]。在转录文字记录时,采访者应基于档案的原始性来进行转录,不得任意增减受访者意愿,忠实于受访者的原话,不得掺杂采访者的个人观点与意图。即便受访者谈及的事件背景、内容与查核的资料不一致,或者访谈中出现前后不一致的情况,也应保持采访者的客观立场,对少数民族口述历史史料进行比较分析,对采访者的情绪、语气进行正确的理解,并用文字做好恰当的标识[14]。
文字记录应尽可能按照实际采访过程中提问及回答的先后顺序,采用一问一答的形式进行转录[15]。文字记录的转录工作最好选择专业人士,转录工作一般可选择三种人选:第一是对采访内容较为了解并精通采访时所使用的民族语言的专业人士;第二是访谈者;第三是新闻传媒专业或相关专业的学生[16]。对已整理好的文字记录材料,应征求受访者的意见或请受访者校核,确定是否有需要补充或修改的地方,尽量尊重和保留口述者的意图和表述。
4.数字档案的规范化处理。数字档案的规范化处理是指利用计算机和专业软件对于数字化之后的少数民族口述历史档案电子文件进行编辑,为数据库建设提供统一化规格的档案数字资源,使其符合数据库建设和互联网传播的要求。规范化处理时要根据不同类型的文件分别进行,处理前要对原文件进行备份,统一处理的内容包括文字编码、文件格式、图片尺寸、视频分辨率、文件大小、音频质量等。其中,图片分辨率一般压缩为1920*1080,文件大小控制在1M左右,图片色彩明暗适中,处理后的文件采用JPG格式保存。音频处理工具采用“Cool Edit Pro”,处理完之后的文件一般采用MP3(320K)格式进行保存。视频处理工具采用“Adobe Premiere Pro CC”,处理内容主要包括色彩调节、人物美化、添加字幕、编码格式转换、封装格式转换等步骤,编码一般采用H.264或H.265,封装格式一般采用MP4,添加字幕时需参照口述档案文字转录稿进行。
5.规范化档案的按类分割。数字档案的分割是指把一个完整的口述历史数字档案文件按照内容所描述的不同主题分割为若干片段,使下一步著录的内容更加详细和精准,使利用者能够更好地挖掘档案中的信息。文件分割一般按文件类型分别进行,在分割之前要对原文件进行备份。首先,文本口述档案一般都经过了整理,逻辑性较强,对其进行分割的方式包括三种:一是按章节分割,适用于一般性口述档案材料;二是按史诗、故事或歌谣分割,适用于记录史诗故事的图书和文章;三是按问题进行分割,适用于采用问答形式记录的口述资料。其次,音视频口述档案的分割方式主要是按主题进行,分割时应以采访人所提的问题和现场笔记为依据,仔细听取被采访人所讲述的录音内容,其间若有和采访问题不相关的录音内容应过滤删除,同一个主题的内容出现在不同录音时段时应剪切合并成同一段录音,尽量做到分割出来的录音内容和采访问题的主题一致,最后把分割出来的音视频另存为一个新的文件,新文件应按照分割的时间先后顺序命名,但不能改变原有文件的格式属性。为保证资源的最大化利用,同一个口述历史档案分割出的不同主题内容越多越好。
6.分割后档案的有序存储。对于分割后新产生的口述历史档案电子文件,需要进行有序化存储和简单标记,其目的是便于下一步的著录标引,并与原文件进行区分,保存后的文件同样需要进行备份。在文件保存时可以参照口述档案的分类方法来设计文件夹目录结构,分割后少数民族口述历史档案资源在计算机中存储目录结构一般为“民族——口述者——文件格式——处理时间——具体文件”。在进行文件有序化存储时,要把不同处理日期或者不同批次采集的同一口述者的口述档案合并到一个文件夹,并按处理日期分开存储。
7.存储后档案的著录标引。存储后档案的著录是指对存储后档案的内容特征和形式特征进行分析、选择和记录的过程。著錄对存储后档案有介绍、登记、报道等功能,对利用者检索少数民族口述历史档案数据库有重要意义。存储后档案的标引是指对存储后档案的内容特征进行分析和选择,并赋予其规范化检索标识的过程。著录的具体要求可参照国家档案局的《口述史料采集与管理规范》和楚雄师范学院图书馆的《彝族口述历史资料著录标准》。著录标引工作既要对档案内容进行深度揭示与加工,也要多维度地描述少数民族口述历史档案的内容,同时还要通过著录标引体现少数民族口述文化的历史价值[17],为数据库建设提供详述信息。
8.相关数据导入数据库。相关数据导入数据库包括元数据的导入和分割后文件的导入。导入前需由技术人员检查审核数据的规范性和完整性,并由特定(特殊授权)的专业人员操作数据库后台软件,把EXCEL表格导入数据库,其他人员一律不得进行该项操作;导入后要在前台对导入的数据进行测试,核查各类数据的显示、浏览、下载、检索等功能是否正常。导入方式分为批量导入和单条导入:批量导入适用于一次性导入较多的数据;单条导入适用于急需上网的数据,一般在后台直接把单条数据的信息录入数据库。分割后的文件按要求直接复制到服务器上指定的路径即可,但要注意元数据的条目与该文件一一对应,分割后导入的文件的名称按照一定的规律编号,与保存元数据的EXCEL文档一起存放于同一文件夹中,文件夹按时间顺序命名,便于该文件的查找。
参考文献
[1]习晓耀.纳西族东巴口述文献的采集、整理与保护研究[D].昆明:云南大学,2013.
[2]雷鲁嘉.我国少数民族口述档案的采集及其保障研究[D].南京:南京大学,2018.
[3]解晓丽.裕固族口述档案的构建与保护[J].兰台世界,2015(14):46-47.
[4]赵局建,康蠡,杜钊.构建云南少数民族口述档案数据库的若干思考[J].云南档案,2011(11):35-37.
[5]冯云.西藏自治区非物质文化遗产传承人口述史数据库建设探讨[J].西藏研究,2017(6):99-104.
[6]陈子丹.少数民族口述历史档案研究[M].昆明:云南大学出版社,2015:150-151.
[7]彭燕.少数民族口述历史数据库建设与研究——以武陵山区少数民族口述历史数据库为例[J].图书馆,2014(5):119-121.
[8]楚雄师范学院图书馆.师有福讲述红河州民族研究所成立过程[EB/OL].http://yzksls.cxtc.edu.cn:8081/info/6040.jspx,2019-03-21.
[9][11][12][13]DA/T 59-2017,口述史料采集与管理规范[S].北京:国家档案局,2017.
[10]钱毅.档案数据库质量控制的内涵与策略[J].档案学通讯,2015(6):56-60.
[14]朱丽梅.口述档案整理与分析探讨——以华南理工大学建立口述档案为例[J].中国档案,2012(6):53-54.
[15][16]陈子丹.少数民族口述历史档案研究[M].昆明:云南大学出版社,2015:114.
[17]彭燕.文化传承视角下土家族口述史料编目研究[J].图书馆学研究,2019(3):68-77.