口述历史的前端控制:基于“中国电影人口述历史项目”的案例研究*
2019-12-16张锦
张锦
(中国电影资料馆 中国电影艺术研究中心 北京 100082)
现代口述历史始于实践(标志是1948年哥伦比亚大学口述历史研究室的成立及其口述历史项目的开展)以及实践的整合与规范化(标志是60年代后半期美国口述历史实践的整合)。如果说口述传统是一个既有社会形态的学术发现的话,那么口述历史则是人为实践的发明。口述历史本体从本质上是作为一种视听档案实践,[1]实践依赖是这个领域研究的基本特征。定宜庄认为口述史作为一门学科“仍然不算成熟”:“在国内,它似乎还处于‘跑马圈地’阶段,学者们更热衷于登高一呼……亲身实践者、尤其是长期投入的实践者却反而人数不多,且观者寥寥,显得颇为冷清寂寞,与前者的热闹恰成鲜明对比。我则认为,在一个学科的初兴阶段,实践是最重要的。真正的乐趣、真正的体验、真正的问题,都是在实践里表现出来的。”[2]
反过来,简单盲目地进行口述历史实践也没有太大的学术意义,实践的同时也需充分了解国内外既有的理论与实际操作经验,并有自己的独立思考。本文基于单一的案例讨论口述历史实践的前端控制问题,希望通过对这种涉及具体实践中遭遇到的问题的更实际的探讨,形成与国内口述历史同行实践之间的交互,进而达成全国性共识。
1 口述历史:前端控制与规范化
1.1 社会信息控制说视野下的前端控制与口述历史
前端控制作为现代档案管理的一个重要理论,要求档案管理从文件产生源头就开始介入并实施控制而不是被动等待文件归档。而在笔者看来,这是现代档案系统增强其社会信息控制能力的一个表现。上个世纪末,图书情报档案学科领域伴随国外信息资源管理学说的引进曾引发过一场与更早的信息交流学说的论战,笔者分别曾从1997[3]和1999年[4]开始从图书馆学领域公开自己的社会信息控制学说参与论战,随后经过长期系统研究,扩展到档案学乃至整个信息与传播研究领域,[5]并将其作为信息与传播研究学科群的哲学基础。很大程度上,笔者各学科领域的研究均以这一哲学思维为基础,但本文论题与此关系更加直接。对档案学来说,即便是在传统主流的文字-纸质档案时代,文档原本就是一体的广义档案系统,控制就存在于文档体系中,隐藏在制度化的惯例背后。前端控制思想一部分原因在于现代社会特别是新信息技术条件下原来文档体系面临的崩溃危机,也因此,这一理论更广泛应用于那些前端阶段控制相对缺乏的领域,尤其成为电子文件全程管理的基础。与之相似,也新技术时代的视听媒介,因此,原本就游离在文档控制体系之外的视听档案就更加需要前端控制。[6]因此作为一种视听档案实践的口述历史本体的前端控制也就顺理成章了。
尽管前端控制原则已广泛的应用于电子文件管理的研究和实践中,但是对于口述历史前端控制的讨论比较缺乏,系统论述更是尚未见到,显然并未引起档案学界的重视。难能可贵的是,其他学科领域的学者如电影学者陈墨[7]和图书馆学学者尹培丽[8]反而敏锐地注意到口述历史前端控制的重要性。
口述历史前端控制的逻辑前提是其视听档案归属。现代口述历史产生的原因除了新技术导致传统纸质证据信息错失(如电话信息传达对公文的替代等)之外,也包括20世纪历史关注范围向原初缺乏档案证据信息控制体系的平民社会扩展。从历史上看,信息技术替代纸质文件引发了主要基于美国的档案型口述历史;而社会历史观面临的平民档案史料缺乏产生了主要基于欧洲特别是英国的社会史家型口述历史,也因此社会史家型口述历史并非如同一些历史学界的口述历史研究者主张的那样,即社会历史范式转向或隐含的对档案型口述历史的替代。正如美国学者唐纳德·里奇(Donald A.Richie)提到的那样,欧洲方面也逐渐承认档案在这个领域的主导地位:口述历史“文件是要提供给大众使用,而不是仅供个人研究的私有文件”[9]。换句话说,即便是那些声称脱离档案范式的社会史家所做的个体研究型口述历史,也有必要在整体上纳入社会档案系统并作为这个系统的外围,也因此必须纳入整体性的档案体系的前端控制管理之下。正如唐纳德·里奇的希望:“就理想而言,档案管理者应从口述历史开始进行时就与研究者共事,而不是在最后阶段才插入一脚”。
事实上,以视听记录为主要条件的现代口述历史区别于传统历史研究道听途说陋习的关键,就在于将口头史料档案化,并以档案或文献的思维来处理与对待口头证词。这其中也包括他们将采集到的口头证据纳入公共文献体系,取得公共可获取性、符合档案证据要求,由此其他学者有可能根据其采集到的文献证据可重复论证,这是现代学术的基本要求,即便出于意识形态斗争目的的社会史家型口述历史也需要基于证据理性。我们常常可以看到一些历史学者引证自己对亲历者访谈的言语,却没有原始记录的存留,即便他们引证言语证据的逻辑没有问题,这种自说自话的论证力量也是大打折扣甚至是致命的。
1.2 口述历史文本的非结构化生成及其前端控制需要
社会化记录的档案维控制仅仅是其中一个方面,对于口述历史来说还有其独特的超级复杂性。尹培丽总结美国学者苏珊·韦恩(Susan C.Wynne)基于集体调查得出的口述历史复杂性给编目工作带来困境的几个因素:“访问方法不统一;标准手册需要更新;‘不伦不类’……他们更像档案或出版的材料吗?多种载体形式;人名、机构名称等需要规范控制;缺少专业人员和资金;著录信息的缺乏。”实际上,韦恩还提到,“尽管在1995年《口述历史编目手册(OHCM)》出版以后有了巨大的进步,但图书馆中对口述历史的访问仍然饱受缺乏共识与标准化之苦。”[10]很显然,基于收藏机构的规范化不足以解决口述历史复杂性问题而需要求助于前端控制,以在保留口述历史实质内容多样化活力及其口述等自身特征的同时,强化原始记录的标准化。
韦恩所述仅是基于编目层面,而在单纯基于编目层面的著录环境中,这些口述历史材料的利用难度近乎世界共识。美国口述历史协会(OHA)数字化工作负责人道格·博伊德(Doug Boyd)提到:“由于模拟技术环境下纯粹实用性的考虑,职业的档案管理者通常将其元数据描述努力集中在收藏的层面。在模拟环境中对口述历史的访问已经证明是极端费力的。”[11]他也曾提到有收藏机构架子上的模拟磁带数十年没有动过。信息用户获取信息的耗费大于其收益,则该用户会放弃该信息的获取。博伊德无疑如同信息管理领域的普遍共识那样寄望于口述历史的数字化及其基于内容的管理,但他也同样提到,“然而即便是在在线环境中,人们仍然低估了口述历史资源利用的笨重性”。[12]这其中当然有口述历史社会化采集的非标准化原因,但也有其他。例如笔者在对口述历史与口述传统的辨析中,认为口述历史文本不同于口述传统之处在于文本在访谈中的即时生成及其日常口语交流特征,从而构成其原始记录非结构化的文本特征。[13]这种非结构化特征出于原始记录与个体记忆呈现的需要,又需要加以完整保留而不宜进行过多结构化文本加工,不过这也带来了利用的困难甚至可阅读性的缺乏。
整体而言,口述历史非结构化特征的文本,其真正有效利用需要基于人工智能的知识管理实行有效的数据挖掘与知识提取与分析,那么依托海量的元数据控制则是必然选择。即便不考虑口述历史视听文本的非规范性与非结构化特征,也不考虑那些机构内部拍摄的声像档案,视听材料最规范的文本或许莫过于公映电影,近乎是类似纸质媒介的正式出版物,而数字化电影的元数据量也大大超过一般人的估计。中国电影数字化平台的元数据系统即便通过简单介绍也可以看到,不仅著录层次包含节目层、场景层和镜头层,就算单一层次的元数据描述体系也绝对是单纯的编目工作者无法承受之重。[14]实际上,这一系统当初正是作为顾问的笔者所主导制定的,笔者曾为其拓展为知识管理系统而努力,但最终由于机构定位仍然基于媒体资产管理系统。换句话说,即便是没能让笔者满意的媒资系统也有如此庞大的元数据负担,更不用说更进一步的知识管理。对此问题的解决,是笔者最早1998年内部提出的基于阐释学循环文档KMS模型,其核心内容近乎是后来的弗朗霍夫知识管理模型,它要求知识管理融入业务流程,而元数据在其中全程生成。[15]
1.3 前端控制的规范路径
我们已经可以看到,对社会化采集的标准化控制,唯一的路径是对包括前端采访流程在内的全程施加规范化的管理,现代口述历史在美国正式形成的标志,就是口述历史不同实践的整合及其标准化。[16]2018年,档案行业标准《DAT 59-2017 口述史料采集与管理规范》实施,这是我国口述历史领域一个尚未引起足够关注的重大事件,虽然没有明确,但其中含有部分前端控制的思想。当然,该规范存在很大问题而且还有相当多的相关标准尚未制定,但其中最大的一个问题在于它力图按传统主流的文书档案框架来规范口述历史,从而形成一些难以融通的矛盾。问题的根源在于该标准混淆了口述历史相关的概念[17],笔者认为口述历史是一种新型的视听档案,隐含档案学基本理论的变革和管理模式的调整,那么很自然不能用文书档案的模式来进行定义和管理。此外,口述历史四不像的特性既非传统档案又非图书馆收藏形态,而收藏管理实践又的确在档案馆和图书馆都广泛存在,那么规范的制定最好能在档案馆和图书馆之间寻求兼容,而这也正是不同的案例规范需要交流的根本原因。
2 中国电影人口述历史项目前端控制的特征与缘起
2.1 中国电影人口述历史项目前端控制的标本特征及其优势
中国电影人口述历史项目虽然仅仅只是一个单一项目,但却具有其独特的标本价值。[18]对于前端控制来说也同样如此,作为案例,其特征满足口述历史需要前端控制所涉及到的诸多普遍问题。
首先,前端控制的一个基本矛盾是档案型口述历史与社会史家型口述历史,两种相互论争的工作范式背后隐含档案系统与历史研究与书写系统之间的矛盾。项目承担机构的双重名称“中国电影资料馆(中国电影艺术研究中心)”显示这个机构恰好身处矛盾两方面的“间性”。更重要的是,具体承办部门是长期被视为这个机构“研究中心”部分的电影研究室,项目发起的一个背景首先是中国电影百年庆典以及领导班子换届后这个部门对自身定位的重新思考,即研究室也作为档案馆的一部分应发挥什么样的作用,正如笔者多次公开强调的那样,双重名称不意味着一个单位两个部分而是两个侧面。其次,中国电影百年庆典带来的另一个考虑,是通过口述历史为重写中国电影史做史料的准备,因而项目兼有历史研究与书写的目的——这对于电影研究部门来说几乎是无需赘言的。
正是在这个基础上,口述历史的实践者往往会从档案和历史书写与研究两个方面来考虑问题。例如,项目启动的目标之一就是为口述历史在中国电影资料馆这个档案馆业务中常态化做出探索与示范,并最终将不同环节的工作分别归口到机构的各个档案业务部门中去。对于承担访谈任务的研究人员来说,始终明确访谈内容不仅为自己研究的需要也不仅限于自己的研究领域,而是为电影人记忆的永久保存以及后世其他研究者的公共利用。整个项目伊始就制定了详尽的对全国(含港澳台)电影人全面涵盖的系统访谈计划。此外,项目从中国电影口述历史更名为中国电影人口述历史则是有目的地将电影人记忆全面纳入国家个体记忆保存体系之中,而不仅仅是关于电影专业的口述历史。从这一意义上说,项目早已具有了前端控制的意识,无论是否明确,也因此陈墨注意到档案学的前端控制也并不出人意料。
其次,即便是对于中国电影资料馆来说,通常人们会认为这是一个电影系统内部的档案馆,其法定定位也是电影艺术档案的保管机构,但很少有人知道80年代初全国档案规划曾一度准备以该馆为基础筹建中国声像档案馆,而国际电影资料馆联合会的官方定位也是声像档案甚至“在历史上,国际电影档案馆联合会是联合国教科文组织关于视听档案政策与文件主要制定者。例如第一份关于活动影像档案的国际文件联合国教科文组织的《活动影像保护与保存建议(Recommendation for the Safeguarding and Preservation of Moving Images)》就出自该组织”。[19]换句话说这个机构本应是国家视听档案材料的收藏中心,很简单,电影是最早的活动影像媒介,而这种兼有视音频的媒介又是最为典型的视听材料。也因此,笔者《电影作为档案》第一次在世界范围内系统构建电影档案理论体系,而这一理论体系实质上就是声像档案理论体系,电影不过是声像档案诸多物质载体类型中的一种。正因为这样,各国电影档案馆很多发展为声像档案馆,例如英国国家电影资料馆——英国电影组织(BFI)同时保存有电视、数字视频乃至常规性的国会辩论录像等一切国家与民族的活动影像记忆。因此,虽然国家档案局关于中国声像档案馆的计划没能实现,但声像档案的分布式协作与整合,包括建立中国声像档案学会、构建全国声像档案协作网是笔者多年的努力目标。[20]诸多事实表明,中国电影资料馆的声像档案意识从2010年以来也一直在不断增强。声像档案如同电子文件一样属于需要前端控制的主要领域之一,这也是笔者知识管理研究以影视为实例的原因之一。
视听材料自然也包括口述历史,中国电影资料馆理应成为官方的国家口述历史收藏中心而不限于单一的电影人口述历史,不仅应在更大范围内采集整个国家与民族代表性人群的记忆,也应该广泛地收罗其他研究者或个人口述历史访谈的成果,那么也就需要面对更广泛的项目以外的口述历史实践及其规范问题。陈墨的目标一致,但路径不同,他通过本项目构建人类个体记忆库的勃勃雄心同样也丝毫不加掩饰,[21]甚至为此在内部研讨会上与黄德泉研究员发生过激烈争论。[22]笔者立场间乎他们之间,认为人人都做口述历史就意味着人人的口述历史都没有意义,但一定代表性和一定规模的个体记忆保存是必要的,而且不可能仅仅基于电影人口述历史单个项目实现而需要社会化的采集与整合,而它们能够参与社会记忆的构建也只能依靠基于前端控制的大数据管理才能得以实现。实际上,持续已十多年的中国电影人口述历史项目在笔者已知范围内是中国大陆最大的口述历史项目,迄今已累计访谈近5000小时,可整理出超过5000万字的文字内容,个体记忆被掩盖在海量数据之中才是正常现象,同时也给后期的内容清理带来巨大压力。
广阔的视野不意味着深度的缺乏。项目一开始就明确目标要建立实践的初步规范与惯例,也因此在实践的同时展开广泛的研究活动,这个境内最大的口述历史项目无论是实践还是理论水平也都处在国内领先的队列之中。[23]电影研究者在对视听媒介的理解方面无疑具有极大的优势,项目实践者也包括口述历史文献纪录片的创作者,而新闻与传媒人也是现代口述历史缘起的重要参与者。而笔者同时也将其视为中国电影史料知识库构建的努力之一,那么也是电影产业知识管理的一部分,口述历史体现为对头脑中隐性知识的控制维度,[24]而正如前述,影视行业的知识管理不过是笔者知识管理研究的实例基础,也因此顺理成章地投射到“野外”信息。与此同时,电影资料馆本身图档博的综合属性笔者在《电影作为档案》中已有充分论述,而这也是针对前述尹培丽转国外学者口述历史间乎档案馆与图书馆收藏之间特性最好的实验平台之一。
2.2 中国电影人口述历史项目的危机及其前端控制的缘起
中国电影人口述历史项目成就突出,但弱点与面临的危机也非常明显,而这些弱点和危机也正缘于研究部门的具体承担,在国内口述历史实践中同样具有相当的典型性。危机与机遇常常并存,这些危机迫使项目采取包括前端控制在内的一些规范措施加以弥补,也带来新的实验与思考。
目前最大的问题在于后期管理近乎空白,近5000小时的访谈材料长期临时堆放,基本规范建立起来后即分别归口机构各部门的原定计划因故长期难以实现,因为从理论上说,研究部门直接负责的应该是对记录材料的研究以及在采集部门框架内承担前期访谈工作。尹培丽文章也提到:“历史的经验教训表明,编目工作做得越早越好,最好在采集完成后马上将录音、录像、图片、文字等资料一起移交保管部门。因为在时间间隔短的情况下,采访人的记忆还比较新鲜,讲述者也还健在,许多有待查证的信息可以及时得到准确的核实。”
即便不考虑采访人记忆问题,后期处理的长期拖延也将面临其他更直接的危机。目前,本项目面临人员更迭、业务不连续等突出问题。由于转岗、退休等原因,原有的工作基础不能得以良好的延续,实际从事口述历史访谈的临时工作人员不断更迭,给项目开展带来了不可估量的损失。
实际上,这一人员危机更早以另一种方式开始出现,即早期研究人员全面参与的局面——原本以历史研究者从事档案记忆系统保存的优势难以维持,因为研究者长期从事与其研究课题无关的口述历史访谈意味着巨大的职业生涯牺牲,从而导致从事前端业务的部门采访人力资源逐渐枯竭。目前项目不得不将更广泛的研究者与电影工作者纳入项目范围,依靠项目的资源作为联系的纽带,但人员组织关系则相对疏离,访谈也更立足于采访人当时特定的研究课题和历史兴趣。这在一定意义上走向了社会化采集,更进一步凸显了前述档案型口述历史与社会史家型口述历史之间控制的矛盾,意味着惯例与统一的模式相对弱化,也因此需要增强规范控制而不仅仅依靠工作惯例与常规性的工作沟通。此外,由于资源联系的纽带,项目这样一种社会化程度同时又处在项目控制能力之内,从而具备了对前端控制进行初步探索的条件。
真正促成前端控制全面实施的,仍然是一个典型的原因——数字化所带来的危机,即SONY PXW-Z150摄像机对此前SONY HDV摄像机的替换,因此从一定意义上说也是迫不得已。HDV记录虽说也属于数字影像,但磁带式拍摄存储和视频采集转换的利用方式使之在管理上更类似模拟技术,最大的特征是拍摄母带及其信息载体的物理实体式存在,基于收藏层面的编目控制可以实现表面上的管理。新的存储卡拍摄设备在摆脱了视频采集转换的繁琐利用和保管方式的同时,也失去了固定的物理实存载体,从这一意义上说,才是真正数字化的开始,由此面临一系列管理上的新问题,例如即便是原来记录在磁带盒上的最基本的编目信息如今也再没有固定的记录载体作为依托。
由此,新设备购置后随即展开基于前端控制的规范制定。2019年初,在新旧设备全面替换之际,以《中国电影人口述历史项目访谈与归档临时业务规范》为核心的文件开始征求意见,同年8月开始实施。
关于这一规范的临时性除了通过实践逐渐完善的原因之外,口述历史收藏最终应作为机构全部收藏的一部分需以集成管理为目标并与其他类型收藏的管理模式兼容,但机构在此方面的滞后也是不得不进行前端控制但也是临时规范的原因之一。这一规范是在原有规范和惯例基础上的补充,但却更集中于前端控制思维。不过,即便没有明确意识到,原有规范也同样隐含了诸多前端控制因素,如项目一开始就有较完备的保密规范,对非档案背景人士来说难能可贵。
3 中国电影人口述历史项目前端控制的原则
3.1 前端控制的程式化手段
前端控制的手段很多,但基本的依托是规范化,而规范化最佳的体现是流程的程式化。笔者制定的这套规范包括上述呈现为工作流程的核心文件,以及围绕这一工作流程相关的《采访人形成元数据表》《记录单元元数据表》《采访人情况采集表》《受访人生平年表》《目标人物生平年表》《附属材料移交清单》《访谈安全使用事项记录表》等10个工作用表。这些用表部分参考了国内外多个规范,如国内的DAT 59-2017与国外南希·麦凯(Nancy Mackay)[25]和纳恩口述历史中心(Nunn Center)提供的方案,并根据国内具体情况以及访谈实际进行了拆分整合与调整。
3.2 前端控制的原则与实现
前端控制原则上无疑意味着对前端工作人员的约束,也不可避免地增加访谈相关人员的工作量,因此必须在这样的操作中保持不同目标的平衡,也因此需要满足几个原则。首先,前端控制增加的规范、程式与工作不能伤害口述历史的基本伦理,这一伦理的基础是对受访人意愿的尊重,让受访人产生不愉快的措施均需暂时停止;第二是不得伤害口述历史本身的目的,当程式影响到重要信息的记录或影响口述历史自身优势特性的时候需要暂时停止;第三是保持前端控制目的的高效性,例如访谈基础信息尽可能不得缺失,访谈标准形态的尽量保持,以及涉及后期数据挖掘所需要的信息尽可能多地保留;第四是保持后期工作人员与前期访谈工作人员工作能力与工作量的平衡,例如部分工作对访谈人员来说轻而易举但对后期工作人员来说却是没有必要的费时费力甚至根本无法完成,则尽量留给前期人员;反之亦然。在此基础上,尽可能减轻前期访谈工作人员的负担,因为访谈不同于后期工作流程的特征之一是在有限时间内密集的工作量以及与受访人的直接交流,本身在工作复杂程度上已经近乎饱和状态。例如,项目根据自身特点将《采访人形成元数据表(IGM)》和《记录单元元数据表》分别拆分为“自采纯视频”“自采混合记录”和“非自采”三个分表,也是为减轻采访人的负担,不用面对过于庞大但却不一定适合主要工作模式的表格,尽管这种分解相对增加后期工作流程的繁琐程度。为此笔者规定了操作优选顺序:①尊重受访人意愿 ②足够时间和精力记录下实质性口述信息 ③规范 ④记录影像与声音的质量。
实际上,程式化就是通过将规范融入工作流程的工作流(workflow)的实际应用,让访谈人员以最小的付出获取最大的前端控制收益,甚至融入工作流程中那些本来就要进行的工作上,例如前述阐释学循环KMS模式笔者针对电影数字数据的前端提取部分工作就建立在影片摄制最后一道必不可少的流程是影片完成台本的编制上。甚至即便不考虑前端控制,程式化本身也是减轻访谈工作并将时间精力投入到具体访谈内容上的重要手段。通过最优化流程控制,其实也是前端控制的一个内容,特别是还能服务于访谈,则是更加优化的手段选择。笔者的KMS模型也是通过为影视生产提供知识服务构成知识可持续发展的循环从而取得多赢局面,因为影视产业的知识管理是实现业务核心竞争力优化的基本路径。[26]口述历史同样需要业务流程与自身知识管理的结合,而这一结合最大优势的发挥还需等待数字化远程分布式工作环境的形成。
4 中国电影人口述历史项目前端控制的基本内容
梳理一下前端控制的主要内容,笔者此前分析过口述历史是一个文献生成的过程,那么根据笔者对文献属性的分析,总结为三个方面:社会历史价值的控制,证据性(含原始性、真实性、完整性)的控制,以及公共可获取性的控制。下面分别简要介绍,限于篇幅,完整的表格将后续在合适的机会公开,同时也等待这个“临时”规范在具体的实践中继续受到检验并逐渐成熟,目前规范中的大部分规定为推荐而非强制,当然这也是期待同行交流的过程,而且具体所涉内容同时也相关口述历史的一些基本理论问题。
4.1 社会历史价值的控制
口述历史的社会历史价值控制是一个相对宏观的控制目标,距离具体的工作流程相对较远,因为这个目标是在总体、宏观的范围内进行的。在此之前,中国电影人口述历史项目的宏观目标中就包含了这样的价值追求,例如陈墨提出的“社会史、专业史和个人心灵史”访谈目标三维度论,以及笔者前述所批评的以电影人口述史单一项目构建人类个体记忆库的雄心,因为笔者主张的是个体访谈的多样性以及社会整体文献建档体系的社会历史记忆的完整存留,这也是构建口述历史全国资源网络和标准化的理由,而这种完整存留性是通过“代表性”来实现的。项目不仅从一开始就有一个针对全国电影行业的全面覆盖访谈规划,具体执行同样如此,例如笔者负责的长春口述历史工作组所进行的有意识的“代表性”的规划,在《长春影事》的前言中详细描述过这种多重代表性的覆盖以及相对的重点,[27]如职业、年龄、来源、身份级别、性别、文化程度乃至政治观点等。这种覆盖也包括对此前包括文图档案在内的传统史料留存既有结构的调整,也是笔者否定口述历史平民性为口述历史本质属性的原因,这种平民性不过是针对传统对权贵等强势阶层的偏向而对社会信息所施加的控制措施而已。陈墨文章批评过档案学界口述历史研究中的“代表人物”论,其实有所误解,因为这种“代表人物”并非一定就是“重要人物”,平民视角的人物也是代表人物,例如笔者长春访谈对象不仅包括厂长也包括最底层普通工人的代表。不过,陈墨的批评也并非没有意义,新颁布的档案行业标准DAT 59-2017就将“重要人物”作为优先选择的对象,这也是前述标准基于传统官方档案思维惯性的影响。
这种控制具体而言是在编制总体采访规划的过程中直接进行的,对于那些直接控制之外的访谈,包括笔者所鼓励的研究者自身研究活动顺带访谈,很自然以其研究目的为中心,则更多靠数量的累积和收集鉴定达到总体的相对平衡再辅之以人为调控。也因此,访谈对象与事件各个维度代表性的元数据提取则成为流程控制中的一个重要方面,管理系统可据此进行智能分析、关联全国或特定范围人口统计数据,进而据此调整总体结构。项目规范最直接的流程是《受访人(目标人物)生平年表》的填写,目标人物是指因去世或其他原因转而采访其密切知情人(通常为亲友)的访谈目的对象,在其生平年表正式内容之前采集相关的受控结构化数据:国籍、民族、性别、出生日期、访谈时年龄、社会身份(含职业)、政治面貌、文化程度等。随后的生平年表结构化地展示受访人和目标人物的经历也是重要的社会信息偏向来源数据。与此同时,《采访人情况采集表》不用提交生平年表,但也需提供上述类似信息,因为采访人同样存在这些代表性并影响其访谈的倾向。当然,这种结构化仍然是相对的结构化,等待相关标准出台,而采访人员也不大可能熟悉标准用词。
4.2 证据性的控制
前端控制的目的常常被总结为维护文件的原始性、真实性和完整性,在笔者看来就是维护并保存文件的证据性。笔者曾专门论述过口述历史的证据理论框架,[28]提出口述历史证据的言语记录本位,其真实性不在于言语内容的真实而在于对言语本身的记录真实,因为档案的真实性是记录真实而非内容真实,这是口述历史乃至一般档案领域被广泛错解的问题。因此,证据性控制对前端控制来说极其重要,因为证据性三个维度都严重依赖前端工作流程,也需要为后期证据性长期留存提供基础。证据性控制因此包括三个方面:
4.2.1 言语层面记录真实与完整的控制
确保对言语本身的记录真实,如著名的不停机原则以留下口述言语没有被篡改或删减的证据信息(含下面谈到的完整性存留)。项目从一开始曾立下惯例:如果受访人因任何原因要求停机,采访方都须无条件接受,但新规范要求最好能保留下受访人要求停机的言语等视听信息在视听记录中。采访方因技术如电池耗尽等或非技术原因造成的停机也同样处理。这种确保一定程度上有视听记录技术为依托,这种技术的证据存留能力本就是现代口述历史出现的原因。
这种言语记录的完整性还包括记录对访谈言语自然进程的主动干预,当然仅仅只是言语与记录的形式而非内容实质。访谈双方在通过不同言语种类表达信息的过程中会出现语法、语义与语用等层面的模糊与记录的缺失,从而形成对完整与准确记录的需要。例如项目很早就形成一个惯例:受访人讲述中出现非公众所知的重要人名、地名,采访人有义务追问名称具体的文字表达,弥合口头表达与文字表达的差异。笔者实际的访谈中遭遇到这种不确定信息的情况还有很多,包括容易混淆的名称等。不同言语种类表达还会出现记录缺失的情况,例如受访人在表达空间大小或尺寸的时候,常常仅仅依靠姿体语言或根据现场同样物品做出语言上的类比,而姿体语言或现场物品可能在记录的画外而没能记录下来,新规范规定采访人或摄像师有必要加以追问,落实准确信息并确保其被完整地视听记录下来。
4.2.2 口述历史材料来源层面证据性的控制
口述历史文本的非结构化形成导致其普遍缺乏题名,国际通行惯例是人为规定以受访人姓名为核心来命名,这其实与档案来源命名规则类似。因此,需要确保特定口述历史材料是它所声称的口述历史材料的证据链条,并如同其他方面一样设置多重证据痕迹冗余,以便后期考证与校验。“是它所声称的”是笔者《言语记录本位》一文中引述保罗·汤普森(Paul Thompson)《过去的声音》中的表述,并提到这一维度对口述历史证据性来说是另一个问题而在当时没有展开论述,因为它不在文本自身的证据范围而是作为证据内涵讨论的前提,那么本文则直接面对这一证据的存留及其完整性的维护。笔者提到这类证据性包括两个方面:记录的伪造(包括重新配音等)以及记录的口述人真实身份与所声称的身份之间的背离。这既包括整个单次访谈文本也包括访谈单元中部分的文本。
这一部分证据性控制的手段主要包括三个方面。
1、确保原始记录文本与其所标注的元数据信息的匹配。脱离固化实存的全数字化管理模式下,这些基本信息极易与视听文本脱离关联。实际上,此问题在磁带模式下也同样存在,笔者自己就曾有过工作失误,直到后期文本整理才发现访谈时匆忙在磁带盒封面上标注的笔录信息标错了盘符顺序,因此即便在非全面数字化环境中也应该保持磁带盒和磁带上标注信息的冗余设置,更何况后期管理中可能出现的错乱因为脱离了采访人的头脑记忆而更加难以辨识与纠正。
有鉴于此,新增规范实行采访人形成元数据表与访谈视音频标板双重标注系统并设置为相互照应,后者换句话说是以口述历史本身数据的视听方式将元数据所需要的内容直接标注在作为原始记录的视听文本上。《言语记录本位》一文中笔者曾提到自己长期所做的“内容标板”实践,即在访谈开始之前将访谈基本信息如项目名称、受访人、采访人、摄像师、访谈时间、访谈地点等通常磁带盒标注的内容用口头言语说明并记录在音频上。这种内容标板和技术标版(此处即视频彩条)源自笔者早年制定的缩微拍摄规范中的标板系统,如同缩微标板一样,口述历史视听记录同样还可有更多的其他标注,如在时间、地点乃至媒介切换等时机尽可能留下关于访谈的视听痕迹,而更重要的则是类似缩微的内容标板——主要内容拍摄前以文字揭示所摄文献主要著录信息的画面,因为缩微是单纯的视觉媒介,那么对视听记录的口述历史来说,则是在音频标板的同时用场记板标注与音频语言同样的著录信息,音频说明结束后同样打板,然后不停机转入访谈现场记录,确保标板内容与访谈现场记录的一致性。这自然是援引自电影拍摄流程,只不过电影主要是为了帮助后期剪接识别与声画同步,而口述历史更重要的是标记存档与声画关联证据的存留,同时也如同缩微文献一样可视为口述历史原始记录文本的“封面”。根据笔者实践感受,这一做法可能会增加采访人员(含摄像师)的工作负担,但照念场记板也可减轻采访人在做音频标记时极为宝贵的脑力投入并减少口误。此外,整个这一视听流程有助于访谈开始的仪式化,有助于受访人以更认真负责的态度对待访谈。
2、维护访谈视听材料的原始性与完整性。为此要求访谈文件体系即技术性元数据的原始存留,那么对于前端来说一方面要小心维持记录的原始性与完整性,同时一些出于方便后期管理所需要的设置则直接施加并固化到原始记录之中。本项目的具体做法首先是尽可能采用摄像机原配软件如Z150的CB整体转录而不是直接拷贝来保留文件体系的原始形态,然后在相关技术形态以及文件名的自动确定方面则通过事先设定拍摄模式与记录单元的方式实现,尽可能采用更通用、更适合保存的文件格式(如MXF等)以及保持每一个记录单元时间码的连续(因为中国电影人口述历史项目的特征之一是单个访谈时间较长,跨越甚至长达数年,同时多个访谈交叉进行的情况也很常见,因此访谈单元的时间码连续尽管很有意义——尤其是对于视频内容定位来说——但却缺乏可行性),记录单元设定为存储卡的单次记录并确保一人一卡,将一些后期需要做在记录之时并保持这种视频文件的原始状态以及访谈连续的参数,在保持文件体系的原始性的同时保持文件体系的有序性。
这其中也包括音频的处理,例如根据本项目的技术条件要求主要记录受访人言语的胸麦和主要记录采访人言语及环境音的话筒分别记录到不同的声道上,首先是保证一个声源出现故障不会导致重要信息的漏记,其次便于后期分离处理并保持各自声音的清晰度,最后为音频的相互印证与参照提供凭证。
视频文件名保持原始文件名及其事先受控的记录顺序,记录单元命名由采访人或摄像师按照编码规范(受访人姓名 文件夹顺序号 本文件夹采访日期 本文件夹视频文件数量 本文件夹视频总时长)记录事先标注在记录单元单独的文件夹的名称上,而存档单元则是单个访谈(Individual Oral History Interview),由存档人员将规范编码标注在访谈单元(也是存档单元)的文件夹的名称中。访谈编码笔者不同意DAT 59-2017的规定,需要能适当地确定一个访谈单元全国唯一性的方式。这样的文件体系相关数据(如文件数量、视频时长等)也标注在采访人形成元数据表中,形成视频文件与元数据表之间对应的参照,一旦出现错漏能轻易检测出来。
3、受访人身份的确认。这一确认分视频中受访人与元数据标注的受访人的同一性和视频中受访人身份是其所声称的那个人两个层面。《言语记录本位》一文提到在内容标板之后,正式访谈开始的最初两个问题是让受访人对其姓名和出生年月日进行自我核实并标定,因为根据国际惯例,姓名和出生日期基本可标定特定历史人物避免同名同姓,同时也包括受访人所有曾用名的列举。其中受访人可能会对自己法定出生日期(身份证日期)提出质疑,也为以后更准确的史实考证提供线索。正如《言语记录本位》所述,笔者这一惯例源于一位因笔名出现身份疑问的受访人,而笔者为此以大量精力和费用投入其身份考证。其次是受访人签署协议及其身份证的照片存留,其他附属材料如历史老照片与现场照片、生平资料等的提供,受访人签字的生平年表等表格,元数据表中的受访人身份与联系方式数据等都提供了冗余的身份认证信息。DAT 59-2017在此也如同很多口述历史研究中的误解一样,这类材料属于口述历史的附属材料,是“关于口述历史访谈”的材料而非口述历史原始记录本身,这些材料能有助于佐证口述历史内容与言语的真实性,当然也包括受访人身份。新规范甚至规定了访谈时录音笔的附属录音属于附属材料,除非这是唯一的视听材料,原因在于此前实践中由于视频采集的困难广泛采用录音笔现场录音并以录音笔录音替代视频提供录音整理的文字抄本流程,而录音笔的内容与视频材料通常并不一致(甚至因没有换盘限制而录下了换盘间隙的言语而具有独特优势),但却不能实现文字与视音频的对位。此外,相关表格在存档之前还需打印并签名。
4.2.3 证据性与记录完整性的长期留存的前端设置
这种设置是为保持记录原始性的基础上,能有效帮助后期长期留存中对证据性和完整性的前端设置,使这些设置能烙印在原始记录之中。前面已述不赘。
4.3 公共可获取性的控制
4.3.1 公共可获取性的含义与维度
正如前述,公共可获取性是现代口述历史区别于传统上道听途说著史传统的根本区别之一,其前端控制手段可以构成体系,其内涵存在多个层面的多个维度。首先它既包括一些比较宏观的政策性措施如对公共收藏归档的鼓励策略乃至宣传活动(如本项目对研究者的鼓励是通过口述历史设备、资金支持及访谈业务与规范化咨询等方式将其纳入项目体系的方式),也包括技术性的细节控制,如全国联网的口述历史资源编码体系以标定每个单独访谈并维持其命名的唯一性等。其次是它既包括对资源的可公共获取,也包括对这种获取的保密限制,因为即便是受限的获得性只要存在于公共资源体系也同样具有公共可获得性。DAT 59-2017也做了密级规范,但完全依照主流公文档案模式而缺乏口述历史特征,有待全国性交流产生结构化的保密状态描述。最后,它既包括是否纳入公共资源体系的可获取与不可获取之绝然分界,也包括已纳入公共资源体系后可获取界面的友好程度,前者属于原则性而后者属于技术性侧面,但我们讨论更多后者。
4.3.2 公共可获取界面的友好性控制
正如前述,口述历史作为日常口语交流访谈的即时记录形成的文献,其文本可获取性的友好性非常差,而这却恰恰是其优势即口语交流等特征带来的,友好性的增加不应损害其非结构化文本的自身优势。对于公众来说,接触口述史最常见途径是对原始记录文本进行编纂、重新书写乃至研究分析的出版物,笔者称之为口述历史信息的线性组织与控制,具有相对的阅读友好性,但特定信息的获取效率却远不及数据库式组织与控制,而更高层次的知识管理则是人工智能组织与控制(笔者也称广义数据库式),而编纂式线性组织要获取证据源仍需溯及原始记录。实际上,笔者的编纂实践中对线性组织结构也存在面向故事性阅读与索引式阅读的两难选择,更不用说后期对原始文本的编纂活动也能从数据库式结构中获取效率,而这同样依赖于内容描述性元数据。这些元数据的采集绝大部分宜放在前端。
内容描述性元数据正是在非结构化口述文本与结构化存取之间架设桥梁的主要工具,但这些元数据的标准化表达需要专业知识,通常不为以历史学者为主的采访人所掌握,从可行性与减轻访谈人员负担来说,前端暂时不宜用标准化的受控元数据形成而需更宽松的方式,并将这种标准化交给后期专业人员。实际上,对本项目来说,或者对更广泛的口述历史普遍实践来说,相关标准长期缺乏,如笔者曾一度努力要促成制定而未成的部分声像档案标准及口述历史总体与特定领域的主题词表,更不用说本项目相关的电影学主题词表以及中国电影史主题词表,乃至基于知识管理的电影知识本体与中国电影史本体的构建。有鉴于此,笔者在主要涉及这些内容描述性元数据采集的《采访人形成元数据表》与《受访人(目标人物)生平年表》中规定的相关事项为关键词而非主题词,包括国际国内惯例的人名、地名、事件名、机构名等加上本项目特殊的影片名、角色人名、出版物以及专业话题等,并做出有限限定,即按惯例规定采用“规范化全称或通用简称”并明确这种标准化不影响口述文本本身的非标准的口语化表达。
尽管如此,即便是采访人不够标准化的关键词描述,也为标准体系的制定累计了素材,例如中国电影人口述历史项目5000小时的全方位访谈所包含的海量表达,更重要的是,诸多成员很早即开始对每盘磁带以关键词标注该时段记录的主要内容。新规范同样将这种内容描述性元数据的填写细化到类似磁带的每个记录单元,不仅细化了内容描述,同时也有助于后期基于内容管理的文本地址标定。
《受访人(目标人物)生平年表》尚未在其他实践中看到类似做法,但这一流程极高的性价比促使笔者颇为自信地将其列入规范。从投入来说,中国电影人口述历史项目基于口述人生命历程进行的全方位访谈特征,使得对受访人或目标人物的经历全面了解是早先制定的案例式惯例中的一个必备步骤,本身已接近制定生平年表。在实际访谈实践中,笔者因故意打破时间顺序提问的习惯反过来需要自己头脑中清晰的受访人生平时间线而经常自行编制其生平年表。笔者认为即便是那些专题性口述史仍需受访人生平来建立口述证据性与言语的主客观环境信息,受访人生命历程对于其口述内容偏向乃至史实考证具有重要意义。新规范的年表则将这种生平信息结构化(时间、地点、机构、事件),首先有助于这份口述历史记录自身的内容控制,因为这一结构化数据库也可视为其访谈内容纲要;其次是构成整个项目整体人物经历框架;第三是构成全国人物生平年表联网,并可提供相应的历史信息全网定位;最后也是构成中国电影史料库乃至中国电影史、中国电影知识库的经纬框架,建立起口述历史资源与其他电影知识资源的关联。生平年表中的受访人联系信息,也是知识管理已经显性化的知识进一步与隐性知识建立关联的桥梁。实际上,就电影史研究来说,对人物生平信息的需要已被一些电影研究者高度重视。[29]项目产生的生平年表由受访人为主、采访人协助核定,最后由双方签字的方式生成,具有独特的史料价值。
4.3.3 保密控制
保密控制是可获取性控制的重要方面,不仅涉及到口述历史伦理问题,也是对文本传播范围有效控制的依据(包括扩大公共获取和限制公共获取两个方面)。中国电影人口述历史项目从一开始就有明确规定并在国内处于领先地位。此前这种保密控制是通过最后协议来规定,基于访谈前后访谈双方对此问题的口头沟通细节,并由受访人最后确定。除受访人的限制外,口述历史公开计划如编纂也存在一个基于项目方或传播方考虑的限制措施,通常比受访人的限制条件更加严格以避免法律与伦理纠纷。
新的规范需要对此做出更加程式化和可靠的元数据存留。通过对本项目近五百位受访人的保密规定的分析,保密原因主要来自文化政治、人际关系及个人隐私三个方面。新规范更进一步以表格列举的方式将此信息结构化——也为将来密级描述的全国标准提供素材。表格主要基于采访人的判断填写,也可供受访人在访谈后确定自己的协议条件时参考(访谈结束后受访人往往会忘记自己说过的细节,也不确定哪些需要保密,此前采用的一种补救方式是在访谈现场用言语在需要保密的内容前后直接加以说明)。填写方式是访谈中按次在相应的敏感项目上做记号,确定敏感信息的大致数量与地址。敏感项目的进一步细化和扩充,主要参考博伊德为纳恩口述历史中心(Nunn Center)提出的采访人自己把控的六个问题。[30]当然,同样也不得影响口述历史本身的讲述,包括受访人不愉快情况下终止执行的规定,也同样如博伊德所说,敏感信息的标注并不意味着一定会限制公开使用,但却是参考依据。很简单,口述历史陈述本身的目的是尽可能真实讲述,例如讲述内容可能导致任何一方面临刑事起诉与行政处罚等超越历史目的的情况,也只是限制其公开范围而不限制对真实事件的陈述。这无关社会正义,口述史不是审讯也不是审查,即便关乎正义也是历史评价的正义。
5 结语
口述历史是人为发明的一种人类个体记忆的纪录实践,几乎所有的理论问题都来自实践领域,至少在初期,实践依赖是其基本属性。很多国内外学者认为,这个领域包括前端控制在内的规范化仍然是一个远远未能成熟的工作。研究者需要大量的亲身实践,实践者需要有理性思考。实践所产生的纪录成果也需要全社会的网络化整合,从而形成整体层面上的社会信息控制。因此,实践者之间具体操作规范的交流与沟通及其重要。例如,笔者采用场记板在原始记录的视听文本上做出视觉的内容标板,这一想法很早就在考虑,但因为距离国内普遍做法过远而长期停留在“想法”的状态,直到在与崔永元口述历史中心的赵一工先生沟通时,获知美国加州大学洛杉矶分校(UCLA)也采用了类似做法,才有了自信并加入规范之中。换句话说,相互的实践交流不仅能走向标准化,也鼓励规范化进程中的创新。
实际上,口述历史领域的现有问题也都来自实践,也需要在实践中解决。那些依托他人实践做出的研究往往会走向偏差。中国电影人口述历史项目的特征使之具有思考这些问题的独特优势,包括前端控制系统规范的发起,并在实践中说明了前端控制的必要性以及可以带给这个领域的前景。口述历史的前端控制来源于档案学,但又有自己的特征,因为其文本生成相比其他档案材料更加缺乏规范,其生成的过程也面临更多的工作安排与伦理等方面的复杂情况,从而需要确立一些原则。其主要内容依据其口述文本文献生成的特征可以分为社会历史价值的控制,证据性的控制,以及公共可获取性的控制。当然,这仅仅是初步的探讨,数字技术的发展也会产生新的问题、需要与创新机遇,同时也仍然希望全国同行的共同努力与交流。