APP下载

数字影像与城市记忆的层累效应*

2021-12-09钟,黄薇,沈

图书馆论坛 2021年11期
关键词:数字化图像历史

铁 钟,黄 薇,沈 洁

随着视觉体验时代到来,影像价值日益受到重视,正如海德格尔所预言:“世界被把握为图像了。”[1]今天人们对商品的消费不仅在于使用价值,更是直接消费它们的形象,因而在迈克·费瑟斯通(Mike Featherstone)看来,影像甚至能直接成为使用价值的代用品[2]。同时,作为视觉档案资料,照片资源在传承历史景象、延续集体记忆方面有着特殊的功用,尤其对城市记忆的建构与传播、传承与重塑具有不可替代的作用。城市是人类集体记忆的场所,每个城市的地景格局都是在历史发展过程中由不同主体、不断层累叠加而成,对今天的人们来说,如何在持续不断的更新和累积中,在不同时空维度历史记忆的相互影响下,保持城市中最有价值的景观格局,建构一个地区人们的集体回忆,从而形成生生不息的城市向心力,历史照片或许是值得深度挖掘的重要资源。然而,在相当长一段时间里,历史照片作为特殊的非书资料,一直未能受到重视,许多学科的研究者并不熟悉作为原始材料的照片,因而把它摒弃在研究视野之外。事实上,与其他媒介相比,通过影像来记录和建构历史记忆,能够生动地抓住历史的细部与具象特征。然而,出于各种原因,许多图书馆、博物馆等公藏机构虽然拥有丰富的历史照片资源,却长期“养在深闺人未识”,无论是日常的保存保管、数字化开发,亦或向公众开放,依然处在初级阶段。尽快将这些历史照片转换为数字资源,有利于资源机构进行数据管理与开放共享。以上海图书馆为例,馆藏超过10万张不同类型的历史照片,包括签名题跋照、立体照、照相馆照、专题摄影集(手工制作)等珍贵的影像资源。

在历史照片数字化过程中,需要通过人工操作,进行一部分的元数据著录,时间周期较长。元数据信息是一种静态信息,不太适合描述重建的分析或解释过程,这些信息在很大程度上是不可见的,比如谁收集、什么时候收集、以什么格式收集。在不知道照片的化学性质和物理结构的情况下,很难制定出有助于保存照片的存放条件或展示方式,也很难确定适当的保存方法。从这个层面来说,这些元数据内容已经超出内嵌元数据的范畴,需要引入交互元数据(Paradata)概念。交互元数据指的是人们理解和解释“数据对象”的过程,是一种过程类型数据,是一种用于描述原始数据收集方式的数据。与元数据相比,交互元数据是对数据进行更改的数据,这些更改包括展示、操作、放大、缩小、修饰等,是对过程、变化、操作和重构的解释。交互元数据基于不同概念化的方法,理解和解释研究项目的本体,理论方面的问题与具体的实际问题都是息息相关的,理论工具作用于交互元数据的目的是在实践中使“理解和交互数据对象的过程”透明化。

本文以上海图书馆馆藏历史照片的数字化项目为例,探讨如何使用交互元数据,采集历史照片数字化过程中,相关描述原始数据收集方式的过程类型元数据,以期能建立起描述和验证成像性能和质量的连贯数据信息框架,对历史照片数字化数据粒度进行规范。采集和使用带有交互元数据信息的历史照片图像资源,对数字资源的识别、搜索、管理、访问、保存和使用至关重要,也有利于资源机构更加便捷高效通过国际图像互操作框架(International Image Interoperability Framework,IIIF)等协议向公众进行数据开放与共享。

1 现状调研

计算工具引入人文科学研究后,相关学者的工作方式发生重大转变。2006年伦敦大学国王学院主办的三维视觉研究成果透明化研讨会中,三维可视化研究中跟踪和记录认知过程的方法论项目小组提出“交互元数据”这一术语来表示记录这些累积信息[3]。交互元数据是元数据的补充,而不是替代,是从元数据中分离的信息集,是一种在资源周围创建开源和开放访问数据空间的方法,交互元数据强调传播而不是描述,阐明了资源的使用模式和假设[4]。针对历史照片的数字化保护,2000年盖蒂保护研究所(The Getty Conservation Institute,GCI)在照片和摄影材料保护领域已经展开研究[5]。耶鲁大学公共人文学科项目及其摄影记忆工作室承担的Photogrammar项目平台,是有史以来最大规模的历史照片数字化项目[6]。在中国,针对历史照片的档案管理,中国国家档案局发布的《照片档案管理规范(GB/T 11821-2002)》规定对银盐感光材料照片档案的收集要求、整理程序和保管条件[7]。国内外对历史照片数字化元数据的研究初见规模,但是,不同资源机构应用的元数据规范不尽相同。近年上海图书馆组建“上海年华”专项课题组,致力于历史照片的深度开发,开展了对尘封已久的大量历史照片的整理工作。2020年上海图书馆在项目组已经完成的初步整理工作基础上,整合馆所资源,启动名为“上海文化总库”的地方文献资源整理项目,旨在能建设成一个可以长期保存馆藏资源、共建共享、互联互通的展示和服务平台。该项目涉及地方文献、名人手稿、影像资源等多种馆藏资源,体量庞大,其中包括馆藏数以百万计的历史照片、明信片、小校场年画等珍贵的历史图片资源。

2 具象的历史:历史照片的价值分析

对历史学家来说,历史事实(historical facts)是终身追寻和探索的对象。历史事实包含两层意义:第一层是过去发生的人、事、物等所有一切事件与事物的总和;第二层是存在于人们记忆中借由人们口述、书写、绘图、塑像表达出来的具象内容。重建的历史事实更多是存在于保存的文献、资料等各种形式的史料之中,并不是客观存在的历史事实。它会受到现实社会的影响,以至于会主动或不主动地去选择某种方式来建构起令我们相信的历史记忆。近代以来,历史学理论把记忆与历史联系起来,将历史作为社会集体记忆的产物,并发展出一系列记忆理论。这种记忆也通过媒介传播,不断创造和重塑人们的地方感和认同感。正如福柯所说:“谁控制了人们的记忆,谁就控制了人们的行为脉络……因此,占有记忆,控制它,管理它,是生死攸关的。”[8]

历史书写需要通过外在的技术或工具媒介来完成。与遥远的古代历史不同,世界进入近代后,除传统文献,人们有越来越多记录这个世界的手段,照片、录音、影像资料,海量的文献和信息似乎给予我们完整重塑历史越来越多的可能性[9]。图像和影像资料的出现改变了人们观看历史的方式,使得许多真实的细节和丰富的侧面保存了下来。从这个意义来说,照片可以说是具像的历史,它将逝去的一切定格为一个个永恒而真实的瞬间。然而,历史学家更多是把已经出版的纸质文献、档案馆里的档案或者各种手稿、信件等资料视为可信的“史料”(sources),而将照片、图片等作为辅助的资料使用。正如荷兰历史学家古斯塔夫·雷尼埃(Gustaaf Renier)所述,应当用存留至今的过去的“遗迹”(traces)观念取代“史料”观念[10]。这里的“遗迹”不仅指手稿、建筑物、家具等,也指各种不同类型的图像,包括绘画、版画、雕像和摄影照片等。

照片作为特殊的文献资料,本身也是一种书写的语言,图像本身也是历史证据的一种重要形式。照相技术从诞生的那一天开始,就成为一种独特的记录社会的重要写实工具。人们重视的并非照片介质本身,而是其所托载的形象信息。历史学家对图像的使用,不能也不应当仅限于“证据”使用,还应当为历史想象的产生留下空间和余地。照片定格的瞬间,并非只有画面所呈现出的确定的物质信息,也同时反映出拍摄者自身所关注的问题。在一些珍贵的历史照片上,不仅是照片本身,上面还附有相关事主亲自注明的人物名字、身份和彼此间的关系,有时还会包括对人物、事件背景的详细描述,文献价值很大。有时一组照片就是一个很好的研究专题,具有不可替代的历史文献和历史文物的双重价值。

1920年代顾颉刚提出“古史层累说”概念,这既是一种历史观,又是一种历史研究方法,这是在“层累地造成古史”观支配下的方法论体系。今天从这个角度重新审视各种形质的文献资料时,可以得到启发,尤其是在城市史、地方史的综合研究中。城市历史、城市记忆的研究具有鲜明的地域特征,城市是一个特定的空间场域,反映了城市中各个社群在不同时间切面所形成的物质环境。同时,这也是一个文化符号,是特定群体对于场所环境的共同记忆。像上海这样的大城市,近代以来逐步形成五方杂处、吐故纳新的城市格局,社会风尚、文化景观都在快速变更。尤其是城市的景观格局,更是一个地方性最重要的实体要素,是在历史发展中不断层累的结果[11]。美国历史地理学者康曾(Micheal P.Conzen)指出:“历史地看待景观就是承认景观的累积特征;承认自然、象征性与设计不是人类记录的禁止因素,而是随着历史体验而变化的;也承认地点的地理特征是每一种该区域或区位特有的新形式在时间进程中选择性叠加与生存的结果。”[12]

尤其是在近代剧烈的社会变革时期,东西方文化交流大背景下,中国城市的景观和标志性建筑以前所未有的速度和力度变革。以上海最著名的外滩来说,不同的设计师,不同的建造时期,勾勒出不一样的建筑轮廓,是上海“海纳百川,兼容并蓄”最重要的文化地标。今天外滩50多幢极具代表性的万国建筑群,已经将外滩烙印在城市生活的空间构架之中,成为上海市民的集体记忆。它涵构在历史时序的发展脉络之中,展示出城市的文化底蕴和时代风貌。但外滩天际线并非一蹴而就。从1840年代一片湮没于芦苇丛中的泥泞纤道,被一次次扩宽,一次次重建,直到1930年代才逐渐凝固。随着时间推移,人们的记忆已经一次一次被改写和叠加,不仅写入个人的记忆,也逐步写入集体记忆之中。如今鲜有人再记得其最初的模样,无论在中外文献记录中,还是前人的回忆和追述里,外滩的早期形象日渐模糊,消失不见。说到海关大楼,几乎所有当代中国人能想到的都是一幢巍峨的西式钟楼建筑,而不再有人记得江海关曾经是一个典型的中式衙门(见图1-3,上海图书馆提供);提起中国银行大厦,所有人津津乐道这幢建筑与绿色尖顶的和平饭店之间比高的故事,却无人想到其实这里曾经是德国总会,甚至还举办过故宫文物南迁的展览会(图4-5,上海图书馆提供)。然而,图像文献的出现改变了这种状况,以非常具体的形象客观记录着远去的时代,也能迅速把今天的人们拉回历史现场之中。上海图书馆馆藏的各种不同年代的外滩长卷,就是一段极佳的城市天际线变奏曲,提醒着人们这座城市成长的轨迹。

图1 1845年设于北门外头坝的江海北关

图2 1893年在原址附近重建的上海海关大楼

图3 重建于1927年的海关大楼

图4 1908年建造的德国总会

图5 1937年在德国总会原址兴建的中国银行大楼

3 历史照片数字化过程中的交互元数据

数字化技术的进步使得数字化保存对象(Preservation Digital Object,PDO)可以有效地保存历史照片的完整性,以便于在展示、数据分析和复原等方面得到应用,因此,对原始图像资源的数字化过程非常重要。首先,要确保数据的真实还原。其次,数字化的过程不能反复进行,因为在这一过程中无论采取任何程度的保护措施,原始图像资源都会不可避免受到损害(包括光照、灰尘和轻微的划痕等)。最后,数字化的过程需要保障后续研究的拓展性,这就涉及到采集和归档时需要对整个数字化过程进行全面的记录。

3.1 需求与目标

历史照片的数字化图像将通过国际图像互操作框架等数据协议向公众进行数据开放与共享,因此需要建立一套数字化成像一致性标准,以保证数以万计的历史照片被数字化后可以保持与照片具有相同的研究价值。这就涉及到采集和归档时,需要对整个数字化过程进行全面的记录。

3.2 历史照片数字化交互元数据框架设计

3.2.1 数字化一致性环境规范

本项目基于美国国会图书馆《文化遗产资料数字化FADGI技术指南》与荷兰《Metamorfoze保存成像指南》等数字化技术规范制定中国近代历史照片的采集规范与交互元数据架构。虽然两套系统在成像质量概念上相等,但系统不能互换使用(见表1)。

表1 数字成像环境参数对比

除了成像的技术参数,需要被记录下的交互元数据还包括物理环境(房间照度、墙面处理、室内色温、温度与湿度)、色彩管理系统、设备校准参数和参考目标。

物理环境:数字化操作环境对于PDO成像质量会产生很大的影响,理想的数字化物理环境包括房间(灰色或深色的墙壁和天花板)、工作台应保持暗色、消除相机与支架的振动、消除眩光)。

色彩管理:数字化是将模拟的颜色和亮度值转换为离散的数值,这些数值包含图像中每个像素的颜色和亮度。然而,这些数值的呈现则取决于用于采集、显示与打印的设备。因此在开始数字化采集之前需要对相关的拍摄、显示与计算机设备进行统一的色彩管理,色彩管理为这些数字值的客观解释提供了一个背景,并在色彩和色调再现的限制范围内帮助弥补设备在呈现或显示这些值的能力方面的差异,从而确保PDO的分辨率(PPI)和清晰度(Sampling Efficiency)要求。

设备校准:在开始拍摄前需要对所有设备进行校准,设备校准不仅可以提高采集的准确性,而且可以通过使设备达到稳定、最佳状态,确保色彩管理系统运行所需的一致性。在显示器校准后创建ICC配置文件并保存,如果数字化操作的时间较长,需每周对显示器进行校准,相关校准的参数与时间节点数据都需要记录在交互元数据中。

参考标定:在数字化准备阶段,需要对其材料和尺寸进行分类,这种规范的层次结构对数字化操作有很大的帮助,可以大大缩短数字化所耗费的时间,主要涉及到每次调整设备类型和参数的时间。在数字化采集历史照片时,需保持每张采集图像中包括参考目标,至少包括灰度、颜色参考和精确的尺寸标度。通过对PDO进行采样分析,可以得到不同的设备的OECF(Opto Electronic Conversion Function)采样参数见(见图6)。同时通过参考标定的瞄准点容差值,分析设备采样的参数从而调整拍摄环境(见表2)。

图6 不同设备参考标定的参数分析

表2 参考标定瞄准点容差范围

数据标准与保存:历史照片数字化项目信息框架中文件格式分为主文件格式和访问文件格式。对于文件格式的选择主要基于成像质量、访问与管理,以及更迭生命周期等参数。针对上海图书馆历史照片主要使用16位未压缩的TIFF文件格式作为主文件格式。最终的图像数据信息量由空间分辨率决定,空间分辨率根据每单位测量的图像元素或像素的数量决定图像文件中的信息量,其定义了单个像素之间的距离。

3.2.2 数字化采集成像一致性参数标准

PDO需要在完成采集后进行数字化调整,消除图像的色彩偏差,同时保持画面的色调分布均匀。适当的锐化图像以匹配原有的画质(锐化在数字化扫描操作后尤为重要)。尽量避免使用直接的调整工具,如对比度、亮度的调整。参照FADGI和Metamorfoze参数标准,结合中国近代历史照片的基本情况,制定数字化采集成像一致性参数标准(见表1)。

空间频率响应(Spatial Frequency Response,SFR)是一个相当复杂的数学模型,用来描述在不同的特征尺寸下细节的记录情况,对细节进行更全面的分析判断图像是否被过度锐化。使用imatest对PDO进行采样分析,同时生成图表的公式,对应数字化采集成像一致性参数标准,然后分析图表以提供最终的相关评级数字(见图7)[13]。

图7 空间频率响应等相关参数分析表

PDO通过Adobe Photoshop自带的分析程序进行自动分析,也可以通过Delt.ae和Golden Thread软件进行分析,并且都可以通过图像嵌入的ICC配置文件分析出FADGI成像星级设置基准。通过分析可以对数字化采集图像的锐度、色彩和精度、噪点和错误配准以及照明均匀性等参数得到基本反馈。使用Delt.ae在线工具可以得到空间准确性和颜色准确性的评级分析,以及Metamorfoze成像指南的评级。最终PDO使用JHOVE以XML文件生成档案信息系统报告,同时可以批量检测PDO质量。

3.2.3 范围分析

上海图书馆馆藏历史照片在数字化之前需要对其采集范围进行分析,需要对数字化的优先级进行初步估算,以评估数字化项目的可行性与完整性。

工艺分析:上海图书馆的历史照片藏品还在不断地增加,元数据著录主要基于GCI归纳的11种材料工艺流程类型。本项目历史照片中早期工艺流程主要基于蛋白工艺,这也是早期表现中国风貌照片的主要材质类型。本项目中大部分蛋白工艺类型的历史照片主要为后蛋白期类型,时间节点为1890年至1920年代末[14]。到20世纪,在中国活动的摄影师主要使用银盐明胶工艺。相纸分为印相纸(Printing-out Paper,POP)和显影纸(Developing-out Paper,DOP)两种,两种工艺的区别不在于感光材料的内部结构,而在于银基的显影方式。

尺寸和胶片分析:历史照片的尺寸分析主要用于数字化工作效率,现代胶片的尺寸通过工业化生产,每种类型有着固定的型号,大致分为三类:边缘打孔胶片、卷片和散页。负片数字化内容通过后期处理软件直接转为正片,参数标准需录入交互元数据集。由于胶片的动态范围通常较短所以采集分辨率需要调整为较高的参数,具体执行过程视情况而定。

多光谱分析:数字化的过程中可以使用多光谱分析对可见光谱之外的信息进行采集,这主要针对显示照片损坏区域的内容。DT多光谱照相机可以在红外和紫外光谱中拍摄图像,历史照片损坏的区域(特别是烧毁或涂鸦)可以在紫外线和红外线的影响下显示肉眼看不到的图案和信息。部分高性能DT相机可以同时捕获多个光谱带,但采集过程中因为成本的因素只对极个别的重要历史照片进行多光谱分析,频繁更换滤镜会影响采集的效率。

3.2.4 交互式元数据框架设计

交互式元数据信息框架可以建立起一种具有交互性的数据传播模式。本项目信息框架的元数据提取基于国际上使用最广泛的标准——可交换的图像文件格式标准(Exchangeable Image File Format,EXIF)和国际新闻电信理事会(International Press Telecommunications Council,IPTC)照片元数据标准。EXIF储存了基本的设备信息,IPTC记录了标题、版权、操作等相关信息。交互元数据可以被分为宏观交互元数据(Macro Paradata)和微观交互元数据(Micro Paradata)[15]。宏观交互元数据主要用于记录决策性信息,微观交互元数据则记录了过程的细节。由于数据的语义、编码、格式和信息需要在数字项目中进行管理,因此,在任何项目开始时需要将所有数据结合上下文放置在信息框架中。框架可以帮助定义涉及的对象类型,以及描述其信息级别。这种描述级别将数字对象在文件或项目上的需求进行描述。最终信息框架映射了元数据元素集的选择,从而决定了内容的提取,这些信息都以特定的方式进行编码,保存在数据库或XML文档中(见图8)。

图8 数据框架结构

3.2.5 数据格式与粒度

交互元数据大大扩展了数据的粒度级别,但在实际工作中大多数项目基于某个特定的项目进行,并不能对数字资源做精确描述,所记录的数据粒度级别需要预先制定。这需要考虑到不同项目所提供已知信息的情况,元数据可能来自不同的信息层次,并存在于不同的信息层次上,PDO保存和传输必须基于不同的信息层次,这需要针对不同的项目规范数据的粒度级别。本项目最终的数据将导出为RDF数据架构,其支持多页或复杂对象的层次描述信息和结构信息,以及将数据导入、导出和收集到外部系统或XML编码格式。

3.3 数据调整与验证

最后需要对格式进行批量验证,通过JSTOR与哈佛大学图书馆共同开发的可扩展的格式验证框架项目JHOVE(JSTOR/Harvard Object Validation Environment)对文件格式正确性、效性和一致性进行验证,JHOVE提供12种标准模块,包括本项目用到的TIFF、JPEG2000和XML的HUL模块。例如,验证TIFF文件的图像文件目录(Image File Directories,IFDs),验证XML文件的语法正确性和语义正确性。自动化技术不太可能在评估元数据内容的准确性和完整性,只能验证其语法的正确性,元数据完整验证需要一定程度的人工分析。对于大型数字化项目,可以使用统计有效的抽样程序来检查文件和元数据。

4 结语

数字技术在艺术与人文学科的国际框架中扮演着越来越重要的角色,针对使用数字化工具和技术重新呈现文化遗产的研究在全球范围内继续发展,其应用的广度和深度都体现出这是一种完整的研究过程以及实用性的研究方法。在艺术、人文和遗产保护领域研究创造的数据信息可以使我们更为深入地了解过去,文化遗产数字化保护了学科研究的多样性和规模,全面地展示了数字技术在艺术和人文领域迭代研究中的作用。对历史照片进行数字化只是一个初步的尝试,也是图书馆行业对时代潮流的回应。参照数字化采集成像一致性参数标准采集的图像质量要远远大于现实数据应用的标准,这样可以大大延缓数据迭代,统一的标准也可以被广泛应用于不同的国际数据平台,有利于历史原照档案的信息传播。未来复合型图书馆、信息共享空间等理念和实践也将依托于此,逐步导入公共图书馆的管理和服务。

猜你喜欢

数字化图像历史
浅析p-V图像中的两个疑难问题
家纺业亟待数字化赋能
巧用图像中的点、线、面解题
有趣的图像诗
论经济学数字化的必要性
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
新历史
历史上的6月
历史上的八个月