APP下载

面向数字人文的高校开放档案组织策略及利用模式研究*

2020-12-08尚奋宇任文文

山西档案 2020年2期
关键词:档案馆人文数字

尚奋宇 任文文

(1.山西医科大学档案馆 晋中 030600;2.山西医科大学管理学院 晋中 030600)

0 引言

数字人文已在全球实践中取得丰硕成果。在档案学领域,数字人文实践主要集中在档案资源开发和数字记忆构建两个层面。档案资源开发旨在档案资源数字化的基础上对其内容进行深度挖掘和价值开发,实现由提供文件级的信息服务向提供数据级的知识服务的转变[1],数字记忆通过数字技术在虚拟空间打造记忆宫殿,为人类遗产的传承、保护与创新提供新的方法路径[2],相关实践包括国家图书馆的中国记忆项目、上海图书馆的家谱知识服务平台、美国弗吉尼亚大学数字历史研究中心的影谷项目(The Valley of The Shadow)等。数字人文宣言2.0指出,在数字人文生态中,高校不再是知识与文化唯一的生产者、管理者和传播者,而应是新兴领域学术话语的数字模型建模者和全球及本地的知识生产、交流与传播网络的建设促进者;档案馆的定位不再是次要的、支持性的部门,而必须是教学和学术实践的主要场所[3]。在这一背景下,高校档案馆如何积极响应档案开放需求,充分组织利用数字档案资源,开展面向校内及公众的知识服务,参与到数字人文项目中来,是本文意在探讨的问题。

1 高校开放档案概述

在档案学领域,开放档案指将保密期满和其他可以公开的档案解除保密限制,经过一定的手续向社会公众提供利用[4],由于档案的利用受到《档案法》、《保密法》以及隐私权保护等法律的制约,在传统的档案管理工作中,档案保管的重要性远大于档案开放。在开放政府和开放存取运动背景下,关于开放档案的讨论逐步增多,其内涵由最初的档案馆自上而下解除保密限制向更加多元的档案共建共享发展。

1.1 高校开放档案的提出背景与发展局限

开放档案倡议(Open Archives Initiative, OAI)将开放档案定义为可通过网络访问并开放获取的数字档案库,其中“开放”是指定义并推进实现数据传输与调用的API,以提升各类数据提供者所提供内容的可用性,并不意味着无限或免费访问[5],“数字档案库”包括但不限于学术论文等各类数字资料。当前已有不少高校及学术组织制定了相关的档案开放政策,对档案数据共享进行指导和规范,如法国科学传播中心(CCSD)建立了开放档案平台HAL,旨在实现法国及其他国家的科研机构档案、学科档案及科研文献的开放共享及永久保存[6];北京大学建立了开放研究数据平台,为校内及全社会的各学科研究者开展研究数据的保存、分享与再利用活动提供信息服务[7]。

然而,当前我国高校档案的开放还面临着相关法规政策不完善、开放鉴定程序不明确、实施工作标准不统一等挑战,早在2008年,教育部令第27号《高等学校档案管理办法》就明确规定高校档案机构应开展档案的开放和利用工作,同时规定不得对外公布涉及国家秘密、专利或技术秘密、个人隐私或限制使用的档案,但并未对可开放的档案内容及其开放途径和要求做详细部署[8]。2010年,教育部令第29号《高等学校信息公开办法》对高校应主动公开的信息的内容、途径和要求做了具体规定,但并未提及高校档案公开的相关措施[9]。这导致高校开放档案的发展并不平衡,在一定程度上存在着开放范围小、更新速度慢、利用效率低等问题,开放档案类型仅包括学术论文资源,其他类型的档案则较少出现。高校档案资源有必要在合法合规的前提下实现开放利用,向大众展现其丰富的人文价值。

1.2 高校开放档案的内涵、分类及其价值

《高等学校档案管理办法》将高校档案定义为高等学校从事招生、教学、科研、管理等活动直接形成的对学生、学校和社会有保存价值的各种文字、图表、声像等不同形式、载体的历史记录。高校档案需经开放鉴定通过后方可成为开放档案。结合档案公布的相关要求,高校开放档案可以定义为由档案机构及相关部门合理组织与再开发的且能够实现开放数据访问的高校档案。

依据高校档案的公布要求,可以将高校开放档案分为教学档案、科研档案、教务档案和校务档案四类。教学档案是高校教师和学生在教育教学及实践过程中形成的有保存价值的真实记录,其中,教师教学档案是通常由教师提供的能够体现教学质量与教学范围的教学成果总结,允许通过超文本链接收集、组织和发布多媒体类型文件[10];学生教学档案是反映学生在校期间学习和实践的真实记录,包括学业成绩、奖惩、学籍变更、肄业及授予学位情况。科研档案是指高校在科研立项、研究及验收活动中直接形成的,具有一定学术价值的文字材料、计算材料、实验数据、图表等各种形式和载体的材料,是评估高校科研水平的重要凭证[11]。教务档案是教务管理部门在教学管理、教学实践和教学研究等活动过程中形成的真实记录,包括教学计划、招生计划、教材目录、评估材料等。校务档案是高校行政部门在行政决策、基本建设、仪器采购及维修等管理和经济活动中形成的文字、图册、账簿、报表、音视频等各种载体的材料。

高校档案是新老高校了解该校在不同时代的教育理念、教育方式等活动的重要依据,是高校传承人文记忆、弘扬人文精神的重要载体,具有一定的人文价值与社会价值。如教学档案能够为高校师资力量评估、教师职称晋升及教学质量评估、学生就业入职及学位认证等活动提供凭证;科研档案能够为科研人员知识产权和著作权的认定提供凭证,也可为学术不端行为的追踪提供协助;教务档案能够促进高校教学工作高效进展,为学科专业设计和教育教学改革提供依据;校务档案是高校廉政治校的重要凭证,在为上级部门检查、法律纠纷等事务中有较大用途。

2 数字人文与高校档案馆的匹配性

档案馆为数字人文研究提供全方位支持,是数字人文研究的必要支点,更是新时代档案馆的生存方式之一。高校档案馆作为数字人文教学和学术实践的主要场所,应深入了解数字人文发展历程与核心特征,加大档案资源开放力度,满足数字人文研究的不同层次需求,共同孵化研究成果。

2.1 数字人文的发展历程与核心特征

数字人文源起于1949年的人文计算,其核心是通过自然科学严谨、系统、明确的程序方法论,来解决迄今常以偶然方式处理的人文科学问题[12]。数字人文的发展主要历经三个阶段。《数字人文宣言2.0》指出,数字人文1.0的主要工作是定量研究、提升数据库检索能力、基于自动化语料库的语言学分析等,发展目标是使用信息技术照亮人类记录,并使对人类记录的理解影响到信息技术的发展和使用;数字人文2.0在定量研究的基础上,强调定性研究、经验解释和情感生成,将数字工具服务于长复杂性、批判性、媒介特性、历史背景和深度分析的人文学科,通过新的研究实践模型和技术工具促进新的耦合拓展[3]。数字人文3.0在数字化与传统社会公共社群结构融合的趋势下,研究方案的主要任务是利用信息技术补偿和重组人文工作,提供人文学科自由资源,重新构想人文学科的组织范式[13]。

从价值观念、研究方法和研究领域来看,数字人文具有如下核心特征。其一,数字人文拥有乌托邦式的价值观念,肯定开放、无边界、学术民主和知识共享,支持无墙的高校、图书馆、博物馆和档案馆,注重批判和反思,强调文化记录的振兴和知识的“去殖民化”,设想了任何人都可以在任何时间、任何地点参与话语表达的未来[14]。其二,数字人文拥有人文思辨与数字技术并重的研究方法,同时认同跨媒介论证与设计的重要性,其技术体系包括数字化技术、数据管理技术、数据分析技术、可视化技术、VR/AR技术和机器学习技术六个方面,分别对应构建数字人文的资源基础、服务系统、应用平台、直观形象、交互环境和智慧服务[15]。其三,数字人文涉及众多研究领域,除历史学、文学、社会学、语言学、考古与艺术学之外,有时也包括平台研究、软件研究、媒介研究、文本编码、数据挖掘和数据分析等新领域。

2.2 高校档案馆与数字人文研究层次

数字人文的研究实践内容分为人文数据库或数据集的建设、人文数字工具的开发使用、创新人文研究方法和研究范式、人文领域的创造性破坏与建设四个层次[16]。高校档案馆应充分利用现有档案资源,满足上述需求。一是优化数字档案资源组织体系。高校档案自高校成立起就真实全面地记载了高校教学、科研及管理活动的成果变迁,档案数字化工作将各类载体的档案资源转化为数字档案,并构建了相应管理系统。但早期数字化工作注重载体转换和档案保密,构建的管理系统仅可面向校内部分人员进行检索、下载,应适当扩大档案开发力度,进一步优化数字资源组织体系,构建数字人文资源服务平台。二是参与数字人文工具开发。高校档案馆应与数字人文中心合作,参与数字人文工具的开发、应用和推广,针对校史研究等与档案工作融合紧密的数字人文项目进行合作,开发大量专门领域的应用系统,为特定专题研究提供平台支持;深入掌握各类数字人文研究工具的应用功能,为用户提供工具或数据库使用培训,同时可以评测数字人文工具使用体验,提出改进意见。三是提供数字人文研究指导。高校档案馆深刻理解档案的内在形成及资源结构,可以承担数字人文项目的研究中介角色,协助多学科领域的研究者理解档案资源结构,协助搭建数字人文项目的本体论基础。四是构建数字校园记忆。加小双指出数字记忆将数字人文和文件档案管理的方法进行了融合,属于数字人文的第四个层次[2]。高校档案馆作为校史研究的主体,在校园的数字记忆构建和保存上拥有先天优势。

3 面向数字人文的高校开放档案资源组织策略

将高校开放档案资源转化为计算机可读、可处理、可理解、可利用的优质数字资源,是开展数字人文研究的首要需求。本节从资源采集、语义描述和知识展示三个层面提出了高校开放档案资源的组织策略,在对数字档案资源进行文本化和数据化操作的基础上,通过本体、关联数据和可视化等技术实现高校档案的知识揭示和应用。

3.1 多样化资源采集:人文价值观的资源仓储

数字人文追求“构建无人被排斥在外的公共领域”、“向所有人彻底开放话语圈”的核心人文主义价值[14],追求以权力中心为代表的优势集体与去权力化的非精英异质群体的联合。传统高校档案的采集依据档案材料形成单位、课题组立卷的归档制度,由学校各部门的档案工作负责人员按照归档要求对本部门的教学、科研和管理等档案进行整理、立卷并向高校档案机构移交。这样的采集方式从高校管理层角度出发,对各类材料的重要性进行判别并决定其是否应该归入档案,虽利于档案资源采集工作的有效开展,但在某种程度上忽视了学生或教师等高校主体的意见。面向数字人文的高校开放档案资源采集方式应当在继承原有归档制度的基础上有所拓展,具体包括以下几种方式,一是存量档案的数字化,二是由管理层主导的电子文件移交与接收,三是构建由高校师生自主决定归档内容的社群档案。以人文北京研究中心的“北京记忆”项目为例,其多样化的资源采集包括由基础资源、衍生资源、众筹资源三类,基础资源指现有档案、图书、音视频等不同类型的北京历史文化资源,衍生资源指课题组围绕基础资源编写的摘要和大事记等参考资料,众筹资源指“我的北京记忆”互动网站,该网站是为北京居民、海内外北京文化爱好者建立的互动交流平台,旨在捕捉、记录与北京有关的记忆,记忆贡献者可以是在北京生活(过)的每个人,也可以是组织、机构、企业和团体[17]。

3.2 细粒度语义描述:机器可理解的数据关联

将已采集的高校数字档案转化为计算机可理解的数字资源,是数字人文研究中需要解决的重要问题。高校档案机构通常依据《DA/T18-1999档案著录规则》、《DA/T46-2009文书类电子文件元数据方案》、《DAT54-2014照片类电子档案元数据方案》、《DAT63-2017录音录像类电子档案元数据方案》等行业标准,采用著录项和元数据进行资源描述。对于大体量的数据集合,粗粒度的著录与元数据描述工作难度低,更便于资源的集成与内部利用,但对于需要进行数字人文研究的高校开放档案资源来说,一方面,有必要进一步采用细粒度、深层次的语义描述模型以解决数据格式异构、实体名称歧义、语义信息不一致等问题,进而揭示更丰富的信息内容,另一方面,有必要采用相关数据发布技术实现高校档案资源的开放共享,进而提供面向公众的知识服务。本体作为语义网环境下知识组织和数据语义化表达的关键技术,能够实现不同格式和类型的元数据的语义互操作,解决资源描述中的语义异构问题,实现资源内部的语义关联、权限控制和接口管理。关联数据是一种数据发布和关联的方法,采用RDF和HTTP在Web上发布结构化信息,采用RDF链接技术在不同数据源中的数据之间建立计算机可理解的互连关系[18]。

目前已有较多数字人文项目构建了相关领域本体模型和关联数据集,可以为面向数字人文的高校开放档案语义描述提供参考。上海图书馆数字人文项目团队在继承和复用BIBFRAME、FOAF、PROV、Schema.Org等本体模型和词表的基础上,定义了人、机构、地、时、事、物等类和属性,构建了一体化的上海图书馆本体模型和词表,包含130万余人物的人名规范库和2000余收藏机构的机构名录、地名词表、中国历史纪年表等内容,为上海图书馆的家谱、古籍、老电影、手稿档案、红色文献等文献知识库提供跨网域的数据连接,并在开放数据平台以关联数据的方式向互联网公开发布,同时提供各种数据消费接口供开发人员调用[19]。高校开放档案领域本体的构建可在借鉴已有本体模型的基础上,结合档案领域专家智慧,采用自然语言处理等技术从档案信息中获取相关实体、属性和概念,对高校档案进行细粒度的内容揭示;关联数据的构建需要配置私有关联层和公有关联层,根据实际的档案开放鉴定情况对尚未开放的档案资源进行保护。

3.3 可视化知识展示:动态交互式的内容集展

对高校开放档案进行语义描述、数据关联等有序组织后,需搭建高校开放档案利用平台并面向用户提供服务。传统的高校档案服务平台仅着眼于针对校内用户的文件查询与下载,面向数字人文的开放档案知识展示平台构建应当注重用户友好的设计理念和动态交互的数字技术,向公众提供资源导航、语义检索、成果发布、内容集展等服务。在数字人文领域,集展指的是为了创造价值、影响和质量,对人类文化记录进行组织和再现的一系列广泛的实践,高校开放档案的内容集展可从专题集展与互动集展两个方面入手,专题集展以时间为线索,采用VR(虚拟现实)/AR(增强现实)、GIS(地理信息系统)等可视化技术真实灵活地向用户展示高校在某一时间段、某一地域发展历程及相应成果;互动集展以高校教学、科研等活动的历史记录为基础创建沉浸式环境,使用户根据定位亲身感受高校历史与现实,允许用户浏览及增加记忆标签,增强用户学习乐趣以及对高校的认同感。此外,知识展示平台亦可引入移动端(包括手机、平板等)和数据大屏等形式作为补充与丰富,搭建全媒体跨平台多形式的数据可视化展示系统[20]。以英国泰恩·威尔郡档案博物馆和纽卡斯尔图书馆共同开发的“隐藏的纽卡斯尔(Hidden Newcastle APP)”为例,该APP运用GIS技术,可根据用户的定位采用音频幻灯片、历史摄影、老报纸等多种内容和形式推送与城市历史相关的故事,向用户展现纽斯卡尔市800多年的发展历史[21]。

4 面向数字人文的高校开放档案资源利用模式

在高校开放档案资源有序组织的基础上,本节借鉴活态档案馆(Living Archives)有关理念对高校开放档案资源利用模式进行探讨,以期通过整合内外部资源带动数字档案馆信息服务方式的变革,深入开发档案的人文功能与社会功能,从全面改善和提升用户服务体验的角度出发重新规划设计档案馆服务形态[22]。

4.1 开放档案接口,提供跨界知识服务

开发存取是国际各界为促进科学信息自由传播而发起的运动,在开放存取下任何用户都可通过公共网络免费获取所需文献,高校档案资源的开放可助力数字人文展开更加多元的研究。如中央昆士兰大学利用教学档案对建筑环境专业学生升学率的影响因素进行研究,通过分析学生的性别、地理位置、社会经济地位、出生国家、课程得分等变量与学生升学进度的相关性,发现课程得分对学生升学进度有显著的促进作用,其他因素相关性则较弱[23]。同时应当注意到,数字人文涉及的学科范围从传统人文学科逐渐向社会学、经济学和文化研究等领域渗透,其研究对象已不再局限于档案资源。图书馆、档案馆和博物馆作为数字人文研究的信息资源数据库,三者资源融合既有利于各机构知识服务数据库的共享,又有利于社会记忆的完善。因此,高校开放档案资源的利用,一方面需要对本馆资源进行深度挖掘,另一方面需要加快与图书馆、博物馆资源的融合,满足不同数字人文项目跨边界的知识服务需求。

4.2 整合专业优势,培育“刺猬狐”型人才

数字人文研究需要既能广博也能深究的“刺猬狐”人才,即像刺猬那样深度钻研,接受人文分支学科领域的纵深性培训,又像狐狸一样充满好奇心,具备来自设计、计算科学、媒体工作、信息保管和图书馆学等方面的综合技能[14]。高校档案馆作为教育资源的集中地,拥有丰富的教育活动记录与科学的档案管理经验,可协助承担高校育人责任,其教学形式除了传统的开设课程与设立实习基地之外,也可加入教育性游戏等强调用户参与互动的形式,引导学生自下而上地完成对高校档案资源的编研利用,在增强学生对人文资源的鉴别、重组和价值创造能力的同时,加深其对高校历史及品牌形象的理解与认可。教育性游戏通常采用沉浸与模拟的形式建立虚拟的学习环境,拥有复杂叙事、丰富互动、自愿参与等特点,高校档案馆可以与高校教学单位展开合作,利用档案的真实性与游戏的独特性来建设探索互动式的教学模型。以达特茅斯大学档案馆采用的由Tiltfactor实验室创建的元数据游戏(Metadata Games)为例,该游戏以独特的方式展示档案资料,学生在参与学习自身感兴趣的高校档案的同时,也为数字化档案资料提供了元数据,协助档案馆更加准确、多元地描述档案资源[24]。

4.3 多元主体协同,开展数字文创实践

数字人文研究倡导知识产出的多样化,其成果既可通过程式化的学术文本型论文等学术成果来体现,也可通过在线访问的信息系统和数据库、多媒体交互式的历史地理信息系统等大众文化产品的形式呈现[25]。2017年4月,文化部出台《关于推动数字文化产业创新发展的指导意见》,提出推进数字文化产业创新创业,引导领军企业联合中小企业和科研单位布局创新链,依托重点高校等多元主体系统性开展数字文化产业创新实践[26]。动力不足一直是高校档案资源开放利用的瓶颈,在数字人文时代,采用一定商业化方式,与其他高校及科研机构、企业、数字文化产业创新中心等多元主体合作,一方面可以激发档案资源开放活力,调动馆员积极性,充分发挥高校档案资源价值,另一方面可以开拓校企合作渠道,提升高校产学研转化水平。当前我国工业遗产的价值再创造已有较好成果,其路径高校档案馆可以参考,如常州市“运河五号”创意园区以“园中建馆”为特色,内设常州市工商档案博览中心,档案机构入驻文创园区,与规划设计者、地方政府、开发商与社会组织、档案机构、文创企业与商业店铺等多元主体协同合作,在履行一般性档案馆例行职责的同时,积极融入园区业态中,在保护档案完整与安全的前提下,与文创企业合作共同打造特色品牌,充分实现档案资源的市场价值[27]。

5 结语

数字人文是人文研究与数字技术沟通碰撞的产物,强调在人的创新性思维上融入数字技术,在数字时代下促使人文学科研究焕发新的生机与活力。数字人文研究作为档案资源组织利用的重要应用方向,其乌托邦式的价值观念为高校档案资源的开放、组织与利用提出新的可能,但同时也显露出高校档案资源开发过程中的诸多问题,法规政策不完善、管理力度不到位、归档内容不全面、档案资源结构分散、档案工作人员观念保守、高精尖开发团队缺乏等主客观原因制约了高校档案资源的开放进度。面对这种情况,高校档案馆有责任在规章制定与档案实践中做出优化设计,与数字人文团队、校内师生及社会公众等多元主体进行跨界协作,加快促进与图书馆、博物馆的资源融合,尽快推出详细具体的开放档案鉴定程序与方法,共建共享基于各类高校档案资源的知识服务平台,实现数字人文实践与档案开放的协同发展。

猜你喜欢

档案馆人文数字
美在山水,魂在人文
最朴素的人文
太原市档案馆牵手百年胡氏荣茶共寻文化脉络
云南省档案馆馆藏《东巴经》
答数字
数字看G20
人文社科
when与while档案馆
成双成对
数字变变变