APP下载

计算档案学跨学科态势探究

2021-11-26于英香于志莹上海大学图书情报档案系

浙江档案 2021年7期
关键词:信息科学档案学跨学科

于英香 于志莹/上海大学图书情报档案系

“实际上研究主题本身是不分学科的,按学科研究是人为制造出来的”[1]。大数据背景下,发展跨学科研究是发挥知识效用的应然之举。2019年,教育部、科技部等13个部门联合启动“六卓越一拔尖”计划2.0,发展“新文科”建设[2],有效推动了人文社科领域的跨学科研究。近年来,在大数据、人工智能等新兴技术的推动下,国内外跨学科研究成为新的热点。计算档案学(Computational Archival Science,简称CAS)正是研究档案学如何跨学科的新兴学科领域,相关理论研究与实践探索在欧美国家盛行。如,傅天珍、郑江平将国外计算档案学的概念及研究进展引进我国[3];周文泓等在案例分析的基础上明晰了数字技术与档案领域融合的理论框架及实践内涵[4],并对计算档案学的要义进行了逻辑揭示[5]。但总体来看,目前我国的计算档案学研究尚处于概念内涵阐释以及案例分析的初级阶段,在越来越多的问题需要自然科学与社会科学相融合才能解决的当下,站在跨学科的角度看待计算档案学这一新兴学科领域,既符合时代热点,又能为计算档案学提供新的研究视角。本文拟从跨学科的角度审视计算档案学,探究计算档案学与相关学科的跨学科融合,以促进新文科建设背景下档案学的创新发展。

1 计算档案学提出的背景及其发展

1.1 计算档案学提出的背景

计算档案学的提出有两大背景,即技术背景和学科背景。从技术背景看,大数据时代,档案界积极探索云计算、大数据、区块链、人工智能等新一代信息技术在档案领域的应用,近五年的国家档案局科技项目以及国家社科基金项目的选题指南中,与新一代信息技术有关的选题越来越多、占比越来越高。与此同时,以新一代信息技术为主要技术方法的跨学科数字人文项目在世界范围展开,如我国的“数字敦煌项目”[6]、美国弗吉尼亚大学的“影谷项目”[7]、欧洲的“威尼斯时光机项目”[8]等。随着研究和实践的推进,信息技术在档案领域的嵌入越来越深,为计算档案学的提出奠定了技术基础。从学科背景看,计算档案学提出之前,在人文社会科学领域,许多“计算+”学科已然兴起。2007年,吉姆·格雷(Jim Gray)提出了科学数据背景下“数据密集型科学研究的第四范式”[9];2009年,以大卫·拉泽尔(David Lazer)教授为代表的15位美国学者在《科学》杂志正式提出“计算社会科学”概念[10];随后,计算法学、计算广告学、计算教育学、计算历史学等研究也次第展开。人文社科领域中出现的“计算+”学科现象,对档案学也产生了冲击。随着新文科建设的推进,文理融合成为大趋势,计算思维不断深入档案领域,计算思维与档案学的融合需要一种正式的表达与更加深入的研究。2016年4月,在马里兰大学举办的“发现新知识:大数据时代的档案记录”研讨会上,计算档案学被正式提出[11]。

1.2 计算档案学的发展

计算档案学提出之后,IEEE大数据国际会议连续5年召开计算档案学研讨会,此举有效提升了计算档案学的知名度,计算档案学成为新的研究热点,得到广泛关注。在计算档案学概念的不断发展完善中,一个显著变化就是计算档案学超越已有的多学科特征,转向跨学科。自计算档案学提出之后,研究者和实践应用者从未停止对其跨学科的探索。2018年,Marciano等学者发现数字记录的生产和消费受社会和工业趋势以及计算机和数据方法的影响,而这些与档案学几乎没有联系,并认为这种情况需要一种新的跨学科的正式表达,提出将计算档案学定义中的“多学科”改为“跨学科”[12];2018年,第三届CAS研讨会对计算档案学的概念进行了重新定义,强调了其跨学科特质[13]。由此,真正意义上跨学科的计算档案学产生。在此之后的研究中,“跨学科”更是计算档案学的显著标签。

2 计算档案学的跨学科特性阐释

2.1 从概念发展探讨计算档案学的跨学科性

从跨学科概念看,计算档案学的学科定位是计算科学、信息科学与档案学的跨学科交叉研究,学科边界容易与相关学科的多学科研究混淆。多学科强调不同领域知识的组合,每个领域的边界都保持稳定,这意味着学科之间是合作,而不是协同[14]。跨学科更多的是形式的结合,通过模糊领域的界限,在不同领域的交叉点创造新的思维方式或者新的专业。如,若一项研究使用了诸如自然语言处理(NLP)和机器学习之类的高级计算方法,但没有在问题空间中建立共同的目标和自己的专业,则可以将其描述为多学科协作;若一个研究融合了档案与计算的问题并开始产生新的目标、专业和理论,那么它将成为跨学科研究,即CAS的核心研究[15]。现有的CAS项目就是融合了档案与计算问题的跨学科研究。

计算档案学的概念强调了相关学科之间的融合,2018年第三届CAS研讨会对计算档案学的定义为:“一个跨学科领域,整合了计算和档案理论、方法和资源,既支持可靠和真实地创建与保存记录或档案,又解决大规模记录或档案的处理、分析、存储和获取,旨在提高效率、生产力和精确度,支持记录、评估、整理和描述、保存和获取决策,以及利用档案资料从事研究。”[16]可以发现,概念中将档案学、信息科学、计算机科学三个学科的相关理论、技术与方法融合,如“计算和档案理论”是计算科学和档案学的融合,而“档案的处理、分析、描述”等需要信息科学与档案学的协同。一个学科领域的建立需要有自己的特色,计算档案学是档案科学、信息科学、计算机科学三个学科融合发展的领域,运用这三个相关学科的知识研究三个学科之间的综合问题,这就是计算档案学不同于其他学科之处。

2.2 从实践应用论证计算档案学的跨学科性

追溯计算档案学的相关研究项目,可以发现计算档案学的实践应用很早就已开展,只是当时还没有用“计算档案学”命名。计算档案学实践的潜在模块,包括计算语言学、数字人文和图形分析、计算发现辅助工具、数字策展、公众参与档案内容、档案理论与计算方法的融合、网络基础设施和记录连续性、空间和时间分析等内容[17];计算档案学的应用领域,包括运输地图、网络金融服务和银行、自然资源和物理学、新闻学、心理学、认知科学、法律、司法、社会学与社区研究、数字化转型、企业风险管理、数据仓储与数据库系统、业务技术管理等[18]。根据计算档案学的潜在模块以及应用领域,国内外所开展的诸多跨学科实践项目均可归于计算档案学研究领域,如荷兰的“记忆宫殿”项目[19]、美国的“奴隶制遗留”项目[20]、我国的中石化电子文件归档管理区块链应用试点项目[21]等。

计算档案学的实践范围广泛,但并非所有运用计算思维来解决档案问题的研究都属于计算档案学领域的研究,正如Bundy所言,计算思维几乎影响着包括人文学科的所有学科的研究,从物理、生物、医学到哲学、建筑和教育等都有所涉及[22]。也就是说,许多学科嵌入计算思维已经常态化,而不能将这种常态都归为跨学科研究。Lee等构建了CAS谱图模型,用来判定哪些研究属于计算档案学的核心研究[23]。该模型由两个双向箭头横纵交叉组成,以箭头为边界将平面分为四个区域,类似于数学的直角坐标系,其中横向箭头可看作X轴,纵向箭头可看作Y轴,四个区域可看作四个象限。X轴正方向为跨学科程度,负方向为多学科程度,Y轴正方向为高级的计算思维与方法,负方向为传统的档案学研究。可以发现,第一象限表示运用跨学科研究与高级计算思维与方法的实践,越远离原点,其跨学科程度越高,运用的计算思维和方法也越高级,越接近计算档案学的核心研究。第二象限表示运用了高级计算思维与方法但为多学科的实践,第四象限表示运用了跨学科研究但为传统计算思维与方法的实践,这两类实践都部分与计算档案学的核心研究交叉,但不是纯粹的计算档案学核心实践与应用。第三象限为既没有运用高级计算思维与方法又没有运用跨学科的研究,表示远离计算档案学的实践运用。CAS谱图模型将计算档案学的核心实践与多学科的实践进行了区分,认为越贴近计算档案学核心研究的实践越趋于跨学科研究,这也进一步论证了计算档案学实践的跨学科性。

3 计算档案学跨学科融合趋势

计算档案学融合了档案学、信息科学、计算机科学等学科的理论和方法,学科融合并不是单纯的学科交叠结合,而是在跨界思维下没有限制的学科关联以及协同[24]。在学科关联与协同的过程中,不宜过于强调某个学科在计算档案学中的重要性。若过于强调档案学的重要性,会使档案学发展处于故步自封的状态;若过于强调计算科学或信息科学的重要性,会增加“计算档案学”演变为“档案计算学”的风险。这些都不是计算档案学创建的初衷。笔者认为,计算档案学的跨学科融合可在理论、技术和实践三个维度展开。

3.1 理论创新:延展大数据时代计算档案学理论场域

伴随着信息技术的发展,档案学学者不断探索技术嵌入背景下档案学理论的创新之路。大数据时代,计算档案学的出现推动了计算科学、信息科学与档案学的跨学科融合,计算档案学理论又面临着新的重构与转型。

利用跨学科平台创新发展计算档案学理论,提高档案学的学科认同,促进档案学学科发展,是计算档案学的核心要义。Payne运用Max-Neef的学科评价模型,结合计算档案学的概念,提出计算档案学在必须做、想要做、可以做、可以知道等维度应考虑的理论问题[25]。他发现在计算档案学的定义中,仅“存取决策”一词与信息科学相关,信息科学在研究由于技术更新而产生的用户信息行为变化尤其是操作者的利用体验方面的学科优势却被忽略;同样,该定义仅关注计算科学在计算方法和资源的应用方面的专长,却忽略了其在最佳实践计算和系统设计等方面的优势[26]。用户行为以及用户体验、最佳实践计算和系统设计恰恰是计算档案学实践中不能回避的问题,也是计算档案学发展过程中的理论追问,新问题为后续研究者提供无限想象和研究空间,在对相关学科理论追问的研究过程中,计算档案学跨学科理论将不断创新发展。

3.2 技术嵌入:强化计算档案学研究的技术取向

技术嵌入是档案学发展的重要推动力量,计算科学的计算机技术与信息科学的信息组织、数据分析等技术与档案学研究的融合已是大势所趋,但面对日新月异的技术发展,对技术如何选择以及如何选优是计算档案学技术嵌入的重要课题。

首先,计算档案学所选择的技术应被计算档案学研究人员接受。有学者在数字人文技术研究者接受数字人文技术的影响因素研究中指出,系统质量、社群影响和个体创新对数字人文研究者的采纳行为有重要影响[27]。那么,计算档案学研究者的技术接受影响因素有哪些?这是计算档案学技术不断嵌入过程中研究者需要思考的新问题。其次,计算档案学的技术选择是一个动态变化的过程。计算机技术与信息组织、数据分析技术的发展与迭代越来越快,计算档案学项目的技术采纳也会不断更迭,在技术的迭代与技术采纳的更迭过程中,档案学的技术取向不断强化,技术的选择与选优将会内化为计算档案学的核心内容,计算档案学中的技术应用也会由量变向质变转化,融合相关学科的元技术研究将成为计算档案学的重要组成部分。

3.3 实践推广:促进跨学科理论、技术与方法应用

作为一门新兴的学科领域,实践推广是支持计算档案学不断前行的重要推力,笔者选取IEEE Big Data大会CAS研讨会上探讨的典型计算档案学实践案例进行跨学科分析,阐明计算档案学实践中的跨学科协同,并可作为未来计算档案学实践推广的参照。

依据典型实践案例的目的和内容,可将其分为两类。一类主要融合三个学科的理论、技术与方法解决档案领域的问题,如案例“奴隶制遗产遗留项目”在土地记录、遗嘱清单的保存和使用中,应用了档案学在保障档案记录的真实性、完整性、安全性和可用性方面的优势[28];在奴隶制关系网络的数据转录、数据清洗、数据转换与数据可视化处理中,应用了信息科学中的技术方法,计算机科学的优势体现在数据库处理技术的应用中[29]。另一类为应用相关学科理论、技术与方法解决跨学科的综合性问题,尤其是将档案思维与计算思维相结合。如案例“利用档案和计算机工程方法开发框架检测和防止虚假视频”,以档案学的真实性、可靠性、准确性原理等来判定视频的虚假性;应用计算工程方法开发六种独特的检测假视频的测试,探讨将档案思维和计算思维融为一体的计算档案学方法[30]。

实践案例直观地反映了计算档案学跨学科应用的进展与创新,也说明了计算档案学跨学科协同合作不仅在档案领域发挥了重要作用,在相关学科领域也产生了较大影响,得到了学界与业界的认同。大数据时代,跨学科的计算档案学实践项目将会不断推广,以促进计算档案学相关理论、技术与方法的融合,助力计算档案学的发展;而计算档案学研究的不断深入,反过来又能促进相关实践项目的开展。正是在这种双向互动中,计算档案学焕发出无尽的生命力。

猜你喜欢

信息科学档案学跨学科
跨学科视野下的音乐表演体系研究
跨学科教学在高中生物课堂教学中的应用实践
应用型高校推进跨学科人才培养的路径探索
跨学科前沿研究生课程的教学改革探索
高中数学课堂中的变式教学
二本高校的信息科学本科生培养现状分析
二本高校信息科学本科生培养模式与评价制度研究
档案学学科入门指导课程专题设计探讨
信息科学的历史、现状与未来闫学
中国档案学研究