计算档案学课程建设及思考
2022-02-22詹其港
詹其港
摘 要:计算档案学是近年来在国外兴起的一项跨学科研究,随着计算档案学研究的兴起,如何将计算机领域的计算思维融入档案学教育框架中引起了国外相关学者的广泛关注。本文从课程建设基本理念、教学内容、授课方式、技能要求四个方面分析了马里兰大学计算档案学课程开设的特点,并据此提出我国档案学高等教育改革可参考借鉴的经验,即立足需求优化课程体系、改革考核体系、加强合作建设学术共同体。
关键词:计算档案学;档案学教育;教育改革
Abstract: Computational archival science is an interdisciplinary research rising abroad in recent years. With the rise of computational archival science, how to integrate the Computational Thinking in the field of computer into the framework of archival education has attracted extensive attention of foreign scholars. This paper analyzes the characteristics of the University of Maryland's computational archival course from four aspects: the basic concept of curriculum construction, teaching content, teaching methods and skills requirements, and puts forward some experiences for reference in the reform of archival higher education in China, that is, optimizing the curriculum system based on needs, reforming the assessment system and strengthening cooperation to build an academic community.
Keywords: Computational archival science; Archival education; Educational reform
自2014年起,“大数据”“数字经济”“数字中国”等词先后首次被写入《政府工作报告》,2021年《政府工作报告》进一步指出:“加快数字社会建设步伐,提高数字政府建设水平,营造良好数字生态,建设数字中国。”[1]这意味着以大数据、云计算、人工智能、物联网、区块链等为代表的新一代信息技术及其应用即将铺陈开来。在新技术环境下,档案事业正从“纸与铁”的时代加速迈入“数与网”的互联网时代,[2]档案管理对象及其空间也正从“模拟态”“数字态”向“数据态”转变。[3]新一代信息技术的应用改变了档案的原有性质,重塑了信息的创造、记录、获取、编码、管理、共享以及利用的方式,缺乏相关技术背景的档案工作者越来越难以管理新的形态的档案。将计算方法和资源应用于大规模记录和档案的处理、分析、长期保存与利用则相对容易,这些计算方法提供了许多传统方法所不具备的优势,例如,Weijia等人发现依托数据科学领域的信息可视化技术,能够改变档案的保存过程;应用视觉分析技术可将档案从二维层次转化为多维图形表示,从而支持人类和机器分析的交互性集成。[4]Lemieux在使用视觉分析作为新的智能发现辅助工具的基础上,通过推进本体可视化视觉分析的应用,研究记录的性质和档案的来源。[5]
本文在调查国外计算档案学课程建设情况的基础上,选取理论与实践成果皆更为丰硕的马里兰大学信息学院作为研究目标,通过梳理马里兰大学计算档案学课程建设基本理念、教学内容、授课方式以及技能要求,分析计算档案学课程开设的特点,以期通过学习借鉴马里兰大学的经验,提出对我国档案学高等教育改革的启示与建议。
1 计算档案学提出及课程建设概况
1.1 计算档案学的提出。马里兰大学信息学院的Richard Marciano教授召集了一些掌握计算方法并具有档案工作经历的研究人员,成立多学科小组,初步提出计算档案学这一新的概念,希望能够将计算思维与方法融入档案工作中。[6]2016年4月26日—28日,马里兰大学信息学院的数字策展创新中心(DCIC)与伦敦国王学院合作召开主题为“寻找新知识:大数据时代的档案记录”的研讨会。来自英国、加拿大、南非和美国的52名与会者参加了研讨会。与会者包括研究人员、学生以及来自联邦机构、文化机构和财团的代表。这组专家聚集在马里兰大学信息学院,试图界定计算档案科学,并最终宣布计算档案学(CAS)的诞生。[7]
2018年CAS研讨会上,马里兰大学数字策展创新中心计算档案学会将计算档案学定义为:“计算档案学是一个跨学科的研究领域,涉及将计算方法和资源应用于大规模档案处理、分析、存储、长期保存和访问,旨在提高效率、生产力和精确度,以支持评估、安排和描述、保存和访问决策。”[8]
1.2 计算档案学课程建设情况。2018年12月,第三届计算档案科学(CAS)研讨会,提出“将计算思维引入档案学科教育”。次年4月,在马里兰大学举办的“图书馆学和档案学教育计算框架”研讨会上,提出“制定图书馆学和档案学教育计算框架”,目的是创建计算档案学硕士课程教育基块,以教育下一代图书馆员与档案管理员对馆藏的计算处理。此次研讨会确定了50多个和计算思维与实践相关的图书馆学与档案学课程专题,包括数据的逻輯组织结构和物理组织结构、档案数据和记录的参考、创建、接收、评估、选择和访问等,并将这些专题映射到美国档案学会档案学研究生课程指南,其中大多数主题已列入现有课程。这些主题可以作为开发具有相应学习目标的专门单元或模块的起点,用于前景化集合计算处理的课程。
与此同时,美国档案学会数字档案专家课程和认证机构、马里兰大学、西蒙斯大学、加州大学洛杉矶分校、伊利诺伊大学、密歇根大学、北卡罗来纳大学、得克萨斯大学八所在档案和数字管理方面具有优势的学校或机构已经投入到计算档案学课程建设中,并致力于确定可能使用计算方法或适合引入计算单元的课程,将这些课程与数字档案管理周期联系起来,以突出计算档案学的实践特性。截至2019年4月,八所学校或机构均已开设计算档案学相关课程,其中北卡罗来纳大学教堂山信息和图书馆科学学院开设相关课程高达37门,位列八所学校或机构之首;密歇根大学信息学院开设相关课程最少,仅有9门,其他学校开设相关课程数量在23门左右。电子文件管理基础、数字思维、元数据入门、电子文件鉴定、数字策展、电子文件管理与著录、数据库档案收藏管理系统中的隐私和保密、数字管理规划和可持续性等课程八所学校或机构皆有开设。
2 马里兰大学计算档案学课程建设内涵
2.1 基本理念。没有计算机科学的档案科学缺乏理解和有效管理数字记录所需的知识,而没有档案科学的计算机科学也缺乏产生持久和值得信赖的记忆与证据所需的知识。因此,需要将这两个学科结合到CAS中。
Marciano认为,CAS的进一步发展需要跨学科的ischool的发展以及来自计算机科学、档案科学和数据科学等教育背景的教师共同配合,将这些不同学科的理论、原则与方法注入课程,协同发展教学大纲和团队教学。在这种环境中创建和使用档案,将需要广泛的实践经验,并积极与网络基础设施合作,以更好地实现档案职能,做好档案工作。[9]
2.2 教学内容。通过浏览马里兰大学帕克分校的主页,确定马里兰大学帕克分校ischool MLIS课程中与数字管理相关的课程数量共计20门,每门课程的学分为3学分或4学分,学时在15周左右。对这20门课程进行梳理后,将其映射到档案管理生命周期,依据课程内容可将这些课程划分为14个知识单元:记录与档案的性质、鉴定与获取、整理与描述、保存、参考与存取、外联与宣传、管理与行政、记录与信息管理、数字记录与存取系统、档案史与档案职业、记录与文化记忆、伦理与价值观、社会和文化体系、法律与金融体系。
此外,Marciano教授成立了一个20余人的硕士研究小组,依托特色档案收藏资源:社区流离失所、种族区划、人员流动、公民拘留等记录,开展CAS案例研究,并从案例研究中构建CAS的主题,以创建新的课程,拓展新的合作模式和跨学科的工作,包括8个方面的主题:①进化原型和计算语言学。进化原型设计包括创建一个支持并执行特定任务的软件原型,基于用户需求,评估、修改原型的用户界面、功能、性能等并迭代改进。计算语言学是指将计算方法应用于语言学家关于自然语言的理论,构建基于规则的自然语言统计与计算模型。关于教育程序设计,案例研究负责人指出未来的档案工作者需要的一些新知识,例如语法解析、信息提取、机器学习和主题建模知识。②图形分析、数字人文和档案表达。图形分析理论及其在非关系型(NOSQL)图形数据库中的表现形式,正在成为查询和表示复杂的、相互连接的大型文化数据集的强大模型。随着越来越多的用户习惯并使用图形分析,档案表达出现了更多新的可能性。“CAS的学生应该学习图论、图数据库和图幸分析,掌握如何应用这些潜在的理论和技术来代表档案和它们的创建背景。”[10]③计算查找辅助工具。大型集合和元数据的分析过程需要计算方法与交互式视觉分析,计算查找辅助工具能够帮助人们在大型数据集合中抓取重要信息。Marciano在这一案例研究中指出应该教授学生大数据基础设施的体系结构(如10亿级的文件存储库)、使用现有的工具以及如何学习新的工具。④数字策展。数字策展是以各种不同的方式管理数字对象和信息。这种数字策展不仅在传统的与信息管理有关的领域,如图书馆、档案和其他记忆机构中可以发挥重要作用,科学界、政府以及大学等也已经认识到科学数据的价值。“档案专业的学生需要在建立和管理科学数据档案方面接受培训和经验。”[11]⑤公众参与档案内容。一些社会组织、文化机构利用网络媒体,通过众包的形式参与档案工作,包括转录、编目、内容评论、复杂信息的参与式创建、转发等,以丰富、开放档案信息。⑥真实性与可靠性。长期保存真实数字记录的工作表明,面对海量数据的生成与管理需要,档案学的理论和原则仍具有价值。因此,Marciano认为CAS必须牢牢扎根于这些理论与原则,将其扩展并应用于文件创建和保存工作。马里兰大学信息管理学院要求MLIS的学生必须充分了解文件创建和保存方法的技术特征,如数字签名、哈希函数和区块链,并接受软件安全方面的培训,以具备保护档案完整性所需的知识和能力。⑦档案理论与计算方法的融合:网络基础结构与记录连续体。网络基础设施是计算设施、软件、服务和人力资源的组合,可以在其中构建不同配置的系统,以解决不同的功能。通過利用网络基础设施,Esteva、Sweat设计和实现了一个自动记录系统,能够无缝地收集、管理、归档和发布在开放的超级计算机中生成的数据。[12]马里兰大学信息学院希望通过培训学生在网络基础设施中创造服务所需的技术和管理技能,并将档案科学中的理论与方法嵌入这些技能,以帮助学生在未来更好地适应实践需要。⑧空间与时间分析。电子记录具有空间和时间特征,允许独特类型的分析和链接,而在档案记录中揭示这些属性能够提供新的理解和访问模式。基于此,Marciano认为教授学生管理时间和地理空间数据能够让他们在管理电子文件时更具潜力,掌握时间和空间关系的处理能够为数字策展和档案开发创造基础。
2.3 教学方式。首先,提倡项目教学法。马里兰大学信息学院会在教学中添加更多的实践元素,教师对课程某个案例提出若干个项目任务,然后由学生组成研究小组对项目任务进行项目分析和目标讨论。学院与工业界、社区、图书馆、档案馆、博物馆以及政府等展开合作,鼓励学生参与到工作中去并为其提供评估以及决策服务。此外,学院每年还会筹办iconsultancy体验学习计划,由专业的教师带领学生设计并完成校外实践项目,项目包括用户体验、数据可视化、数据库和技术开发、信息管理与流程管理等,一个项目的时间为三个月至八个月。
其次,采用交互式教学方式,除了常见的教师直接教授知识以外,更多的是通过课堂讨论、辩论、小组或个人展示以及专题研讨会的形式组织教学。
最后,提供在线系统辅助教学,马里兰大学信息学院大多数课程尤其是网络平台在线课程使用Canvas、ELMS和Sakai三种学习管理系统,学生可在系统上自行下载教师课前发布的阅读材料、讲座视频等教学资源和完成课堂任务。除此之外,马里兰大学信息学院作为ischool联盟的成员之一,已参加WISE(Web-based Information Science Education)计划,学生可通过网络远程学习其他成员高校的信息领域的相关课程。
2.4 技能要求。马里兰大学MLIS教育者对学生的专业技能培养方面提出了一系列的要求,在融入了计算思维的档案学教育中,着重培养学生的七项核心能力。一是了解电子文件的性质,包括各种存储介质的功能,系统依赖的性质,以及随着时间的推移对记录完整性的影响;二是明白数字档案管理者的角色定位、责任并掌握与受众沟通的能力;三是制定评估、描述、管理、组织和保存数字档案的策略;四是在现有功能范围内集成技术、工具、软件和媒体,以评估、捕获、保存信息和提供对数字集合的访问;五是计划整合新工具和连续几代新兴技术、软件和媒体;六是搜寻、组织档案的所有者并与之建立沟通,以访问数字档案副本;七是通过网络向指定社区提供可靠的信息组织和服务。
3 马里兰大学计算档案学课程教学特点
3.1 计算思维与档案学知识单元的高度融合。在马里兰大学的计算档案学课程体系中,已深度融合计算思维,包括数字材料的鉴定与获取、整理与著录等方面。利用语言分析和计算方法从档案中提取、创建描述性元数据,能够更准确地进行档案分类、管理数字文本记录等。
3.2 计算思维与档案管理实践的广度融合。在理论层面,基于WeIntrop等人确定的科学和数学教育中的四类计算思维实践(数据实践、建模与仿真实践、计算问题解决实践、系统思维实践)中共计22项实践活动。马里兰大学信息学院教授Underwood从具体的计算思维中寻获与档案管理的连接点,提出与计算档案学密切相关的9项计算思维实践活动,包括数据实践4项、建模与仿真实践2项、计算问题解决实践3项。
在实践层面,由教授组建研究生课题小组参与到具体的项目实践中是马里兰大学计算档案学教学实践的一大特色,比较鲜明的例子是Marciano带领五支学生团队参与到二战时期日裔美国人监禁营地记录的计算处理,并通过计算思维框架(CTF)来描述和重构数字档案管理实践的价值。[13]
3.3 计算思维与档案学科研究的深度融合。来自校外实践部门且拥有丰富档案工作经验的人员以兼职教师的身份参与课程教育,避免了学生理论与实践脱节的情况。此外,Marciano等马里兰大学信息学院的教师与马里兰大学 DCIC开展合作,[14]正在通过跨学科研究主题测试计算档案学的要素,利用难民叙事、社区流离失所、种族区划、人员流动、公民拘留和数字管理的网络基础设施等档案收藏项目,帮助学生获得新的数字技能,进行跨学科研究,并在档案、大数据分析的交叉点探索专业发展机会。
4 马里兰大学计算档案学课程教育对我国的启示
4.1 坚持需求引导,优化课程体系。首先,坚持以人为本,明确学生的培养方向以及课程定位。2010年1月,国务院学位委员会审议通过了图书情报硕士等硕士专业学位设置方案,决定在我国设置图书情报硕士专业学位。[15]同年10月,国家图书馆与武汉大学签订战略合作协议,将合作培养图书情报硕士专业研究生。
截至2020年,国内共有48所院校招收图书情报专业性硕士研究生,且数量占比逐年增加。虽有部分高校已经认识到档案专业应用能力对于学生未来成长的重要影响,有针对性地设置了轻理论重实践的专业课程,但总体来看,国内的研究生课程体系建设的价值导向多偏重于学术研究,且对学生的内在需求把控较弱,尤其体现在对以就业为导向的研究生群体的课程定位模糊情况。[16]
针对国内课程体系建设的难点,笔者认为可以借鉴马里兰大学计算档案学课程体系建设的经验,坚持以培养面向工作的档案工作者的培养理念为主,增加实践实操课程,为目标多元的不同的学生群体提供更加灵活和多样的课程选择,因材施教,实现个性化培养。
其次,结合社会需求,以职业为导向培养高层次、复合型档案专业人才。我国《档案学专业高等教育发展情况调查报告》[17]指出,企业虽为档案学硕士研究生主要就业机构,但对档案学研究生满意度不高的现状,要求必须重新调整当前档案学研究生教育目标。另外,档案馆(局)、企业等对于档案专业人才亦做出新的要求,如国家档案局中央档案馆招聘具有计算机知识背景的档案专业人员从事档案数字化、电子文件管理等工作,企业在招聘档案管理人员时,还看重应聘者的计算机应用能力,比如档案管理信息系统的设计与使用等。[18]因此,档案学课程体系的优化需要以职业为导向,在强调档案学基础理论、原则与方法的基础上,重视学生的信息分析、数据挖掘能力,适当增加人工智能、大数据、机器学习、神经网络等前沿课程。
4.2 立足特色资源,改革考核体系。在课程设置方面,我国档案学课程多为课程性质或内容相似的共性课程,[19]在特色档案信息资源专题课程设置方面有所欠缺。马里兰大学依托特色档案收藏资源开展CAS案例研究,利用特色档案收藏资源和数字管理的网络基础设施等独特的档案收藏项目帮助学生获得新的数字技能。与此同时,学生可在实践中探索模块化的、可重复利用的解决方案。国内高校可借鉴其经验,如增设专题档案资源选修课程供学生选择,以适应未来的档案工作需要。
此外,国内高校期末考核方式以考查为主,主要形式为提交课程论文,实习实践成果所占比例则相对较小甚至不能作为评奖评优的参考材料。但一篇课程论文很难真实体现学生的综合能力,因此应优化课程考核体系,建立多项目考核机制,科学合理分配考核项目比重。马里兰大学会通过学生未来的职业取向选择不同的考核方式:继续进行学术研究的学生可选择提交学术论文参与,准备从事業务工作的学生可通过提交证明自己学习能力与职业能力的材料,经过综合考评后毕业。[20]
4.3 加强多元合作,共建学术共同体。马里兰大学信息学院虽是计算档案学的发源地,但这一新的跨学科研究的提出却是马里兰大学信息学院与伦敦国王学院以及来自英国、加拿大、南非和美国等研究人员、财团、政府共同合作的结果。计算档案学的发展也离不开AERI(Archival Education and Research Institute)各成员院校的共同努力。相比于国内的档案机构,国外档案机构更加注重多元化合作,尤其在计算档案学领域研究上,合作对象涉及政府机构、研究人员、学生、企业等,合作领域包括计算机科学、信息科学、社会学等,合作方式也不拘一格。
我国的档案学高等教育也须加强多元主体合作,加强档案学学术共同体建设,在这其中包含两方面的含义:一是强化高校与档案馆、企业、社区、政府等主体的交流与跨界合作,广开思路、多措并举,有计划、有目的地联合各个主体,共同开展最佳档案研究和实践。二是着力推进档案学学术共同体建设,通过联系国内的档案学教学主体,共建网络课程平台,联手打造计算档案学精品课程。同时依托学术共同体的影响力,积极参加计算档案学国际会议,邀请专家开展专题讲座和技能培训,引进成功案例进行分析,共同规划计算档案学课程体系的建设。
参考文献:
[1]中国政府网.政府工作报告(文字实录)——2020年3月5日在第十三届全国人民代表大会第二次会议上[EB/OL][2021-03-13].http://www.gov.cn/premier/2021-03/12/content_5592671.htm.
[2]李明华.着力提升服务能力深化“三个体系”建设大力推进新形势下档案馆工作——在全国档案馆工作会议上的讲话[J].中国档案,2016(11):14-21.
[3]钱毅.技术变迁环境下档案对象管理空间演化初探[J].档案学通讯,2018(02):10-14.
[4]Xu,Weijia,Esteva,et al.Interactive visualization for curatorial analysis of large digital collection[J].Information Visualization,2014,13(02)
[5]Lemieux V.Using information visualization and visual analytics to achieve a more sustainable future for Archives:A survey and critical analysis of some developments[J].Comma,2012,2012(02)
[6]Esteva M.Modeling archival problems in Computational Archival Science (CAS)[EB/OL][2021-02-21].https://saaers.wordpress.com/2017/05/.
[7]Marciano R.Building a“Computational Archival Science” Community[EB/OL][2021-02-21]. https://saaers.wordpress.com.
[8]University of MaryLand.Computational Archival Science(CAS)Portal[EB/OL][2021-02-21].https://dcicblog.umd.edu/cas/.
[9][10][11][12]Marciano R,Lemieux V,Hedges M,et al.Re-Envisioning the MLS:Perspectives on the Future of Library and Information Science Education[M].Publishedonline2018:179-199.
[13]Esteva M,Sweat S,McLay R,et al.Data Curation with a Focus on Reuse[P].Joint Conference on Digital Libraries,2016.
[14]Marciano R.Reframing Digital Curation Practices through a Computational Thinking Framework [EB/OL][2021-02-21].https://ischool.umd.edu/news/dr-marciano-dcic-and-students-aim-modernize-archival-education-computational-thinking.
[15]中华人民共和国教育部.学位与研究生教育重点改革工作深入推进[EB/OL][2021-04-04].http://www.moe.gov.cn/jyb_sjzl/s3165/201101/t20110117_114565.html.
[16]王文龙,梁恩平.国内外档案学科研究生课程体系建设比较研究[J].山西档案,2019(06):149-154.
[17]冯惠玲,张斌,桑域毓,等.档案学专业高等教育发展情况调查报告[A].中国档案学会.创新:档案与文化强国建设——2014年档案事业发展研究报告集[C].中国档案学会:中国档案学会,2014:18.
[18]丁敬达,王浩瀛,肖开原,等.基于招聘需求的档案学专业教育发展策略研究[J].档案学通讯,2019(02):99-104.
[19]李海涛,吴嘉雯,王小兰.中美iSchool院校档案学硕士研究生课程设置对比分析[J].档案学通讯,2019(02):82-87.
[20]肖秋会,许晓彤.AERI成员高校的档案学研究生教育现状与特色[J].档案与建设,2019(12):37-40,8.
(作者單位:上海大学图书情报档案系 来稿日期:2021-08-30)