APP下载

“数智”背景下高校图书馆特藏资源库的建设与利用

2023-04-22胡剑光

图书馆 2023年11期
关键词:特藏数智资源库

胡剑光 郭 姝 张 奎 辛 星

(北京航空航天大学图书馆 北京 100191)

资源和服务是决定图书馆竞争力的两大要素。在传统纸质文献时期,高校图书馆受限于采买经费不足,无法获取全学科文献资源,必须有所取舍。故在资源建设方面,多按本校的学科布局与发展规划进行筛选,形成各有偏重的局面。进入电子资源占主导的时期,高校的教学与科研越来越依赖于网络与数据库,高校图书馆的经费越来越多地投入到电子数据库的采买中。数据库资源的优点是海量且获取便捷,缺点是同质化现象严重。因此,构建个性鲜明的特藏资源,更好地利用特藏资源,应该成为高校图书馆的重要工作内容。

在数字与信息技术飞速发展的浪潮下,图书馆的信息资源优势被削弱,应将工作重心转向深度加工与利用资源,针对用户需求提供个性化的知识服务。技术“数智”推动着高校图书馆资源建设与知识服务的转型升级,要求高校图书馆不断拓展对数字技术的深度理解和应用实践。具体到特藏资源库上,“数智”主要体现在两个方面:一是特藏资源的数字化建设,二是特藏资源智能开发利用平台。数字化建设有助于特藏资源的长期保存,并在元数据层面重生。借助文本挖掘、数据关联、可视化和开放获取等技术,深度揭示特藏资源,开发智能管理平台,提高特藏资源库的利用率,使其成为高校图书馆独具特色的数字资源。

1 高校图书馆特藏资源的定义与类型

1.1 特藏资源定义的发展

1929 年科克伦将特藏定义为“专门搜集关于某一项事物之图书”[1],并指出其价值在于完备和稀有。1993 年周文骏将特藏定义为“为了收集、保存和利用某一形式文献、某一专题领域文献、某一地区文献、某一个人文献、珍贵文献、易损坏文献、某种特定价值文献等而建立起来的专门收藏”[1]。2001 年刘爱民定义特藏为“特别珍贵而需要采取独特保护措施的档案”[1]。2007 年张红扬区别出新、旧特藏,定义新特藏为“遵循收藏原则的完备且有一定影响的藏书和特色化的馆藏”[1]。2012 年王雨卉将特藏区分为特殊收藏和特色收藏,并将数字资源引入特藏范围[2]。2021 年韩松涛扩展特藏定义为“珍本特藏、学术特藏和文化特藏”[3]。2022 年王乐提出广义特藏和狭义特藏概念,将古籍排除在狭义特藏之外,指出广义特藏具有载体特殊、类型特殊、年代特殊、范围特殊、来源特殊、价值特殊和主题特殊等特征[4]。七种代表性的定义体现了特藏定义发展的不同阶段。总体上看,特藏资源的定义由狭义的、“稀缺、珍贵”的传统载体——书籍,向广义的、具有“独特性”的多种载体拓展。这种发展体现了图书馆界应对新技术、新需求时的自我变革。综合分析各个时期国内外的观点可见,“稀缺性”和“独特性”是特藏资源的共同属性。特藏资源的定义还在随着时间和观念的发展而不断拓展。

1.2 高校图书馆特藏资源的定义

与公共图书馆不同,高校图书馆在资源建设上更注重对本校教学与科研的支持。教育部2015 年印发和施行的《普通高等学校图书馆规程》指出:“图书馆在文献信息资源建设中应统筹纸质资源、数字资源和其他载体资源;保持重要文献、特色资源的完整性与连续性;注重收藏本校以及与本校有关的各类型载体的教学、科研资料与成果;寻访和接受社会捐赠;形成具有本校特色的文献信息资源体系。”[5]可见,高校特藏资源建设要以本校特色为中心,以力求资源的完整性和连续性为目标。据此,高校图书馆特藏资源可定义为:与本校学科发展、教学培养、科研需求、校园文化高度相关的,反映其历史发展过程的,具有稀缺性、独特性、完整性、连续性的各种载体的集合。

1.3 特藏资源的类型发展

凡是具有独特性和稀缺性的资源类型都可以列入特藏,故特藏资源的类型多种多样。除传统纸质特藏外,还包括如照片、电影、建筑图纸、数字档案等[6]其他类型资源。随着数字化的深入,数据资源成为特藏资源的重要组成部分。数字化的重要工作是将传统的纸质、胶片等媒介转变成数字存储,并利用不断涌现的机器学习工具,充分挖掘出特藏资源的内在数字价值,通过开放获取等传播方式,将资源利用最大化。

2 高校图书馆特藏资源库的建设与利用

2.1 高校图书馆特藏资源库的建设

高校图书馆以服务本校的教学与科研为主,兼顾服务社会。因此,传统馆藏资源多偏重于学校的教学、科研、管理、文化等方面。在特色学科优势比较明显的高校,例如艺术类、考古类、外语类高校,会形成以学科为中心的资源聚集,如中央音乐学院的《马思聪专题乐谱专著全文库》[7]。另外一些行业特征明显的高校,如农林类、工程类、交通类、国防类、信息类高校,会保留学科与行业发展的文献资源,如中国海洋大学的《海洋文献数据库》[8]、东北农业大学的《大豆文献数据库》[7]等。还有一些高校,会保有一些具有独特地域性或特定历史时期的资料,如地方志、历史文件等,如上海交通大学的《地方历史文献数据库》[7]等。这些资源都可以成为高校图书馆特藏资源库建设的重要资源。梳理特定学科专业脉络,可以为高校人文素养教育提供资源,为数字人文建设提供数据,将此类特藏主题展览对公众开放,也能提升高校图书馆服务社会的能力。

高校图书馆特藏资源库建设的关键在于挖掘出具有稀缺性、独特性、完整性和连续性的资源。寻找符合本校特征的主题,组织完整、连续的相关资源,是高校特藏资源库建设的出发点。其次是数字化加工和数据管理平台开发,将传统的资源媒介转化成数字元数据,为更深层、更广阔、更灵活的资源利用提供基础。

2.1.1 特藏资源获取途径

特藏资源获取途径一般有四种:馆藏资源挖掘、院系资源收集、校友及社会捐赠、社会采购。

馆藏资源挖掘是四种途径中的基础。只有对已有的馆藏资源进行梳理后,才能规划特藏资源的数量、范围、主题,对归入特藏的资源进行甄别、入藏、深加工、再利用。

院系资源收集是高校特藏资源库建设所特有的途径。在高校的发展历程中,院系有独立的资料采买与保存系统。除了书籍、期刊资料外,高校的院系还积累了大量与教学、科研相关的非典型性文献资料,如:图纸、试卷、讲义、照片、学术报告、实验记录、项目说明等等。这些资源不在传统的图书馆资源建设范围内,却完全符合特藏资源独特、完整、连续的特征;而对于院系而言,它们既没有保存空间,又缺乏科学的保管方法,更没有精力去加以挖掘利用。将这些资源移交给图书馆,作为主题特藏,让其发挥出更大的价值,是院系与图书馆的双赢之路。

校友及社会捐赠既是高校特藏资源库建设的一种途径,又是高校特藏资源库的宣传方式,同时也密切了校友、师生情感联络。

社会采购途径主要用于补充既定系列主题中缺失的必要文献,使该系列主题资源具有完整性和连续性。

2.1.2 特藏资源组织模式

特藏资源的组织原则为:针对某一特定主题、特定历史时期、特定领域收集具有独特价值的资源[2]。主题与资源之间的匹配是高校图书馆特藏资源组织的核心部分。按组织流程可分为三种模式:第一种是按既定主题组织特藏资源,即确定主题—资源寻访—资源入藏与著录;第二种是由特藏系统重新著录的资源聚类形成新的主题,即资源入藏与著录—资源聚类—主题生成;第三种是主题与资源之间的双向匹配,是将上述两种组织模式同步进行。

在主题组织资源的模式中,确定特藏主题是前提。主题来源既可能是馆外需求,又可能是馆内自定。馆外需求多为学校统一部署的活动,如:校庆、学科建设、师生服务等主题。馆内自定则是图书馆从保护、挖掘、发展、利用的角度整理和扩大馆藏资源。前者类似命题作文,根据特定的需求,制定能满足需求的主题和框架,再匹配资料来源途径,筛选目标资源,入藏揭示。后者类似自拟题目,需要图书馆根据自身资源特点、学校发展历程、学科建设与规划、不同用户群体需求等确定主题。主题确定后,将馆藏资源或其他途径资源与主题内涵相匹配,根据相关度排序,越相关的越优先,组织特藏资源的入藏。这种模式便于高校图书馆运用已有的特色资源开展特藏工作,可以采取先入藏后揭示的工作流程,适合满足有限时间内、特定主题和特定需求的特藏资源建设与利用需求。

在资源形成主题的模式中,前提条件是建立适合特藏资源的数字化加工与管理平台。目前大部分国内高校图书馆的馆藏资源系统使用的是机读目录格式(MARC),对于资源类型多样的特藏资源,很难满足其多模态兼容性和内容深度揭示需求。特藏数字管理平台中,资源的著录与揭示是核心工作。无论是馆藏资源深入挖掘,还是校内校外收集与捐赠,或是社会采买,都需要将原有数据转移到新的特藏数字管理平台中,并增加新的著录内容。特藏数字管理平台应遵循统一的标准与规范,只有保证资源著录与揭示的标准化、规范化和有序化,才能利用机器学习技术揭示与聚类特藏资源。这种模式对特藏资源的挖掘整理更深入、更全面,有利于资源聚类形成创新性的主题。一些学术研究型图书馆已经开始尝试使用开源数据加工系统,或者开发自己的特藏数字管理平台,其效果还有待进一步验证。

主题与资源双向匹配的模式,是将以上两种模式同步进行,既围绕某些特定的主题与领域,组织各类能揭示主题的相关文献资源,同时又由特藏数字管理平台聚类形成新的主题,在主题与资源间,形成循环推进模式。这种资源组织模式具有灵活性、多样性、可持续性和创新性,在数据挖掘与搜索、数字人文建设方面体现尤为突出。随着数字化技术、AI 技术的发展和应用,这种特藏资源组织模式将成为高校图书馆资源建设的趋势。

2.1.3 特藏资源库的数字化建设

目前高校特藏资源库收集的大部分资源是传统纸本资源,包括手稿、照片、图纸、卡片等非印刷品。对这些资源的数字化加工是特藏数字资源库建设的难点。鉴于数字化设备的购买与维护成本高昂,大部分高校图书馆都采取委托专业数字化公司加工的方式。受经费与版权所限,特藏资源的数字化进度普遍缓慢。

特藏数字管理平台包括著录与揭示系统、多模态数据关联系统、检索与发布系统等。数字化加工产生了元数据,数字管理平台是对元数据的再加工与管理,使其成为用户可用的、智能化的模块。此类软件既有商业开发的平台,又有开源软件。商业软件的优点是成熟度高、技术支持强,缺点是购买成本高、数据版权维护不确定。开源软件没有购买成本,但几乎没有技术支持,需要图书馆提供自身的技术力量进行系统建设与维护。

数字特藏资源库的建设需要国家与高校加大投入力度,无论是资金还是技术,都是目前高校图书馆所急需的。

2.2 特藏资源库的利用

利用高校图书馆特藏资源库的前提是对特藏资源蕴含的价值进行甄别、挖掘,针对资源蕴含的不同层面的价值,选择适合展示其价值的利用方案。

2.2.1 特藏资源的双层价值

特藏资源的价值有两个层面,一层是内在价值,即特藏资源各类载体所携带的内容、数据、意义等价值,例如文献、图片、音像媒介等记载的内容。对资源内容的挖掘与利用,涉及所属专业学科知识,教学与认知方法,数据挖掘与利用技术等方面,是深层次的价值挖掘,高校图书馆应提高技术与人员的配备水平,才能更好完成。另一层是外赋价值,即特藏资源在其形成、使用、流转、保存、收藏的过程中获得的历史的、人文的情感与精神价值。例如文献所有者的印章、签名,学位论文致谢,捐赠留言等。外赋价值往往是特藏资源区别于一般资源的特有价值。对于此类价值的挖掘与利用,需要从人文、历史、心理、教育等角度进行,还原外赋价值产生时期的人文、社会背景,从科学发展观角度挖掘其积累的历史意义,以可视化手段加以展示,达到传播、传承、激励的精神目的。

2.2.2 特藏资源的利用方式[9]

高校图书馆特藏资源的利用一般有两种方式:一是传统的主题特藏展览,包括线上展览与线下展览;二是基于数字化基础上的特藏数字管理平台。两种方式各有利弊,第一种方式适合展现特藏资源的外赋价值。特藏主题展览通过视觉效果,释放特藏资源的外赋价值,让参观者感受到展品所蕴含的历史人文精神,引发预定共情。这种方式对于宣传学校和特藏资源都有很好的效果,但受空间局限和展览制作、维护、更换成本等问题的影响,主题展览无法完整、充分、高效地利用特藏资源的内在价值。第二种方式有利于深层次挖掘和利用特藏资源的内在价值。首先利用数字化技术将纸质载体内容转换成数字格式,实现数字存储。在此基础上,建设特藏数字管理平台,包括目录管理系统、内容揭示系统、检索与推广系统等等。借助数字技术与网络,可以实现特藏资源深度挖掘与分析,可视化、标准化的统一检索平台,资源开放共享接口,专业的、嵌入式的教学与科研数据服务等功能。借助特藏管理平台,可以将特藏资源的内在价值充分挖掘与利用起来。理想的高校图书馆特藏资源利用方式是两者兼有,优势互补,殊途同归。

3 高校图书馆特藏资源库的建设与利用案例

3.1 人大图书馆特藏的“人大文库”[10]

中国人民大学图书馆的“人大文库”创建于1987 年,是国内高校建立最早的文库。“人大文库”以人文社科类资源为主要特色,藏品以捐赠为主,主要收藏本校师生员工、校友的论著以及著名学者个人藏书等。此外,“人大文库”还收藏著名学者学术相关的非书资料,主要包括手稿、剪报、特色论文以及实物资料(如字画、照片、荣誉证书、奖杯奖牌等)等。“人大文库”囊括了几代师生在教学科研中创造的大批科研成果以及数十年研究生教育产生的学位论文。文库涵盖纸本资源和数字资源两类载体的内容,数据总量近12 万条,是中国人民大学学术发展史的重要体现。

文库资源主要来自以下四方面:一是面向全校师生、校友征集著作;二是重点走访说服知名学者及家属捐赠藏书;三是重新整理原有馆藏;四是院系资源纳入。“人大文库“在保护和建设特色资源库方面成绩斐然,其着重保护、挖掘、宣扬的是特藏资源的外赋价值。

3.2 浙大图书馆特藏的“浙大文库”

浙江大学图书馆的文化特藏——“浙大文库”有1 万余册普通图书,其中有一些是签名本和手稿,这部分体量很小的特藏库却成为了解浙大文科概况的必到参观点,其原因是该特藏库被赋予的“浙大文脉”概念。签名、书章、手稿等资料的内容价值正在降低,但其附带的各种历史信息价值却在增长,这一部分的价值就是外赋价值,更具人文精神传承意义。

“浙大文库”的校内合作单位有两个:一是校社科院,二是校友会。与这两个校内单位的合作,既丰富了资源建设来源,又扩大了特藏库的影响力,同时还加强了学校与学者、校友的联络,展示出图书馆的文化多样性。

浙江大学图书馆藏有大量古籍,同时又有考古学科的支持,在古籍的保护与恢复方面很有经验[11]。在资源数字化、资源系统共享方面,浙大图书馆积极倡导、搭建CADAL 项目共建和业务拓展,加强学术交流,为高校图书馆的数字联盟平台作出了巨大贡献。

3.3 北航图书馆特藏的“航空航天文献史料展”

北航图书馆的“航空航天文献史料展”是北京航空航天大学建校70 周年校庆系列活动之一,是上述以“主题决定资源”方式的典型应用案例。这类来自学校的主题要求,是高校图书馆普遍面临的需求。北航图书馆通过将图书馆的特色资源与该主题匹配,以主题展览的形式,既满足学校的主题宣传要求,又达到建设和利用本馆特藏资源库的目的。下文将着重介绍北航特藏展的经验以及过程中的一些思考。

3.3.1 北航特藏展主题资源

在此类案例中,关键是分析主题内涵和寻找匹配资源。高校的周年庆典活动,其主要目的有三:对外宣传,提高学校的知名度;对内介绍学校成长历程,唤起师生的自豪感;召唤校友,增强校友归属感。因此,各项活动必须以引起师生、校友、外界的情感共鸣为目的。通常,校庆展览活动的责任人是校史馆或档案馆,这些机构拥有比较全面的记载学校发展历程的史料,如建校历史文件、校长任命书、学校规划图等。图书馆的校庆展览,若想避免与之同质,就要突出图书馆的独特资源。特藏资源库是图书馆的特色所在,尤其是特藏资源的外赋价值,能反映学校发展历程与建设成果,最能引起校友、师生的共情。在本次展览中,图书馆特藏部准备了四个部分18 个系列的专题,其中,最能反映主题、体现特藏资源库外赋价值的四个系列如下:

带有八所高校印章的书籍。北航是新中国第一所航空专业高校,它是经过八所高校航空院系的两次合并创建起来的。八所高校的航空专业书籍随同合并的院系一同流转,最终归集到北航,形成北航图书馆的最初馆藏。这些书籍集合了大部分早期国内航空资料,其中不乏从国外带回来的珍贵书刊,其稀有性和独特性不容忽视,是北航图书馆特藏的首批入选资源。在此次展览中,图书馆从近2 万册书刊中,精心挑选出具有代表性的,印有八所高校印章的文献资料,用印章讲述历史,展示学校的初创历程,唤起校友与全校师生的共同缅怀。

《航空航天概论》课程系列教材。《航空航天概论》是一门从建校伊始延续至今的全校必选通识课,由北航教师自主编写。图书馆通过各种渠道收集到其所有版本的教材,形成一个系列。它的发展变迁既体现了北航的专业特色,又展现了北航教师团队的专业奋斗精神,同时还能引起各个时期校友的共同回忆。

中国第一架轻型旅客机“北京一号”组装图纸、手稿、影像与各种相关资料。1958 年,经过百天奋战,由北航师生自研自产的飞机“北京一号”首飞上天,是新中国航空史上开创性的第一次,凝聚了一种“自强不息、艰苦奋斗、空天报国”的北航精神,特别能激发师生、老校友的自豪感。为了保护和挖掘这部分资料,图书馆取得相关院系资料室的支持,将其移交图书馆特藏部统一保存。此次展览陈列了大幅组装图纸,同时播放专题纪录片,以影像资料营造氛围,更好地突出该主题,达到唤醒长者回忆,引发师生共情,激励年轻学者的效果。

学位论文。高校的首要任务是培养人才。学生培养效果的集中体现是学位论文。每一篇学位论文都是一个学生的奋斗成长史,既包含学术上的,又有个人经历上的。学位论文将学校、院系、老师、学生紧密连在一起,是最能唤起每一位校友情感的历史文献。这部分资源也是特藏资源的重要组成部分。保存本校学位论文是高校图书馆的重要职责,学位论文资源具有完整性和连贯性。此次展览展出了最早一批硕、博士的学位论文和具有代表性的校友学位论文,引起了参观者的广泛关注。

3.3.2 北航特藏展经验总结

上述专题统一整合在校庆的主题下,通过挖掘这些资料所承载的、超越时空限制的历史意义和人文精神,使其得以共享和传承下去,达到了此次特藏展览的预定目标。同时也要看到,特藏资源库的建设与挖掘工作既具有艰巨性又具有急迫性。在所有馆藏资源中寻找与主题吻合的资料,工作量之大,超乎想象,需要高校图书馆提前规划,布置人员、设备与系统。一些特藏资源因年代久远,保存环境不佳,导致残破不堪。可见,对特藏资源的保护迫在眉睫。对此,本案例提供的经验可供参考:

一是制定总体目标,组建高效团队,全馆动员,从上至下推动与支持特藏工作。

二是特藏馆员要熟悉馆藏资源目录,制定主题与资源的匹配方式与框架,确定资源类型、范围和获取方式[12]。

三是推进特藏资源保护制度和特藏资源数字化制度[13]。针对不同状态的特藏资源,进行分级处理,对残破特藏,要送专业机构修补,同时利用数字化手段[14],建立和完善数字存储。对缺失的资源,要及时进行采买补充。

四是重视特藏资源的可持续性利用,鼓励使用新技术、新思路充分开发特藏资源。例如:深化与院系的合作,将特藏资源库嵌入教学与科研中;运用数字人文理念,实践跨学科培养方案;保持与业界交流,学习、获取最新技术手段,将特藏资源的内在与外赋价值充分挖掘出来。

在此案例中,不足之处在于尚未实践特藏资源内在价值的数字挖掘与利用。

4 “数智”背景下,高校图书馆特藏资源库建设与利用的挑战与应对

数字化转型期,数字技术与人工智能技术的快速迭代,改变了高校图书馆用户的学习方式与科研需求,高校图书馆在知识服务领域面临极大挑战。高校图书馆在新时代普遍存在的问题是人员、技术与管理的瓶颈,难以适应数字技术变革带来的转型压力,导致高校图书馆在学科建设、教学与科研支持方面难以满足学校的建设发展需求。建立特有的资源库,挖掘独特的数据资源,可以避免同质化的问题;引进新技术、新理念,提高员工数字技能,可以改变被动落后的局面;利用人工智能技术挖掘特藏资源,建立特藏数字管理平台,嵌入教学与科研,响应用户需求,是高校图书馆服务创新的新方向。

数字技术运用是特藏资源库建设与利用的必要条件。目前可利用的开源系统,如ArchivesSpace、Omeka,Fedora、Samvera 等[15],可以节省开发成本与时间。有科研能力的高校图书馆可以与院系合作,自研自建数据挖掘系统,进行特藏资源内容揭示和数据关联,再以开放获取、在线分享等方便快捷的方式推介给用户,从教学、科研、人文、数据等不同角度满足用户需求,让特藏资源得到最大化利用。

高校图书馆特藏资源的建设与利用要与本校的专业特色、人文特色相契合,充分利用已有的馆藏、校内资源,以“用户需求”为引领,以数字技术为手段,以环境育人、服务育人为导向,将传统资源转化为数字资源,建立多学科特藏数据平台,深挖其内含的数据与人文价值[16],为高校教学与科研提供更优质、更先进的服务。

猜你喜欢

特藏数智资源库
“数智”视域中苏南蒲岸村微湿地公园公共设施情感化设计研究
路安炎:按下中国造纸业“数智转型”启动键
网安天下担使命数智引领向未来"双引擎"驱动现代警务创新人才培养(计信系摄影报道)
乡乡镇镇通5G”建设助力山西“数智”转型
健身气功开放课程资源库建设研究
数字环境下高校图书馆特藏资源建设探析
贵州●石斛种质资源库
高校图书馆特藏建设工作探微
高中历史信息化教育资源库应用探索
福建基础教育教学资源库建设研究——以福建基础教育网资源库为例