北京大学图书馆学位论文系统建设的新探索
2015-12-02张轶雯韦成府崔海媛
□张轶雯 韦成府 崔海媛
北京大学图书馆学位论文系统建设的新探索
□张轶雯 韦成府 崔海媛
以读者需求作为根本导向一直是北京大学图书馆的技术发展路线,该文介绍了始于2001年的学位论文数字化建设:包括2600多篇燕京大学论文,3万多篇2000年以来的北京大学硕士、博士研究生学位论文全文,旨在从学位论文发布流程、知识产权保护、传统借阅和开放获取服务、用户统一管理、结合OPAC技术等方面阐述北京大学图书馆学位论文系统建设的新探索,以期为国内外同行提供借鉴。
学位论文 学位论文系统 知识产权保护 开放获取 创新服务 高校图书馆
随着网络技术的发展,互联网已经成为人们获取知识和交流信息的重要渠道。学位论文电子版的使用与保存比印刷版更方便、更快捷。本文对中国大陆高校学位论文工作的现状进行了分析,并以北京大学图书馆为例阐述了学位论文的工作流程,以及学位论文系统建设的新探索。
1 高校图书馆学位论文系统建设的现状分析
2000年以来,高校图书馆相继开始通过互联网提交电子版学位论文,并建设了学位论文全文数据库。经过十几年的发展,学位论文初期工作中出现的一些问题基本上都得到了解决,并逐渐规范、趋于成熟。但是随着信息技术的不断发展,学位论文工作中又出现了一些新问题,主要体现在以下几个方面:
1.1 电子版学位论文的上传格式问题
2003年,CALIS对全国高校图书馆的学位论文工作进行了调查,调查显示,图书馆要求学位论文电子版提交的格式有4种:DOC、PDF、WPS和LATEX[1]。随着个人电脑的普及和计算机技术突飞猛进的发展,越来越多的人开始使用Microsoft Office的文件编辑器,随着Microsoft Office的不断升级,DOCX格式文件成了新的主流的电子学位论文提交格式之一。同时,越来越多的人注重自己的版权而选择pdf作为提交电子版学位论文的格式,PDF生成的版本频繁升级,也产生了新的文件格式。因此,学位论文系统应及时支持新文件格式的提交,并解决加密、发布等相关问题,确保学位论文工作能够顺利进行。
1.2 学位论文的版权问题
在这个信息大爆炸的时代,互联网拉近了人与人之间的距离,成为了人们获取各种信息的主要来源,由此信息似乎变得十分“廉价”。随着时代的发展,版权意识开始逐渐进入到社会的方方面面。学位论文作为高校独一无二的重要学术资源之一,特别是民国时期的手稿,如燕京大学学位论文,则更加珍贵。因此,如何获取学位论文全文,为教学科研所用,同时又保护学位论文的版权,成了学位论文建设的重点之一。
1.3 开放获取问题
随着互联网在各个领域的发展壮大,已经成为了一个重要发展方向,越来越多的实验数据、灰色文献等非正式出版的学术资源在网上公开。学位论文作为高校图书馆的重要资源,具有较高学术性和传承性,利用网络技术和计算机技术,及时、全面地揭示学位论文的学术价值和贡献,实现开放获取,成为必然。涉及到保密和版权等问题,学位论文的全文获取仍然是比较难以突破的瓶颈,实现学位论文的开放获取成为高校图书馆今后的奋斗目标。
2 北京大学图书馆学位论文系统的现状
2.1 北京大学学位论文系统的工作流程
北京大学图书馆对学位论文电子版的收集工作已经开展了十几年了,平均每年学位论文的提交量为3200篇左右,并持续增长。由最初的软盘收集、光盘存储方式变为通过学位论文提交系统收集,按年进行归档,以服务器备份的方式进行学位论文收集和长期保存。目前的具体工作流程如图1所示。毕业生首先登录北京大学图书馆学位论文提交系统进行在线的元数据录入和电子版学位论文的提交,提交后由图书馆的审核老师对提交内容进行审核,接下来收缴纸本论文,进行编目,然后开展全文数字加工和发布工作。上述工作完成后,还需将发布平台的数据转换为marc导入本馆的OPAC系统中,提供检索服务。最后,每年将学位论文进行备份归档、长期保存。
图1 北京大学学位论文提交至保存的工作流程图
2.2 北京大学学位论文库的知识产权保护
北京大学图书馆通过系统的数字版权保护(Digital Rights Management,DRM)技术和政策两个方面来对学位论文进行版权保护。对于纸质版学位论文采取了“到馆阅读、部分复制”的版权维护方式;对电子版学位论文采取了“论文加密、校内全文、校外部分”的版权维护方式:用户在校园网IP范围内访问“北京大学学位论文库”获取全文,不在范围内的则可以阅读每篇论文的前16页。“北京大学学位论文库”将电子版学位论文转换为CEB格式后再发布,采用DRM随机密钥对数字内容进行加密,随机密钥由服务器保存和管理,客户端必须得到授权后才能使用数字内容,实现了对CEB格式文件的控制,包括展示权利(如显示、打印等)、传输权利(借阅)和使用权利(如摘录),防止数字内容的非法复制。在实践中发现,政策定制和技术手段相结合,不仅使学位论文资源得到了有效使用,同时也实现了版权保护。
2.3 北京大学学位论文库的开放获取
北京大学图书馆自2000年开始收集学位论文电子版,并建立了北京大学学位论文库,结合CALIS学位论文项目,对项目的参建馆开放了北京大学学位论文库的元数据,以及每篇论文的前16页内容,并提供馆际互借服务。但由于学位论文的原创性和独特性,学位论文全文库的建设是在共享资源的同时,对其进行了一定的版权保护,有限制地实现了开放获取,也为今后能够完全实现开放获取奠定了基础。
3 北京大学图书馆学位论文系统的创新服务
为给读者提供更加合理便捷的服务,在学位论文系统建设与服务过程中,北京大学图书馆通过技术与服务创新,不断改进学位论文服务。
3.1 学位论文电子版提交文件格式的扩展性
目前,本馆使用的是自主开发的方正Tasi系统。使用过程中,笔者发现系统对学位论文电子版文件的处理存在格式兼容问题。虽然DOCX格式的文件可以被转换为DOC格式,但是部分转换后的文件包含了一定的错误信息,导致在审核时不能通过,给学生顺利毕业带来了一定延误。同时在对转换后的文件进行加密时成功的几率也比较低。为了在最大程度上减少因提交文件格式而造成不能及时通过审核这一问题,升级后的提交系统中支持了DOCX格式和生成版本为1.4以上的PDF格式电子版学位论文的提交。为了保障电子版学位论文的及时发布,采取了“线下转换”这种折中方式,流程如图2所示。首先通过脚本获取待转换论文的信息,将结果保存至excel表中,包括论文的源路径、转换的目标路径、论文在数据库中的PaperID,然后在excel表中生成拷贝文件的bat脚本;第二步,执行第一步中的bat脚本,将服务器上的电子版学位论文拷贝到本地计算机,同时每一条数据都生成两个job文件(一个前16页job文件,一个全文job文件);第三步,在本地执行job文件来对电子版学位论文进行批量格式转换和前16页的生成工作;第四步,将格式转换后的全文和前16页文件复制到服务器相应的目录;第五步,更新转换成功的论文在数据库中的信息。
图2 线下转换流程
通过“线下转换”这一方式,及时将数据发布到学位论文全文库中,保障了相关工作的顺利进行,使读者用户能够尽快获得学位论文全文。
3.2 燕京大学学位论文的管理与服务
燕京大学是中国近代著名的教会大学之一,在1952年全国高等院系调整中并入北京大学。燕京大学的办学历史虽然不长,但是培养了大批精英人才,保存下了许多珍贵的学士和硕士论文,大部分为手稿,更不乏当代名家的手迹,具有很高的学术研究价值和收藏价值。北京大学图书馆于2010年将燕京大学学位论文作为特色资源划到特藏部,按其分类排架特点分配了馆藏号,对最初的编目卡片也给予了妥善整理和保管[2],并完成了大部分论文的编目和数字化,建立了燕京大学学位论文特色库。燕京大学学位论文采取方正DESI系统进行元数据编目及扫描后的加密,发布在方正Apabi数字资源平台上。作为珍贵特藏资源,燕京大学学位论文可在北京大学校园IP范围内阅读全文,若不在校园IP范围内则仅能查看元数据。
3.3 与OPAC系统、发现系统相整合
在学位论文数据库的建设初期,我们就考虑到将其与联机目录检索系统的数据整合,从而自主开发了marc数据转换工具,成功地将转换后的marc数据导入OPAC系统,并逐年增加。用户可以通过OPAC一站式检索,更方便地获取学位论文。下一代资源发现与获取系统已经得到我国高校图书馆的重视,北京大学图书馆作为中国大陆第一家使用Summon发现系统的高校图书馆,已经对本馆的多种资源进行了数据优化和整合,其中就包括多个自建的数字特藏和馆藏书目数据[3]。目前,用户可以通过“未名学术搜索”检索北京大学学位论文的元数据。近期,还尝试将燕京大学学位论文的数据与“未名学术搜索”整合。
3.4 统一用户管理与毕业离校系统
学位论文电子版的提交是毕业生在毕业前必须进行的环节。电子版学位论文在提交后必须经过审核并通过后才能毕业。以往毕业生离校,需要转单,即到学校多个部门现场办理手续,并盖章为证。由于受场地限制和其他方面的原因,往往离校手续的办理集中在最后一周,给图书馆学位论文的审核工作和学位论文提交系统都造成了较大压力。同时在毕业离校的整个期间,毕业数据不能及时共享,容易出现纰漏。为改变这种情况,毕业生离校由传统的转单方式变为使用毕业离校系统办理离校手续,在明确的流程指导下完成办理。在离校系统的建设过程中,图书馆提供了学位论文状态查询的相关接口,并与学校IAAA认证相结合,学生可通过校园卡账户登录离校系统,查询学位论文的审核情况。同时,图书馆也可在离校系统的后台查看全部毕业生的学位论文提交情况及审核状态,随时关注学位论文提交工作的进展,为毕业生提供方便、高效、一站式的离校服务,加强学校各相关部门的信息共享和工作配合,使毕业离校工作更为规范、有效和有序,促进学校管理质量和服务水平的提高。
3.5 建设机构知识库的尝试
随着开放获取的理念被越来越多的科研机构所认可,机构知识库作为开放获取的模式之一处于迅速发展之中。2011年, CALIS管理中心与北京大学图书馆联合开展的中国大陆高校图书馆机构知识库建设现状的调研结果显示,我国大陆高校的机构知识库建设在认识理念、政策支持、技术平台、标准规范等各方面都较为薄弱,需加速发展[4]。北京大学图书馆于2013年7月正式发布了“北京大学机构知识库(Beta版)”,其作为北京大学学术研究的基础设置,为北京大学教师、科研人员和学生的学术研究和学术交流提供系列服务,包括存档、管理、发布、检索和开放共享。学位论文作为具有较高参考价值的科研学术资源,应该在机构知识库中实现开放获取,我们已开始对学位论文的开放获取做准备。即在对各分馆进行调研和与学位论文工作相关部门讨论的基础上,使用北京大学机构知识库系统来收集、揭示本科学位论文。
4 总结
北京大学图书馆的学位论文数字化建设已经开展了十几年,形成了较为成熟的工作流程、数据规范和服务,取得了一些显著的成效,对于由于技术不断发展而产生的新问题也能够及时有效地解决,保障学位论文的利用。然而,学位论文系统仍存在一些值得改进的地方:1)学位论文数据的发布存在一定时间的滞后,不能及时地为教学科研提供服务,今后将在工作流程上不断改进;2)将北京大学学位论文库与移动阅读技术结合,让用户能够使用移动端在线阅读学位论文全文;3)鉴于学位论文涉及保密和版权等问题,现阶段完全开放各高校学位论文的时机还不够成熟,实现开放获取是今后努力的方向。
1 张学宏.论高校图书馆电子版学位论文的保存与管理工作——以北京大学图书馆为例[J].图书情报工作,2005, 49(5):113-115
2 张丽静.燕京大学学位论文的印本收藏与特色库建设[J].图书馆建设,2011(6):39-40,56
3 朱本军,聂华.对下一代图书馆界面的探索与实践[J].大学图书馆学报,2010(4):5-9
4 聂华,韦成府,崔海媛. CALIS机构知识库:建设与推广,反思与展望[J].中国图书馆学报,2013(2):46-52
The Innovation and Application of Peking University Library Dissertation System
Zhang Yiwen Wei Chengfu Cui Haiyuan
With reader’s demand as the first consideration, Peking University Library is committed to enhance user experience always. This paper firstly gives a brief introduction of the construction of digital dissertations collection from 2001, which includes Yenching University dissertations and the Peking University dissertations in full text. Secondly, it describes the past, present and the future dissertation work in details. Finally, it addresses the issues of intellectual property protection, traditional lending services, open access, and unified user management in the process of electronic dissertations publishing, with Hope to provide reference for domestic and foreign counterparts.
Dissertations; Dissertation System; Intellectual Property Protection; Open Access; Innovative services; University Library
北京大学图书馆,北京,100871
2014年7月11日
*通讯作者:张轶雯,ORCID:0000-0002-4633-4095,zhangyw@lib.pku.edu.cn。