机构知识库相关政策研究
2015-04-02吴越聂华崔海媛
吴越+聂华+崔海媛
摘要 机构知识库作为机构智慧成果管理的重要部分,其建设正日益成为研究型图书馆的重要职责之一。机构知识库的建设不仅依靠技术平台的搭建,政策的制定也十分关键。机构知识库政策不仅为知识库的构建和发展提供重要的依据和宏观指导,也是知识库建设质量的重要保证。该文首先介绍全球机构知识库政策建设的现状与问题,然后通过调研当前国内外机构知识库政策的建设情况,充分利用调研结果,结合北京大学实际情况,为北京大学机构知识库政策的制定提出建议。
关键词 机构知识库 开放获取 OpenDOAR ROAR
为了更好地推动全球学术成果的快速传播和利用,国际科技界、学术界、出版界和信息传播界利用互联网自由传播的特性一并发起了全球开放获取运动(Open Access,简称OA)。开放获取知识库是随着开放获取运动的发展而兴起的一种新型学术传播方式,是开放获取运动的一个重要组成部分。随着开放获取运动在全球如火如荼地开展,机构知识库的数量从2006年的310个猛增到2013年的2401个,然而本应在机构知识库建设初期即完成的政策制定和发布却没有得到足够的重视。根据开放存取知识库目录(OpenDOAR)2013年9月的数据显示,2401个机构知识库中高达75%左右没有制定相关的开放获取政策。
本文调研国内外机构知识库政策,结合北京大学实际情况,提出北京大学机构知识库在内容、提交、使用、保存、撤回和隐私等6个方面的政策思考,以期对国内机构知识库的政策制定提供参考。
1 机构知识库政策制定现状
1.1 机构知识库政策的分类
机构知识库政策通常根据知识库的类型、职能、学科跨度及所服务的对象进行制定,尽管在具体内容上不尽相同,但体系基本一致,通常包含两类政策:知识产权类和操作类。知识产权类政策通常规范知识库的存储范围、版权、数据复用等,操作类则通常包括提交、撤回、保存等操作层面的政策。
若对政策再进行细分,EIFL-OA项目负责人Iryna Kuchma曾提出机构知识库的政策可具体分为五类:内容政策、提交政策、数据复用政策、保存政策和撤回政策。其中内容政策主要规范知识库的类型、存储的资料类型、主要使用的语言等;提交政策用于提交人的定义、提交内容的质量控制、版权声明等;数据复用政策主要规范如何对元数据和全文数据再利用;保存政策定义知识库对所存储的内容提供何种保存策略;撤回政策规范撤回的条件及流程。在开放存取知识库目录OpenDOAR中,则定义开放获取政策应包含元数据政策、数据政策、内容政策、提交政策和保存政策。其中在元数据政策和数据政策中,OpenDOAR认为不仅应涵盖元数据和数据的重用政策,还应规范机构知识库中存储的元数据和全文描述信息。
1.2 国外机构知识库政策的制定情况
根据OpenDOAR中提供的截止2013年9月的数据,2401个注册成功的机构知识库中,仅有13.6%的知识库制定了元数据复用政策,15.2%制定了数据复用政策,16.7%制定了内容政策,17.6%制定了提交政策,8.1%制定了保存政策。而根据开放存取仓储注册(ROAR)中提供的截止2013年9月的数据,2841个注册成功的机构知识库中,仅有14.4%在开放获取强制存档政策注册(ROAR-MAP)中登记并发布了政策信息。由以上两个著名开放获取知识库注册机构提供的数据可知,在全球范围内,机构知识库在建设过程中均没有对政策给予足够重视。
1.3 国内机构知识库政策制定情况
根据ROARMAP中提供的数据,在ROAR中成功注册的国内机构知识库有88个,但正式发布政策的仅6个,中国大陆仅中国科学院一家发布了政策。然而,中国科学院知识服务网格(irgrid)虽明确发布了中国科学院机构知识库开放获取政策,但涵盖的内容仍不够全面,仅限于内容、提交、传播授权许可三个方面,对于撤回、保存、隐私等方面没有制定相关的政策。根据OpenDOAR中政策发布情况更为细致的分类统计,国内机构知识库政策通常只关注了提交和内容两方面的政策,对于元数据重用、数据重用和保存等方面尚未制定任何政策。
在大陆高校范围内,机构知识库的政策建设更是处于起步阶段,政策的制定一直滞后于机构知识库平台和内容的建设。厦门大学和集美大学仅在机构知识库主页上发布了与版权相关的声明。而集美大学虽在其网站介绍中提及了与政策相关的内容,但并没有将其提炼成正式的政策。清华大学、北京工业大学、北京科技大学等校的机构知识库虽在政策建设方面进行了一定的研究和探索,但始终没有最终制定和发布其相关政策。
在港台地区,台湾的TAIR仅发布了与文献著作权相关的政策,对于其他方面并没有制定正式的政策。香港的HKIR中的8个大学机构知识库,除香港中文大学和浸会大学,其他6所均在网站中发布了开放获取政策,但涵盖的内容多集中于内容、提交和版权三个方面。只有香港科技大学通过使用OpenDOAR提供的政策工具(Policy Tools)详细制定了OpenDOAR所提倡的五个方面的政策。2北京大学机构知识库的开放获取政策
2013年7月8日,北京大学图书馆在发布北京大学机构知识库(Peking University InstitutionalRepository,简称PKU IR)时,同时发布了试行的开放获取政策,涉及知识库的定义以及内容、提交、使用、保存、撤回和隐私等六个方面的政策。
2.1 内容政策
内容是机构知识库的主体。内容收集的范围直接影响着一个机构知识库自身的定义。因此,在机构知识库中收录哪些类型的内容,必须进行通盘考虑。康奈尔大学的E-Commons@Cornell,麻省理工大学和剑桥大学的Despace@Cambridge均在政策文档中首先提及了内容政策,可见其重要性。在E-Commons@Cornell的内容政策中规范了知识库中存储内容的类型、格式、大小和所有权四个方面。Despace@Cambridge则在其内容政策中重点提出了对内容质量的要求。endprint
在PKU IR的内容政策中,主要规范了存储内容和存储需求两方面的内容。在存储内容中,规定PKU IR存储的作品必须全部或部分由北京大学全体教员、研究人员、职员或学生产生。同时,也举例说明了可以存储的内容类型包括:书籍、期刊论文、会议论文、学位论文、研究报告、数据集、学习对象、预印稿、技术报告、演讲介绍、工作文档、图片、录音记录、软件、视频等。在存储需求中,主要列明了PKU IR对所存储的内容的要求,以保证知识库中的内容具备科研价值,并可以供PKU IR进行长期保存和开放获取。
2.2 提交政策
提交政策定义机构知识库内容的收缴方式。Despace@Cambridge有单独的提交政策,定义了提交人、提交过程中的版权问题。而E-Commons@Cornell没有单独的提交政策,仅是将内容的收缴方式、提交者的定义、提交内容的质量以及版权问题归纳在其存储政策中。
机构知识库通常有三种提交方式。一种为分布式模式,完全由作者或资源提供者本人上传。第二种是半分布式,由机构内各单位指定专人负责上传本单位的智慧产出。第三种是集中式,由图书馆或机构内指定单位上传并管理本机构的研究成果。PKU IR当前还在建设初期,更多采用的是第三种集中式代理上传的方式,仅有少量内容采用第一种方式。因此,PKU IR吸收康奈尔大学和剑桥大学的实践,结合当前的提交方式定义了提交人可以为作者本人或作者授权的代理提交人(简称代理,如科研秘书、图书馆员、院系行政人员等)。
在这项政策中,同时还对存储作品的版权和出版商或资助方的作品禁锢期(embargo period)问题制定了相关条例。政策中声明了存储作品的版权由原作者持有,所有由第三方持有的版权也给予保留;在PKU IR存储作品的过程中,作者授予PKU IR如下权利:为了存档、保存和转移目的,对机构知识库中存储的作品进行复制和转化;对存储的作品进行再加工以使其可以在网上对公众开放;在所有出版商或资助方的作品禁锢期结束前,PKU IR将不会对所提交的内容提供公开访问获取。
2.3 使用政策
使用政策是针对元数据、全文文档及全文数据资料的复用所制定。中科院的irgrid在提交政策中要求提交者按创作共用协议(Creative Commons Li-cense,CC)的“署名一非商业性使用一禁止演绎”进行传播授权,并鼓励提交者按CC协议的“署名一非商业性使用一相同方式共享”进行传播授权_5]。Despaee@Cambridge针对全文数据和元数据分别设置了使用政策和元数据政策两项。PKU IR则在使用政策中不仅制定了授权许可书,还规范了他人在何种情况下可以以何种形式使用PKU IR中提供的元数据和全文数据,包括:1)任何人在未经允许的情况下都不得以营利目的使用PKU IR中存储的元数据和全文数据;2)当使用PKU IR中的元数据时,应提供原元数据记录的链接或OAI标示符;3)在使用全文数据时,用户必须给出作者、标题、详细书目信息、原元数据页面的超链接或URL,不能以任何形式修改原文内容。
2.4 保存政策
长期保存是机构知识库的重要使命,机构知识库更是知识资产长期保存的基础。E-Commons@Cornell在保存政策中明确提出了自己的长期保存策略。DSpaee@Cambridge和英国巴斯大学也制定了较为详细的保存政策。
PKU IR在这项政策中主要规范了保存年限、功能性保存、关闭政策;为了更好地存储内容,PKUIR还列明了推荐的文件格式;并承诺会采用目前最佳的方式对所有的文件进行定期备份和维护。
2.5 撤回政策
PKU IR作为开放获取机构知识库,希望对存储的资料提供长期持久的获取。然而,在特定的情况下,可能需要从PKU IR中移除资料。很多机构将撤回政策归并在了保存政策中。在E-Commons@Cornell的撤回政策中明确规范了当内容被撤回时,元数据记录的变化情况。在DSpace@Cam-bridge则明确列出了允许撤回的条件,当内容涉及经过验证的侵犯版权或抄袭、法律要求、国家安全、造假等四种情况之一时,将被撤回。而在PKUIR的该项政策中只规定了所有的撤回内容的原始条目记录将被保留,这些记录(包括所有的原始元数据)将继续向用户提供开放访问。
2.6 隐私政策
机构知识库中存储的内容及在内容收缴过程中收集到的信息,或多或少涉及提交者或使用者的个人信息,因此必须保证个人信息不被使用于商业、公益目的或透露给任何单位或个人。在OpenDOAR倡导的五类政策中没有涉及隐私政策。但是在E-Commons@Cornell和DSpace@Cambridge中均对隐私保护进行了相关规定。隐私政策的制定对OA政策具有补充作用,使得政策不仅对机构知识库的各项操作进行了规范,也对与机构知识库交互的提交者或使用者进行了保护,一定程度上会增加用户对机构知识库系统的信赖。因此,PKU IR通过学习借鉴这两家机构的隐私政策,也制定了自己的隐私政策,即在PKU IR的整个运行过程中,将遵照北京大学保密办公室的相关规定和北京大学相关政策中的互联网隐私保护部分对用户的隐私进行保护。
3 总结
根据调研结果,相较于OA机构知识库数量近年来的突飞猛涨,机构知识库的政策制定显得严重滞后。在建设OA机构知识库之初就关注政策的制定,有利于构建具有特色且符合实际需要的OA机构知识库。因为制定并发布系统而详尽的政策,不仅能够保证机构知识库发展的持续性和一致性,还可以使更多的人了解机构知识库,了解开放获取,从而扩大机构知识库的影响力,进而促进其长期稳定发展。
在北京大学机构知识库政策制定的过程中,充分利用了网络调研这种研究形式。通过对国内外已经建成的著名OA机构知识库的政策进行全面调研,学习和借鉴其优秀经验,找出了普遍共同重视的政策内容和各机构知识库独有的特色政策,然后立足本机构的实际情况和需求,制定符合本机构特色的OA政策,从而确保了所制定政策既有普适性又有本地化的特殊性。endprint