我国机构知识库内容建设问题与策略分析❋
2013-08-15万文娟
万文娟 吴 高
(广西师范大学图书馆 广西桂林 541004)
机构知识库是伴随着开放存取的发展而兴起的一种学术交流与资源共享的新模式,作为开放存取的重要“绿色通道”之一,已逐渐成为开放存取运动的主角。2003年2月,香港科技大学机构仓储的构建拉开了我国建设机构知识库的序幕。经过8年多的发展,我国机构知识库建设取得了一定的成绩。截止到2012年1月1日,OpenDOAR共收录2164个机构知识库,我国包括港澳台地区共91个机构知识库,机构知识库总量仅次于美国、英国、德国、日本,位居世界第五位〔1〕。然而,根据西班牙赛博计量学实验室2011年7月公布的《世界机构典藏系统排名》显示,在世界排名前1000位的机构知识库中,我国仅有39个机构知识库上榜〔2〕。《世界机构典藏系统排名》是以规模、可见度、内容丰富性、学术性为评价指标对机构知识库进行的综合排名,这四个指标均属于内容建设范畴,可见我国机构知识库内容建设形势不容乐观,整体水平较低。内容建设是机构知识库构建的重点与关键,内容的量与质已成为影响其可持续发展的最大障碍。本文着重对我国机构知识库内容建设现状进行调查研究,分析其存在的问题及成因,并提出相应对策,以期为我国机构知识库内容建设起到借鉴参考作用。
1 我国机构知识库内容建设问题分析
从整体上看,我国机构知识库内容建设有了一定程度的发展,已取得了一定的成绩,尤其是港台地区的机构知识库。但与国外发达国家机构知识库内容建设现状相比,我国机构知识库内容建设还处于一个起步发展阶段,内容的量与质有着很大的提升空间,目前主要存在以下五个问题。
1.1 资源数量匮乏
机构知识库资源数量的多少通常被作为衡量一个机构知识库成功与否的重要指标之一,对其使用价值影响重大。世界排名第一的美国国家航空航天局资助的天体物理数据系统(The SAO/NASA Astrophysics Data System,ADS)记录总数超过920万条〔3〕。美国机构知识库平均记录数为43760条,澳大利亚机构知识库平均记录数为31240条,西班牙机构知识库平均记录数为17728条,日本机构知识库平均记录数为14236条〔4〕。然而我国机构知识库资源数量总体十分匮乏,只有少数机构知识库的资源数量较大,台湾大学机构典藏是目前中国资源最为丰富的机构知识库,也只有181701条记录〔5〕。我国极少数机构知识库的资源总量超过2万条,并且几乎都是港台地区的机构知识库,大陆地区机构知识库的资源更为稀少,资源总量超过1万条的只有6个机构知识库,分别为中国西部环境与生态科学知识积累平台、厦门大学学术典藏库、中国科学院大连化学物理研究所机构仓储系统、中国科学院高能物理研究所机构知识仓储系统、中国科学院力学研究所机构知识库、中国科学院半导体研究所机构知识库。大多数机构知识库的记录总数不超过5000条,有的甚至还不到100条,如浙江大学机构知识库记录总数11条、上海交通大学机构仓储数据库记录总数90条。
1.2 资源类型单一
机构知识库资源应包括已经出版的资源,也包括尚未出版的灰色资源。据OpenDOAR统计,国外机构知识库收录的文献类型有12种,且包括许多尚未出版的资源,如多媒体视听资料、学习资料、数据库、软件、专利等〔6〕。在我国,学位论文库在高校机构知识库中占有一定的比重,如香港大学论文在线、国立中央大学图书馆硕博士学位论文系统等,学位论文库以学位论文为收录对象,形式和内容较为单一。虽然我国机构知识库大多数属于综合性机构知识库,收录资源类型种类较多,但收录尚未出版资源的比例很小,大多数是已经出版的文献,且以期刊论文、学位论文、会议论文、工作报告等为主,图片、视频等多媒体资源比较少,资源类型有待多元化。以中国科学院国家科学图书馆机构知识库为例,截止到2012年1月1日,其记录总量为3967条,其中期刊论文3065条、会议论文239条、研究报告225条、演示报告158条、其他280 条,所占比例分别为 77%、6%、6%、4%、7%〔7〕。
1.3 资源更新缓慢
机构知识库资源更新是否及时决定机构知识库资源数量能否持续积累。对于高校学位论文库而言,资源更新的数量与本校硕博士毕业生的数量密切相关。由于一般高校都明文规定毕业生只有同时提交学位论文纸质版和电子版后方可毕业,因此学位论文库资源更新相对稳定。但更新频率不高,更新时间主要集中在每年毕业时间前后。对于综合性机构知识库而言,资源更新则不同。由于大多数机构知识库对资源提交不做强制要求,资源更新毫无保障。经过调查发现,中国科学院科研院所机构知识库更新频率最高,尤其是中国科学院力学研究所机构知识库资源更新频率为1274.5条/月〔8〕。而高校其他综合性机构知识库资源更新十分缓慢,甚至毫无更新,以香港城市大学机构知识库为例,笔者分别于2012年1月1日和2012年2月20日浏览其主页,其记录总量都是3047条,毫无变化。
1.4 资源全文获取率较低
我国绝大多数机构知识库资源全文获取率较低,包括建设机构知识库较为成功的台湾地区,这大大制约了机构知识库学术交流与资源共享的实质功能。大多数台湾地区机构知识库主页都标明了资源的总笔数与全文笔数。笔者进入OpenDOAR收录的48个台湾地区机构知识库主页用全文笔数/总笔数计算全文获取率发现,全文获取率低于10%的机构知识库有两个,分别为东华大学机构典藏全文获取率4%、国立联合大学机构典藏系统全文获取率4.6%。此外,嘉义大学机构典藏全文获取率也仅为12.3%,16个机构知识库的全文获取率低于50%,仅14个机构知识库的全文获取率高于90%。台湾地区机构知识库资源的全文获取率尚且如此之低,我国其他机构知识库的全文获取率就可想而知了。
1.5 资源质量不高
如前文所述,根据《世界机构典藏系统排名》显示,目前在世界排名前1000位的机构知识库中,我国仅有39个机构知识库上榜,其中台湾地区33个,香港地区4个,大陆地区仅2个,分别为厦门大学学术典藏库排名第236位、中国科学院力学研究所机构知识库排名第883位。虽然我国台湾地区机构知识库内容建设水平较高,不仅资源数量多,而且质量高、影响力大,但我国大陆地区机构知识库资源质量整体水平很低,尤其是高校机构知识库资源的完整性、正确性、学术性、权威性、创新性等都有待于提高。
2 我国机构知识库内容建设问题成因分析
2.1 开放存取理念薄弱,自存储意愿不强
意识是实践的先导,开放存取理念在我国还尚未深入人心,无论宏观的国家层面、中观的机构层面以及微观的个人层面,对开放存取的认识都远远落后于国外。我国机构知识库建设缺乏社群参与的基础,尤其是一些拥有大量学术资源的科研人员还尚未认识到机构知识库的价值。一项对中国科学院部分科研院所科研人员对机构知识库认知程度的调查表明,53.3%的用户选择“从未听说”,33.3%的用户选择“不常使用”,10.6%的用户选择“从未使用”,仅2.6%的用户选择“经常使用”〔9〕。由于对绝大多数科研人员而言,开放存取还是个新鲜事物,这导致科研人员自存储意愿不强,对机构知识库建设参与度低,极少愿意或主动向机构知识库提交资源。社会开放存取意识薄弱,必然导致机构知识库资源数量过少、质量不高,这是制约机构知识库内容建设的一大瓶颈。
2.2 政策支持缺乏,无法有效激励
政策是机构知识库成长的宏观环境,国外机构知识库资源数量的增长、质量的提高,在很大程度上得益于国家政策及相关研究的大力支持,例如美国国家科学院、美国国家自然科学基金会的开放存取政策、美国国会通过的《公共获取科学法案》等都有力地推动了机构知识库的建设和发展〔10〕。开放存取作为一种新生事物,是由学术界发起的,我国还没有正式的关于机构知识库建设的国家政策或机构内的政策,而且我国信息资源公共政策水平较低,效率较差,这就缺乏建设机构知识库的政策指导,从而影响机构知识库的发展,特别是影响到机构知识库内容建设的规范性、系统性〔11〕。尤其是当前高校科研成果评价政策并未将在机构知识库上提交的论文作为科研成果统计,而仅将在何种期刊上发表论文作为科研绩效评价的重要依据,这关系到学者职位的晋升、相关业绩的评价和科研成果的认定。缺乏国家宏观政策、科研评价激励政策等的支持,机构知识库要吸引数量多、质量高的内容资源,其难度就可想而知了。
2.3 建设主体错位,高校作用尚未发挥
这里所说的建设主体错位主要是针对我国大陆地区而言的,香港、台湾地区的机构知识库大多数都由高校构建。香港大学、香港科技大学、香港中文大学、香港城市大学、香港理工大学、香港教育学院等都拥有自己的机构知识库,截止到2012年1月1日,台湾学术机构典藏TAIR共有124个高校参与,包括53所一般大学、63所技术职业院校,记录总数达1289577条〔12〕。而我国大陆地区的机构知识库大多数都由中国科学院构建,OpenDOAR收录大陆机构知识库共26个,其中中科院的机构知识库22个,ROAR收录大陆机构知识库共76个,其中中科院的机构知识库66个〔13〕。高校是国家教学和科研的中坚力量,我国大陆地区设有普通高等学校2305所〔14〕,而拥有机构知识库的却只有厦门大学、浙江大学、福建师范大学、北京科技大学、中国农业大学等10余所高校。大陆地区近99%高校的学术科研成果尚未成为机构知识库保存的对象,这必然会严重影响机构知识库内容建设水平。
2.4 版权保护过度,自由获取受限
机构知识库存储的是智力产品,智力产品本身存在版权归属问题。然而,我国现有版权制度较不完善,版权保护存在诸多漏洞,为避免所存储资源的版权侵权风险,很多机构知识库构建者不对外开放或只开放部分已存储的资源,资源的全文获取受到了极大的限制。例如,嘉南大学机构典藏将所收藏资源的访问权限设为3种:(1)完全公开,不需登录即可全文下载;(2)校内公开,校内网络才可全文下载;(3)不公开,无法下载全文〔15〕。厦门大学学术典藏库在其版权申明中明确规定:本学术典藏库中所有内容均由厦门大学师生整理提交而成,未经允许,不得大量下载或镜像使用〔16〕。资源版权保护过度在一定程度上影响了自由获取的可行性,使得大量学术资源让普通用户望尘莫及。
2.5 评审制度缺失,质量难以把关
传统的学术交流模式有一系列的质量控制机制和评价指标体系来确保质量,如专家评审和同行评审制度,与传统的信息交流模式相比,开放存取还未形成一个比较系统的、普遍适用的质量控制机制。机构知识库的资源存储采用的是自存档方式,用户可以不受限制地上传论文,对于自存档方式,同行评议不作强制要求。自存档极少进行同行评议程序,尤其是尚未发表的科研论文及其元数据等灰色资源,只须受到学术机构知识库系统的简单审核便可迅速被用户浏览和检索利用,这就导致了自存储资源学术质量的参差不齐,资源质量得不到有效控制。此外,从提交者角度来说,很多学者很大程度上都会选择那些具备良好声誉的期刊,而不愿意把自己的科研成果提交到“鱼龙混杂”的机构知识库中,这必然导致机构知识库资源数量和质量方面都没有保障。
3 我国机构知识库内容建设策略分析
3.1 重视宣传推广
要增强社会开放存取意识,宣传推广是关键。目前已有证据显示自存档可以提高学术成果的使用率、被引率和影响力,根据一份实证研究成果的结论,学术机构工作人员向机构知识库提交一篇论文的时间大约为10分钟,而每篇论文10分钟的时间投资能够获得在论文被引频次、下载频次和阅读方面至少200%的回报〔17〕。图书馆和科研机构应该充当开放存取理念宣传的主力军,通过展览、海报、宣传册、讲座培训、网站专题、会议等多种途径在学术界大力宣传机构知识库的意义、作用及提交程序等。条件允许的情况下,可邀请特定学术联盟或本机构的著名专家学者提供内容,发挥其“明星效应”,以此影响学术机构的其他工作人员,使机构知识库建设得到政府机构、大学、图书馆、科研人员、基金会、出版机构等相关机构和人员的理解、支持和认可,不断增强学者和公众的开放存取意识和责任感,让更多人不仅仅作为开放存取的使用者,而且成为开放存取资源的提供者。我国大陆地区在加大对开放存取特别是机构知识库的宣传上可以借鉴台湾地区的成功经验,台湾高校利用“种子学校”概念,大力宣传和推广种子学校建置机构知识库的经验,该宣传策略使台湾地区机构知识库实践从重点突破到大面积复制再到最后的全面覆盖仅经历了三年,不仅节省了大量的人力、物力、资金、时间成本,也为后期TAIR的一体化奠定了坚实的基础〔18〕。
3.2 完善存缴政策
完善合理的存缴政策是解决机构知识库资源收集困难的根本保障,从性质上来看存缴政策主要包括强制性、激励性政策两种。目前和相当长的一段时间内,尤其是在机构知识库内容建设初期,存缴政策应以强制性政策为主,采取一定程度的强制来保障机构知识库资源数量持续累积,如爱尔兰的科学工程与技术研究理事会要求所资助的研究论文在初次出版的6个月内能够在OA知识库中自由获取〔19〕;美国国家卫生研究院NIH强制的公共获取政策要求受NIH资助开展研究而产出的经同行评审的最终版本论文全文在期刊发表后,至多12个月内均应通过PubMed Central提供免费在线利用与检索〔20〕。但随着开放存取的日益成熟,存缴政策应逐步向自愿性方向发展,从强制性转向激励性与导向性。
学者很多时候并不是不愿意让别人共享自己的研究成果,而是缺乏一种驱动力来激发自己存储的热情,所以在应用强制性政策的同时要辅以多种激励政策,存缴若一味强制会适得其反,引发学者们的抗拒逆反情绪。将机构知识库中的资源纳入科研考核评价体系和职称评价体系、协助提交成果的出版、设置浏览下载量排行榜等都是很好的激励方法。例如,中国科学院力学研究所机构知识库规定,所内作者的论文统一通过IMECH-IR系统进行提交,作为年终考核绩效和晋职的依据〔21〕;香港科技大学把教职工向机构知识库递交作为个人学术出版过程的一部分,并与香港研究资助局合作资助出版或发表递交在机构知识库中的预印本文档〔22〕;香港科技大学机构仓储从2004年10月开始,在主页上都列出每个月开放存取次数最多的20篇文献〔23〕。只有通过激励才能真正持续调动科研工作者自发提交资源的积极性。
3.3 发挥高校作用
从国外已有的机构知识库建设实践中可以发现,大多数成功的机构知识库都是由图书馆,特别是大学图书馆来领导并运行管理的。在澳大利亚,澳大利亚国立大学、南昆士兰大学、墨尔本大学、悉尼大学等大学图书馆均是机构知识库的创建者。在美国,90%的高校都拥有自己的机构知识库〔24〕。CNI2005年关于机构知识库在美国的发展现状的调查也指出:大学图书馆成为研究型大学创建机构知识库的领军人〔25〕。我国大陆地区高校数量众多,拥有39所“985工程”大学以及112所“211工程”大学,这些高校师资力量雄厚,拥有大量较高学术价值的期刊论文、硕博学位论文、会议论文、研究报告、教学课件等原生数字信息,完全拥有构建机构知识库的实力。大学图书馆可以并且应该在机构知识库建设过程中发挥主导作用,国外以及港台地区的高校机构知识库也为我国大陆地区高校机构知识库的构建起着很好的导向与借鉴作用。我们要在政策机制、技术开发、资金支持等方面给予高校机构知识库成长的良好环境,充分发挥高校的作用,着力构建一定数量的高校机构知识库,将机构知识库内容建设水平推向一个新的高度。
3.4 规范版权协议
如何遵守知识产权法规,如何平衡权利人(作者)的权益和公众(用户)的利益,做到既能维护作者合法权益,又能保证公众信息获取权,这是确保机构知识库资源可用性必须解决的一大难题。机构知识库资源的免费自由获取往往需要通过版权人的授权许可,推行许可协议是目前平衡资源提交者、机构知识库、资源获取者三者利益的主要协调机制,机构知识库应根据版权法规和本机构资源收录政策,制定机构与资源提交者、机构与资源获取者的版权协议,合理配置各方的权利与义务,减少资源版权侵权风险。作者和版权所有人可通过许可协议让渡部分版权给用户,使得所有用户具有免费、不被更改、全球和永久使用其作品的权利,作者保留作品完整权、署名权等部分权利,用户使用机构知识库资源时必须注明作者的姓名、作品名称和作品出处等版权信息〔26〕。只有从版权政策上对机构知识库资源的使用实施灵活合理保护而非过度保护,更多高质量的学术资源才能最大程度地被自由存取。
3.5 加强质量控制
加强质量控制关键是建立一个包括学术质量和元数据质量在内的质量控制机制。质量控制机制应注重全面性,在资源元数据质量控制方面,可通过设置元数据元素表、制定元数据著录规范、采用从列表框中选择数据、设计自动检测系统等方法来确保元数据的正确性、一致性、完整性、唯一性和有效性〔27〕。在资源的学术质量控制方面可采用以下方法:(1)对资源提交者的限定。并非任何人的任何作品都可提交到机构知识库中,必须对提交者的身份、专业背景等进行规范。例如QUT ePrints明确规定:注册QUT的用户只能是本机构的教职员工和研究生〔28〕。(2)对资源提交程序的限定。为保证资源的规范性、系统性,要在机构知识库主页的明显位置对资源提交程序做出说明,提交方法可以多样化。例如香港理工大学机构知识库提供3种提交途径:进入香港理工大学机构知识库主页网上提交、将科研成果通过邮件发给香港理工大学机构知识库工作人员、与所在院系的学科馆员联系〔29〕。(3)对资源进行同行评审具体步骤的限定。可通过电子邮件、在线评论、寄发纸质版等途径聘请优秀的编辑和专家对成果进行评审,借助评审专家的评审及修改指导意见,对预印本质量不断进行修改完善。例如崑山科技大学机构典藏规定:一份资料要由三人审阅,只有至少获得二人认可才可以典藏至机构知识库中〔30〕。(4)对资源学科范围、文献类型、文献格式、文献内容的限定。应该根据机构的性质、机构知识库建设的目的等对资源的学科范围、类型、格式等作通盘考虑。(5)对资源建设效果的评价指标、评价方法、评价流程、评价人员、评价频率的限定等。建立一套科学、合理、实用的质量评价体系,为机构知识库内容资源前期的质量控制以及后期的质量评价提供决策参考。
(来稿时间:2012年5月)
1.Search or Browse for Repositories.〔2012-01-01〕.http://www.opendoar.org/find.php?format=charts
2.Ranking Web of World Repositories.〔2012-01-01〕.http://repositories.webometrics.info/toprep_inst.asp
3.The SAO/NASA Astrophysics Data System.〔2012-01-01〕.http://adsabs.harvard.edu/
4.万文娟,吴高.国内外机构知识库建设现状比较研究.国家图书馆学刊,2010(4):31-35
5.台湾大学机构典藏.〔2012-01-01〕.http://ntur.lib.ntu.edu.tw/
6.Most Frequent Content Types.〔2012-01-01〕.http://www.opendoar.org/find.php?format=charts
7.中国科学院国家科学图书馆机构知识库.〔2012-01-01〕.http://ir.las.ac.cn/
8.赵迎光,曾苏.国内机构知识库发展现状与对策研究.情报杂志,2011(1):42-46
9.韩珂,祝忠明.科研机构对机构知识仓储认知和服务需求调查分析.现代图书情报技术,2008(3):12-17
10.何林.美国机构知识库发展现状对我国发展机构知识库的启示.图书馆论坛,2008(3):101-103,148
11.郭淑艳,王东艳.机构知识库构建研究.图书馆学研究,2007(5):9-12
12.台湾学术机构典藏.〔2012-01-01〕.http://tair.org.tw/
13.Registry of Open Access Repositories.〔2012-01-01〕.http://roar.eprints.org/
14.普通高等学校校数.〔2012-01-01〕.http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/s4960/201012/113594.html
15.嘉南大学机构典藏.〔2012-01-01〕.http://ir.chna.edu.tw/
16.厦门大学学术典藏库.〔2012-01-01〕.http://dspace.xmu.edu.cn/dspace/
17.Leslie Carr,Stevan Harnad.Keystroke Economy:A Study of the Time and Effort Involved in Self-Archiving.〔2012-01-01〕.http://eprints.ecs.soton.ac.uk/10688/1/Keystroke Costing-publicdraft1.pdf
18.张巧娜,孟雪梅.台湾地区高校机构库的建置发展与启示.图书与情报,2010(3):11-14,68
19.Jingfeng Xia.A Comparison of Subject and Institutional Repositories in Self-archiving Practices.The Journal of Academic Librarianship,2008(8):489-495
20.First U.S Public Access Policy Made Permanent.〔2012-01-01〕.http://www.taxpayeraccess.org/issues/nih/first-us-public-access-policy-made-permanent.shtml
21.力学所机构知识库(IMECH-IR)开通通知.〔2012-01-01〕.http://tszc.imech.ac.cn/info/detail.asp?infono=12533
22.余丰民.大学机构知识库资源建设对策研究.浙江树人大学学报,2010(3):93-95
23.TOP 20 Most Accessed Documents.〔2012-01-01〕.http://repository.ust.hk/dspace/top20.jsp
24.乔欢,姜颖.机构知识库内容建设现状及思考.图书馆工作与研究,2011(12):67-70
25.吴常青,葛晓凡.机构知识库建设与大学图书馆服务体系新拓展.情报探索,2008(7):10-12
26.陈东韵,黄如花.开放存取信息资源的知识产权保护现状.图书情报工作,2008(12):17-19
27.郎庆华.学术机构库自存储资源的质量控制策略探析.情报杂志,2009(2):179-183
28.蔡迎春.分布式机构库的质量控制.图书情报工作,2008(7):44-47
29.香港理工大学机构知识库.〔2012-01-01〕.http://repository.lib.polyu.edu.hk/jspui/
30.张云瑾.台湾地区机构知识库建设特点及其启示.福建师范大学学报(哲社版),2010(4):56-59