高校机构知识库学术信息资源质量控制研究
2020-06-03陈旭
摘要:高校机构知识库只有严把学术信息资源质量关,才能体现自身服务功能与优势。文章对高校机构知识库的内涵与特点进行分析,研究影响机构知识库学术信息资源质量的因素,以及设计信息质量控制标准的方法,提出高校机构知识库学术信息资源的分阶段质量控制策略。
关键词:机构知识库;信息资源;质量控制
中图分类号:G251文献标识码:A
DOI:10.13897/j.cnki.hbkjty.2020.0022
[HJ2.2mm]互联网技术的进步改变了学术交流环境,信息传输更为便捷,科研人员不再局限于以纸质文献为载体开展学术交互,而是倾向于借助各类信息技术,以多元化的渠道促进学术信息资源传播。数字学术的日益繁荣,使得数字化学术资源规模不断扩大,数字化智力产品层出不穷,这在给学者带来更多可借鉴信息的同时,也使得网络环境下学术资源的分布更加无序,迫切需要信息机构做好学术信息资源组织、整理与存储工作,确保数字化学术资产得到合理利用。机构知识库又称为机构典藏库,是由信息机构为满足信息检索、采集、长期存储等需求,创建的集成多种数字化产品,以供广大用户使用的知识库[1]。机构知识库是开放获取运动的产物,有助于数字化学术信息资源的长期保存,为科研人员高效获取学术信息提供了平台。笔者以国内外研究文献为对象,以主题词检索的方式,从中国知网、万方、维普等网站获取相关文献,辅以聚类分析工具,客观分析国内外机构知识库的研究进展,了解机构知识库的理论、应用软件、建设实例等问题。基于此,本文归纳了高校机构知识库的特点,研究学术信息资源的质量控制策略,旨在解决学术信息资源的科学管理与利用问题,促进机构知识库理论的丰富与发展。
1 高校机构知识库的内涵与特点分析
随着开放获取运动的深入推进,作为收集、存储、共享学术资源的数据库,机构知识库已经被众多高校与科研机构关注与应用。
1.1 机构知识库的内涵
机构知识库(简称IR),是机构知识管理的可靠来源,是促进学术资源共享的平台。国内一些学者认为,IR是采集、存储单个或多个高校的知识资源的数据库,在学术交流体系变革中发挥着重要作用[2]。通过分析国内外对机构知识库的定义,可以将其划分为两类,CARL认为IR是对多个机构科研人员所创造智力产品的采集与整合,以保障内外部终端用户的无障碍使用,侧重强调其开放、学术与机构性[3];柯平等认为IR是面向公众开放的促进知识产品传播共享的系统,侧重强调其服务性[4]。筆者更倾向于第二种观点。
1.2 高校机构知识库的特点
如今国内高校正在紧锣密鼓地开展机构知识库建设工作,越来越多高校学者提高了对开放获取的参与度,以图书馆为主体的机构知识库建设体系也得到不断完善。统计表明,截至2017年底,在CALIS网站登记的高校机构知识库超过40家,在开放存取知识库目录(Directory of Open Access Repositories, 简称Open DOAR)注册的高校机构知识库超过12家。高校机构知识库主要为本校师生提供服务,建设目标之一是完成对本机构学术信息资源的采集与积累,实现知识成果的长期存储,为科研人员使用提供便利。它具有开放性、学术性、互操作性等特点,所采集的数字化资源学术性较强,提供了互操作框架,可以让用户利用互联网不受限制地访问电子资源,在一定程度上改善了学术交流环境,提升了学术机构的整体竞争力。
1.3高校机构知识库的运作流程
作为高校投入人力、物力与财力,为师生提供学术资源开放存取的场所,IR体现了高校的价值与特色[5]。掌握高校机构知识库的运作流程,是开展学术资源质量控制的起点,如图1所示。首先,科研人员登陆机构知识库注册,并提交对应的科研成果等学术资源。然后系统自动对这些资源进行质量评价,系统设置学科带头人有权推荐优质的学术资源,同行之间也可以采用公开交流和评价的方式,综合分析提交学术资源的质量,系统会对这些评价进行综合排序,提取高质量的学术资源。技术人员则会事先编写用于保障学术资源规范化的元数据,并将这些数据分类纳入元数据库中。最后系统根据元数据标准和综合评议结果,将符合要求的学术资源加入机构知识库中。
2 影响高校机构知识库学术信息资源质量的因素分析
通过对我国机构知识库网站的调研分析,发现目前我国高校机构知识库虽然逐渐增多,但普遍缺乏质量控制标准,学术特色不足,自然失去了对用户的吸引力[6]。要想做好质量控制工作,就有必要了解影响高校机构知识库的因素,为制定质量控制策略提供依据。
2.1 存储成果的价值
高校机构知识库要想体现学术特色,其存储的信息资源不仅需要具有学术价值,也要体现丰富性、全面性与可用性。高校不仅是教学机构,也是科研机构,这就要求机构知识库存储的学术资源既要体现学校办学特色,体现重点学科建设优势,也要对教学、科研活动具有参考借鉴价值。对机构知识库存储资源的来源、类型、存储形式等,也有必要做出明确的规定。这是因为不同来源与形态的学术资源,在质量上存在较大差异,也在一定程度上决定着知识库整体学术资源质量的高低[7]。查全率是体现开放获取程度的标志,根据中科院机构知识库网络平台的统计数据显示,截至2018年8月,作为起步较早的高校机构知识库,中国人民大学IR的查全率仅为39%[8]。资源采集不全面,全文获取率低,存储资源比例失调,无法发挥学术资源传播共享渠道的作用,极大限制了国内IR的发展。
2.2 提交与审核者的资质
当开展某项工作或活动时,相关主体必须具备对应的资质[9]。高校机构知识库的建设,需要考虑学术资源提交者与审核人员这两类主体的资质。为了采集机构内成员具有价值的学术资源,高校可将资源提交者限定为本校师生,要求他们保障提交成果的规范、真实与原创性,具备独立承担责任的能力,不侵犯他人合法权益。而对于审核人员而言,其组成必须是学科专家、学科馆员或经验丰富的研究人员,要求具备学科专业知识,掌握信息技术,能够熟练制定学术资源质量控制策略,能够识别提交资源的学术价值与真实性。然而基于机构知识库的开放性特点,使得在线提交的用户较多,知识库采集的资源数量庞大,提交过程中普遍缺乏实质性审核,这就难以保障信息质量。
2.3 政策标准与内容维护
机构知识库在建立后需要做好管理、维护与优化工作,以保障存储内容的可持续利用,避免发生数据丢失等意外。我国目前尚缺乏与机构知识管理相关的政策,导致高校机构知识库在建设过程中标准与规范缺失[10]。有的高校机构知识库缺乏科学的管理制度,对后期管理投入不足,导致对学术资源的管理混乱,也影响到用户的使用效果。随着社会环境、国家政策、高校科研范式等内外部因素的变化,用户对高校机构知识库的需求也在随之变化。对机构知识库内容的维护与更新,是维持知识库资源丰富、可用性的必要手段。但一些高校机构知识库缺乏专人管理,对学术资源的维护与更新滞后,没有及时修正不符合标准的元数据,没有删除侵权内容或过时信息,极大影响到知识库的使用功能。
3 高校机构知识库学术信息资源质量控制标准的设计
对高校机构知识库进行质量控制,根据存储学术信息资源设计对应的管理标准,是高校管理者促进机构知识库不断完善,提高数字化资源管理水平的必要环节。
3.1 形式内容质量控制标准
对机构成员提交的信息进行形式内容审核,涉及是否符合采集范围、是否符合内容格式标准、是否重复提交等方面。每个机构知识库可以根据自身建设实际,合理规定采集存储学术资源的内容范围。但机构知识库对提交范围的标准设计并不是固定的,而是根据高校学科建设情况、用户需求变化趋势而变化的[11]。例如,我校图书馆以服务教育科研为主,为了保障知识库学术资源的合理配置,需将教学科研资料作为采集主体,减少档案、期刊等资料的采集。若提交的学术信息符合要求,还需要进一步判断是否重复提交,最后对资源类型、文件格式等进行审核。由于终端用户使用软件的差异,机构知识库管理者可以拟定针对常见应用软件的格式标准,以方便用户下载与使用。
3.2 学术内容质量控制标准
高校机构知识库对学术信息内容的质量审核,需要委托学术专家从学术规范、学术价值等角度开展,或者随机委派同一领域的学科带头人参与学术内容质量评定,这是保障机构知识库整体学术水平的重要措施。根据不同机构知识库的特色,每个知识库在学术资源采集范围与质量审核方面不存在共性,因此对学术质量评价标准的设计,需要管理者根据实际情况拟定。高校机构知识库不仅需要延续传统的同行审议模式,设计符合要求的同行学术评价标准,也需要邀请更多学科专家参与其中,不断对学术资源质量评价指标进行修改完善,保障纳入真实、优质的学术信息资源,提高学者对机构知识库价值的认同度。
3.3 元数据质量控制标准
元数据用于描述信息资源的基本属性,方便从大量数据中提取内容特征,保障不同资源的互操作性与长期存储。元数据包括描述性、管理性、结构性等多种类型,高校机构知识库必须要明确不同元数据的互操作标准,并建立对应的元数据库[12]。机构成员在自行提交学术信息资源过程中,对其提交内容的元数据描述,也多为提交者自行输入的,这就不可避免会出现元数据标准不统一的问题。为此,机构知识库管理者要设置统一的元数据规范,明确可使用的元数据范围,保障输入的标准化,避免拼写错误等细节问题。机构知识库管理者也要根据通用的元数据标准,做好元数据的编辑、审核与更新工作。
4 高校机构知识库学术信息资源的质量控制策略
对学术信息资源的质量控制,贯穿于高校机构知识库建设全过程中。为了保障学术信息资源质量控制效果,筆者结合机构知识库存储实际与运营流程,采用分阶段质量控制方法,制定资源提交阶段、审核阶段、使用阶段的对应策略,建构了学术信息资源质量控制模型,以全方位保障机构知识库的资源质量(如图2所示)。
4.1 资源提交阶段
高校机构知识库需要事先对外发布学术信息提交政策,让机构成员了解上传要求,进而根据规范提交学术成果。在提交者的身份审核方面,除了允许本校科研人员提交学术资源,也可以鼓励在校大学生上传优秀学术成果,保障不遗漏任何有价值的信息。例如,中科院文献情报中心机构知识库(NSL OpenIR)规定符合内容提交范围规定的人员,在NSL OpenIR中注册并获得提交授权,就可以提交内容。提交者应该保障学术信息的规范、完整与真实性,符合特定的存储格式,提交后不得随意更改。机构管理者则应该具有元数据编辑与管理能力,能够预测元数据使用中存在的问题,并制定对应的元数据操作规范指南,方便提交者阅读并依规操作。同时采用开源软件平台,设定系统可以识别的资源类型与范围,明确资源文档格式要求,做好提交资源的存储与备份工作,保障不因为软硬件环境的改变,引发学术信息资源损坏或无法读取的尴尬。
4.2 资源审核阶段
对于已经提交的学术信息资源,机构知识库管理人员要进行严格的质量审核,借助各种智能化工具提高审核的可靠性。资源提交涉及文档上传、元数据录入等步骤,而这两个操作也是质量审核的重点。为了保障元数据录入的便利与准确性,管理者要设置一些控制程序,如减少录入步骤、自动生成日期、设置可供选择的规范化录入字段等,以减少录入工作量,提高学术资源提交效率。对提交学术资源的质量审核,主要是做好元数据与文件格式的质量控制工作,及时发现提交过程中存在的错误,以内容提交表达的形式呈现审核结果,要求提交者予以修改更正,保障提交的内容符合规范。
4.3 资源使用阶段
高校机构知识库对已经收录的学术信息资源,需要定期进行维护与更新,及时删除不符合要求的资源,对保密期限已过的特色资源进行开放共享,对接收到新版本的存储资源,要合理处理旧版本,根据需要选择是否保留或删除。这个阶段涉及元数据、学术内容与知识版权等方面的质控,除了采用同行随机审议的方式,还需要知识库管理者做好用户数据采集工作,了解既有资源的查看、下载与使用率,并将用户使用情况作为评价学术资源质量的指标之一。管理者也要承担对存储资源格式规范性、链接有效性等内容的定期检查工作,保障开放共享的资源不涉及版权纠纷,或者保证得到原作者授权后方可传播,对于质量审核的最终结果要及时反馈给提供者,以便其结合需要进行修改和完善。
5 结语
机构知识库是开放获取运动的产物,是体现高校学术资源特色的重要平台。如今国内高校机构知识库蓬勃发展,为广大学术工作者获取信息提供了便利。而在机构知识库建设过程中,应该全方位考虑质量控制问题,制定科学的学术信息资源质量控制指标,建立常态化存储资源质量控制机制,总结分析学术信息资源质量方面的问题,掌握用户的需求变化情况,这是保障机构知识库良性运作的基础,也是提高用户信任度的必要途径。
參考文献
[1]刘丹.机构知识库元数据质量控制方法研究[J].图书馆学研究,2018(4):59-66.
[2]刘文云,岳丽欣,马伍翠,等.政府数据开放保障机制在数据质量控制中的应用研究[J].情报理论与实践,2018(4):21-27.
[3]魏瑞斌,陈丹丹,琚兴.高校机构知识库的应用研究[J].知识管理论坛,2013(5):3-12.
[4]柯平,王颖洁:机构知识库的发展研究[J].图书馆论坛,2006(6):243-248.
[5]赵洁洁,詹华清,介凤.高校机构知识库学术评价功能研究[J].图书馆杂志,2017,36(9):20-25.
[6]陈林华.我国高校机构知识库开放存取政策研究[J].湘潭大学,2018.
[7]司莉,庄晓喆.我国高校科研数据机构库联盟的建设需求调查与分析[J].图书馆,2017(7):19-26.
[8]万文娟,吴高.我国机构知识库内容建设问题与策略分析[J].图书馆,2013(1):110-113.
[9]贾宏.高校机构资源库元数据质量控制研究[J].南阳师范学院学报,2017(2):65-67.
[10]刘书凯,陈冬梅,栾冠楠.创客教育实践对创新图书馆信息素养教育内容的启示[J].图书情报工作,2016,60(1):52-55.
[11]曹树金,古婷骅,马翠嫦.图情领域机构知识库可聚合性分析[J].图书情报知识,2016(6):95-106.
[12]孙薇.E-Research环境下机构知识库学术信息资源的质量控制研究[J].图书馆学刊,2016(2):30-32.
作者简介:陈旭(1980-),男,福建医科大学图书馆助理馆员。研究方向:信息资源及学科服务。