APP下载

我国机构知识库建设模式比较研究*

2015-07-22王清飞河南牧业经济学院河南郑州450011

图书馆 2015年4期
关键词:集中式知识库分布式

王清飞(河南牧业经济学院 河南郑州 450011)

我国机构知识库建设模式比较研究*

王清飞
(河南牧业经济学院河南郑州450011)

〔摘要〕文章通过分析我国机构知识库建设的现状,发现其中存在的问题,总结归纳机构知识库构建的基本方式和工作原理,并对比自主模式和联盟模式(采集式机构知识库、分布式机构知识库、集中式机构知识库、混合式机构知识库)的特征、优点、不足,确定其适用范围。

〔关键词〕机构知识库采集式分布式集中式混合式

机构知识库是利用信息技术、知识技术依托单位或部门建立起来的数字化资源库的集合,它搜集、整理并长期保存该单位或部门所产生的知识和科研成果,并对这些资源进行规范整理并进行标引,然后按照相关的操作协议,允许单位或部门内的工作人员进行相互操作和免费使用。[1]在开放存取的大环境下,国内外的信息和知识交流模式发生了变革,由传统的纸质文献交流为主转换成以数字形式资源的交流为主。高校、学术机构、图书馆等机构是数字资源集中之地,机构知识库的引入一方面可以实现数字资源的深度挖掘开发,长期保存。另一方面也可以打破出版机构知识产权等商业规则。

1 我国机构知识库建设的现状

通过访问相关网站发现目前我国部分区域已经建立了集成系统,如中科院国家科学图书馆兰州分馆进行系统开发和技术支持的中国科学院机构知识库服务网格[2];香港有由香港科技大学建立的香港机构知识库[3],通过它可以对很多香港本地的机构知识库进行检索;台湾地区有由台湾大学机构知识库小组提供技术支持的台湾学术机构典藏系统[4],该系统可以检索台湾地区的高校和科研机构的机构知识库。这些集成的机构知识库系统,从资源的利用上给读者提供了方便,减少了使用成本。

1.1机构知识库发展区域化明显

截至2014年1月,在OPEN DOAR中,我国大陆为29个,其中中国科学院系统的有26个;港澳地区为6个;台湾地区为57个。我国台湾地区有高校162所,建设机构知识库的有121所,约占74.7%;我国大陆除了中科院部分研究所外,高校建立机构库的还有北京大学、清华大学、中国农业大学、上海交通大学、浙江大学、厦门大学、大连理工大学等,而我国大陆的高等院校为2101所,建设机构知识库的约占0.5%。从调查中发现,我国机构知识库建设区域化发展不平衡,台湾地区建设机构知识库的数量远远高于大陆。从调查中发现,建设机构知识库较多的中国科学院和台湾地区,合作分工意识较强,如中科院各研究所机构均采用国家科学图书馆兰州分馆的机构知识库系统,台湾地区有台湾大学机构知识库系统,香港地区由香港科技大学建立香港机构知识库,这样可以减轻单位机构知识库的开发压力,只需要在系统的基础上对资料进行搜集和整理即可。

1.2开放存取意识淡薄,宣传力度薄弱

从相关网站和文献调研中可以发现,我国机构知识库宣传力度薄弱,读者对开放存取意识淡薄,很多读者了解开放存取,也明白开放存取的优点,但是对如何进行开放存取和开放存取的途径不了解,主要原因还是宣传力度不够,手段单一。绝大多数机构知识库仅仅是选择超链接网站的方式进行,还有不少单位的机构知识库是放在内网,这样就不利于读者对机构知识库进行使用。调查发现,国内机构知识库不仅是开放程度不够,并且相关的工作人员和单位对开放存取的意识也比较弱,这不利于机构知识库的健康发展。

1.3管理不完善,相关标准规范缺失

管理不完善主要表现在以下几个方面:其一,资金和人力投入不够,许多单位并没有把机构知识库建设放在重要的位置,这样对人力和资金的投入就没有保障,缺少专门的人员来进行管理和维护;其二,资源搜集的范围较窄,很多单位限制了资源搜集的类型、来源和格式,这很大程度上限制了机构知识库的资源广度,缺少强制搜集资源的政策和鼓励存取资源的政策;其

另外,机构知识库的标准规范也不是很完善,如中国农业大学制定的资源质量控制、资源搜集标准、资源保存标准、元数据使用标准,并没有随机构知识库一起显示出来,起不到宣传作用;香港科技大学制定了元数据利用政策、资源提交政策、资源保存政策等并且放在网页中,但是并没有涉及到隐私政策、版权政策和删除政策。

2 我国目前存在的机构知识库的种类

2.1自主模式

自主模式是指单个独立机构以本机构为核心建立发展机构知识库的模式。在这种模式下,每个独立机构一般以其下属院系、部门为基础,构建属于本机构的知识库。[5]目前很多机构建设机构知识库都是这种模式,并且以机构的名称来对知识库进行命名,由于自主模式担任着开发、设计、维护、管理等,技术要求高,成本也高,如美国麻省理工学院机构知识库、英国南安普顿大学机构知识库、厦门大学机构知识库、香港科技大学机构知识库等。

2.2联盟模式

联盟模式是指两个或以上机构联合构建知识库,通过共建共享实现资源优化配置,这样可以对用户进行统一培训,统一提供知识传播与知识服务。根据联盟区域范围可以分为地区联盟、国家联盟和国际联盟。根据构建模式可以分为采集式建设模式、分布式建设模式、集中式建设模式和混合式建设模式。[6]

图1 采集式机构知识库模型

2.2.1采集式建设模式

采集式机构知识库也被称为收割式机构知识库(见图1),即每一个成员机构都遵守相关协议,制定统一的数据标准,使用统一的检索界面,建立采集数据库,该数据库定期对成员机构库进行采集,用户只需要访问采集数据库即可获得该联盟各个机构的知识数据,如英国的eprints UK就是属于这种模式。

2.2.2分布式建设模式

分布式机构知识库是成员机构分别建设属于自己的机构知识库(见图2),各个机构知识库的元数据和数据都存储在各机构自己的本体数据库中,用户通过相关的网络协议来实现对本联盟内所有机构库的检索和使用,如SRW/SRU或者Z39.50协议,从而获得自己所需要的数据。

图2 分布式机构知识库模型

2.2.3集中式建设模式

集中式机构知识库是指机构联盟建设一个知识库,各个成员共同使用,共同制定管理、使用和维护标准,各个机构成员直接将元数据和内容上传到机构知识库中,成员机构的用户通过统一的检索界面对机构知识库进行检索和使用(见图3)。如英国的白玫瑰机构知识库就是由University of Leeds、The University of Sheffield 和The University of York共同建设的集中式机构知识库,从数据的提交到使用,都有统一的管理和维护。

图3 集中式机构知识库模型

2.2.4混合式建设模式

混合式建设模式即联盟机构之间既有采集式机构知识库,又有分布式机构知识库,还有集中式机构知识库(见图4)。即中间的某个机构数据库可以是数个机构的采集建设的总库,也可以是数个机构的集中式机构知识库,也可以是数个机构的分布式机构数据库,形成的混合式机构知识库。[7]

图4 混合式机构知识库模型

3 机构知识库建设模式的优缺点比较

表1 机构知识库建设模式的优缺点比较

3.1自主模式的优缺点

自主模式是目前很多机构采用的基本模式,适合刚开始建设机构知识库的单位,在这种模式下,项目建设完全可以按照需求分析、功能设计、成本控制等,包括单位或部门的实际情况、实际需要来进行。对开发知识库软件的选择、元数据标准的制定、应用协议标准化,可以完全独立的设计和规划本单位知识库,体现机构特色[8],并且可以根据单位的需求进行更新和拓展,这为机构知识库的高效发展带来动力。

这种模式对单位的资金和技术要求比较高,机构知识库的资金和技术投入都基于机构本体,成本比较高;另外就构建知识库的知识而言,对于一般的机构来说可能存储的知识较少,不够丰富。因此这种模式适合具备较强开放获取意识的大型机构,但是对中小型机构,尤其是微型机构来说,并不适合。

3.2分布式机构知识库模式的优缺点

分布式机构知识库适用于联盟机构或多个机构,当其中的成员建有知识库时,本单位机构知识库允许联盟内其他成员访问机构知识库系统,这样有利于实现资源共享。主要有两种模式:一种是物理和逻辑都是分布的,这时成员需要通过相关的协议来实现,如SRW/SRU或Z39.50;另外一种是逻辑集中,物理分布的模式,这种可以开发统一检索界面来进行实现。[9]

这种模式的优点是成员机构可以保证实时对元数据进行检索,局部响应速度快,可扩展性好。另外,这种模式保留了成员机构的特色,成员归属感强,管理者可以根据本机构发展实时的调整机构知识库。

不足之处:①成本较高,前期每个成员要建设自己的知识库,有重复建设现象。②不一样的机构知识库数据标准不一样,跨库检索难度大。③随着数据量的增大,数据重复会增加,检索速度会变慢,检索结果较多时,优先输出排序不好实现。④每个成员高度自治的特点,导致数据库容易出现数据不一致性。

3.3采集式机构知识库模式的优缺点

为了克服分布式机构知识库的缺陷,产生了采集式机构知识库。它的工作原理是将联盟内的机构知识库的元数据进行收割,进行统一的标示形成数据库,用户检索是首先对元数据库进行检索,然后再获取源文件,提高了检索速度,这种模式适合大范围联盟机构知识库的建设。[10]

优点是与分布式相比,提供了统一的检索界面,提高检索速度,比集中式的成本低。不足之处是采集式不具有实时性,用户能访问到的是最后一次采集到的元数据。

3.4集中式机构知识库模式的优缺点

这种模式适合有共同隶属关系的机构组织或者区域位置较近的机构组织。这种模式的优点是多个机构建立一个机构知识库,这样成本大大降低,同时避免了重复劳动,从技术上实行统一管理,这样技术和数据标准比较统一,系统检索速度快,数据重复率低。另外也给同一区域或者机构建立一个交流和学习的平台,为地方文献资料和资源的长期保存提供一个平台。

不足之处就是不能体现机构特色,成员缺乏归属感,对知识库的建设可能积极性不高,另外由于成员机构的水平参差不齐,对机构知识库的统一标准制定有一定的难度。[11]

3.5混合式机构知识库模式的优缺点

在混合式机构知识库中,有自主式、集中式、采集式、分布式四种模式,因此混合式的优缺点是这几种模式的集中体现。这种模式适合全国范围或者几个大的联盟之间组成更大的联盟,其最大的优点就是可以迅速实现联盟内的资源共享,并保持原机构知识库不变,最大的不足就是技术难度大,不便于维护。

总之,建设机构知识库,对于机构来说既有很大的利益,也有一定的难度。机构选择何种模式的机构知识库,要根据机构的实际情况,这样才能更好的为机构本身服务。

(来稿时间:2014年11月)

参考文献:

1.李大玲.学术机构知识库构建模式研究.上海:上海交通大学出版社,2009:44-46

2.中国科学院.中国科学院机构知识库服务网格.http:// www.irgrid.ac.cn/

3. HKUST library.HKIR.http://hkir.ust.hk/hkir/

4.台湾大学IR小组.台湾学术机构典藏系统.http://tair.org.tw/

5.邓君.机构知识库建设模式与运行机制研究.长春:吉林大学博士论文,2008

6.邓君.机构知识库建设模式研究.图书情报工作,2010(6):112-116

7.朱志博,吴海霞.机构联盟知识库建设模式.图书馆学刊,2012(1):60-63

8.渠芳.高校教学联合体机构知识库联盟建设研究—以徐州高校教学联合体为例.情报理论与实践,2010(11):83-85

9.曾苏,马建霞,祝忠明.机构知识库联盟发展现状及关键问题分析.图书情报工作,2009(24):106-110

10.陈淑珍,韩珂,祝忠明.我国大学机构知识库建设的模式选择与实施策略.图书馆杂志,2009(8):52-54

11.肖可以.高校图书馆机构知识库构建研究.湘潭:湘潭大学硕士论文,2009

〔分类号〕G250.7

* 本文系2014年河南省教育厅人文社会科学研究项目“龙子湖高校园区图书馆联盟建设研究”(编号:2014-QN-409)研究成果之一。三,服务功能不完善,很多机构知识停留存在数字资源的长期保存、资源组织、浏览和检索等基本层面,缺乏个性化服务、数据挖掘和关联检索等功能。

〔作者简介〕王清飞(1983-),男,硕士研究生,馆员,主持参与科研项目8项,已发表论文10篇,研究方向:图书馆参考咨询与数字资源建设。

Comparative Study in Construction Models of Institutional Repository in China

Wang Qingfei
( Henan University of Animal Husbandry and Economy )

〔Abstract 〕This paper analyzes the current situation of the construction of institutional repository in our country, and finds the existing problems. And then it sums up the basic mode of the institutional repository construction and working principle. By comparing the independent mode and union mode (acquisition mechanism knowledge base、 distributed institutional repository、 centralized institutional repository、 hybrid institutional repository) about the characteristics, advantages, disadvantages. At last, the article determines the scope of application.

〔Key words 〕Institutional repositoryAcquisition typeDistributedCentralizedHybrid

猜你喜欢

集中式知识库分布式
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
光伏:分布式新增装机规模首次超越集中式
分布式光伏热钱汹涌
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
分布式光伏:爆发还是徘徊
高速公路信息系统维护知识库的建立和应用
基于DDS的分布式三维协同仿真研究
基于Drupal发布学者知识库关联数据的研究
浅谈集中式光伏电站设计与设备选型
浅析组串式和集中式逆变器安全可靠性