APP下载

基于信息聚合技术的高校图书馆馆藏资源优化分析*

2016-06-20浙江工业职业技术学院浙江绍兴312000

图书馆 2016年6期
关键词:馆藏资源元数据高校图书馆

马 灿(浙江工业职业技术学院 浙江绍兴 312000)



基于信息聚合技术的高校图书馆馆藏资源优化分析*

马 灿
(浙江工业职业技术学院 浙江绍兴 312000)

〔摘 要〕针对我国高校图书馆馆藏资源的个性化服务难题,文章指出提高我国高校图书馆馆藏资源利用率的优化策略。结合元数据方式和语义方式对其进行信息聚合,使其更加优化,并对优化前后的使用状况,采用抽样调查的方法获取200份调查问卷,通过对问卷的数据进行数据分析研究,其结果为优化我国高校图书馆馆藏资源提供了充分的科学依据。

〔关键词〕高校图书馆 馆藏资源 元数据 语义 信息聚合 优化

〔引用本文格式〕马灿.基于信息聚合技术的高校图书馆馆藏资源优化分析[J].图书馆,2016(6):50-53

·专题研究·

1 引言

高校馆藏资源,就是高校图书馆所收藏的所有资源,是图书馆存在和提供信息资源服务的基础,是一个动态发展的有机体,是各学科师生获取知识信息资源的重要途径,是高校各学科建设与发展的重要文献支柱,也是间接衡量一所高校整体综合实力和办学水平的重要标志。随着网络信息技术和数字化技术的快速发展,高校图书馆的馆藏资源越来越丰富,尤其是数字化资源,包括自建资源数据库、外购资源数据库和网络资源等多种资源,其资源覆盖面包括工学、力学、经济学、管理学、法学、文学、艺术学、历史学、农学等多种学科[1-3]。面对如此巨大的数据信息量,如何提高馆藏资源的利用率成为一大难题。

文章借助元数据方法和语义方法对高校馆藏资源进行聚合,并对其进行优化分析,形成一个统一的元数据标准下的数据源,并为高校师生提供统一的检索服务。另外,采用问卷调查的方式就聚合优化前后的馆藏资源使用情况对浙江省杭州市四所高校(浙江大学、浙江工业大学、杭州电子科技大学和浙江工业职业技术学院)200名在校师生进行问卷调查,发现聚合优化后馆藏资源利用率远远高于优化前的利用率。

2 基于元数据和语义聚合馆藏资源优化分析

对馆藏资源的优化是通过元数据和语义聚合技术来实现的,这种聚合是通过对各类馆藏信息资源的内容特征来进行分析、选择、标引和处理等过程,从学科、分类、主体和著作等多个维度对馆藏资源进行融合、汇聚和重组,最终形成有序化的馆藏资源集合,充分显示出各类知识间的关联性[4],以达到高校图书馆实现个性化知识推送的服务目的,真正使其从只能提供文献需求和一般性信息需求的物理馆藏到提供知识服务的数字化馆藏,也真正提高了高校图书馆馆藏资源的利用率,且优化前后的资源服务理念有着很大的差异,如图1所示。

图1 馆藏资源优化前后的服务理念

相关研究表明,馆藏资源聚合是对馆藏数据、信息、知识的重新整理调配和优化组合,而且这种整理调配和优化组合的过程是由简到繁、由浅到深的逐步细化和深化的过程。具体可以分为四个层面[4]:针对馆藏实体文献的整理;针对馆藏数据的集成;针对馆藏信息的整合;针对馆藏知识的聚合。显然,这四个层面是从馆藏资源的传统聚合到深度聚合的过程,是以可视化方法客观地呈现文献资源的聚合结果,最终实现个性化知识推送的服务目的,提高馆藏资源的利用率。该四个层面间的逻辑关系如图2所示。

图2 馆藏资源四个层面间的逻辑关系

2.1馆藏实体文献的整理

首先采用传统的聚合模式,基于文献编目和元数据等方式针对馆藏资源的结构类型展开的资源聚合,实现了对馆藏资源的内容特征和外部特征在形式语法上的聚合,但这种聚合程度不够深入,还需要进一步聚合优化,才能真正的满足用户的需求,实现个性化知识推送的服务目的[5, 6]。针对馆藏实体文献的整理主要由两大步骤组成,第一个步骤是基于文献编目的文献整理聚合,第二个步骤是基于元数据的聚合,通过这两个步骤可以实现馆藏实体文献的聚合整理,实施流程如图3所示。

图3 馆藏实体文献聚合整理的实施流程

2.1.1基于文献编目的文献整理聚合

基于文献编目的文献整理聚合,是按照一定的著录格式和规则对传统印本的实体文献进行整序,它多是停留在用手工整理的纸质形式上,并且,它只是体现出文献的内容、形式等特征,提供文献的检索途径和方法,为文献的管理工作提供依据;也就是说,它只是满足了用户馆藏资源的收藏、整理和检索等方面的需要[7]。

2.1.2基于元数据的聚合

基于元数据的聚合,是将馆藏资源的属(主要为馆藏文献资源的MARC数据和馆藏数字资源的DC元数据)性作为描述对象,通过对描述性、结构性和非结构性的元数据进行集成加工,使其以描述馆藏资源主体和内容的形式作为馆藏资源聚合的基础保存下来;换句话说,它是借助灵活的著录格式来标引和表述数字化馆藏资源的内容及形式特征,从而起到优化馆藏资源的作用,达到提高用户获取和使用馆藏数字化资源利用率的目的[8-10]。

目前,我国对于元数据馆藏资源的聚合研究主要集中在元数据的描述和存储两个方面。在元数据的描述方面,很多研究学者认为DC元数据是将大型馆藏文献数字化项目中的数字化对象元数据作为标准,通过对其来源、时间、主题和关系等多元素的描述、整理和控制,再对其添加贡献结构和权限管理等元素,充分体现出馆藏数字化信息资源之间的层次关系和衍生关系,提高了馆藏资源信息检索的效率,也为馆藏数字化资源的深度聚合奠定了坚实的基础。在元数据的存储方面,有研究学者认为是将图书馆现有的、外购的及通过互联网搜索引擎而来的各类数据资源整合在基于DC元数据存储的一站式检索系统;也有研究学者认为是借助主动数据的收割方式来收集包含馆藏资源、OAIPMH的开放资源和网页资源等在内的元数据,再将其按照统一格式来进行转换并存储到同一个数据资源库中,同时,对该数据资源库中的所有数据进行多维度的分析,构建出一个标准的元数据格式,由此来实现统一的检索服务。

2.2馆藏数据信息的聚合整理

馆藏资源内容上的语义聚合是通过对馆藏资源知识组织分析来深度挖掘知识关联,最终实现从多维度来对馆藏资源中的显性知识和隐性知识进行分析,借助词汇概念、概念关系和引证关系来达到知识融合与个性化知识推送的服务目的[11-13]。目前,我国基于语义的馆藏资源的深度聚合研究主要是从技术驱动和服务驱动两个方面进行,并通过基于本体、关联数据、主题模型和计量分析复合模式的形式来实现的[14,15]。

技术驱动是借助语义网格和Super-peer技术等来构建馆藏资源的深度聚合模型,它可以从抽取信息、标注语义、构建知识库、建立用户模型、检索语义和本体间的构建、映射与整合的维度来构建一个相对应的三维模型,该模型包含了对馆藏资源本体的开发、信息表示、元信息和元数据等内容,最终实现了异构资源在统一的语义层次上的知识资源智能检索和利用。

服务驱动是通过建立对馆藏资源间各种语义间关联的资源进行描述并建立描述模型,并从可视化的角度开展基于语义的馆藏资源聚合服务,包括面向资源主题和科研决策的聚合服务。

针对馆藏数据信息的聚合整理主要由四个步骤组成,第一个步骤是从语义和知识层面的聚合,第二个步骤是采用关联性元数据的聚合,第三个步骤是从图形图像和文本知识方面实现聚合,第四个步骤是采用计量分析学对语义关系进行聚合,通过上述步骤可以实现馆藏数据信息的聚合整理,实施流程如图4所示。

图4 馆藏数据信息的聚合整理的实施流程

2.2.1语义和知识层面的聚合

目前,国内基于本体的馆藏资源深度聚合主要是通过各种各样的本体知识库的建立,将把所有知识进行核实的知识表示和知识组织,并准确的从语义和知识层面来描述抽象的知识内容,由此实现资源的深度聚合。很多学者也对此模型的具体构建纷纷提出自己的见解,比如,从理论整合层面、应用扩展层面和知识检索层面的本体构建模型,从基于关系数据模式来自动建立局部本体及每个本体间的映射方法等[16]。

2.2.2关联性元数据的聚合

关联数据是元数据在网络信息空间中表达语义和功能实现的最好方式,基于关联数据的聚合模式更加灵活、更好实现,用户只需要关心自己所需要的信息本身就好,图书馆的信息系统会通过关联数据功能将馆内外数据资源自动整合在一起,并提取出用户所需的信息,在这个过程中会涉及用户交互、资源整合及隐私保护等方面内容。

2.2.3图像和文本方式的聚合

基于主题模型的深度聚合模式主要是从图形图像和文本知识两个方面来进行的。其中,图形图像的主题模型是将搜索引擎获得的图片表示为文档模型,并借助主题模型进入低维度的语义空间进行聚合,达到对图像信息的优化聚合。文本知识的主题模型是利用LDA主题模型或Topic Author概率主题模型对馆藏资源知识进行发掘、发现和分析,通过文本信息和作者信息的联合模型来对文本知识进行聚合[17]。

2.2.4基于计量分析复合模式的语义关系聚合

基于计量分析复合模式的深度聚合模式是将计量学分析中的语义关系直接用语义网中的语言进行替换,最终形成描述馆藏资源元数据的一个关系网络,该模型也能够通过基于主题的语义标引来达到通过主题对馆藏数字化资源的多维度聚合的目的。该模型能够有效避免本体的不能重复使用问题及元数据对语义关系揭示相对较浅等问题,能够更好地实现馆藏资源个性化知识推送的服务目的,更好地提高馆藏资源的利用率[18, 19]。

3 具体案例的优化分析

综合以上的馆藏资源优化策略,以江苏大学图书馆为例,对截至2015年上半年图书馆内的馆藏资源进行优化分析,所需的资源数据均通过江苏大学的联机公共查询目录系统(OPAC)进行查询获得,针对分析结果采用调查分析方法对200名师生(其中,老师10名,博士研究生20名,硕士研究生26名,本科生105名,专科生39名)做了详细的随机调查问卷,问卷实行百分制,60分以下表示不满意,60-80分之间表示一般,80-90分之间表示满意,90分以上表示非常满意,该问卷所涉及内容与评分结果如表1所示(因涉及问卷较多,评分结果为平均结果,且四舍五入只保留整数)[20, 21],为了进一步考查优化策略达到的效果,分别对比了优化前,经过传统优化后,也即第一步骤优化以及经过传统和深度两步骤优化的评分结果,具体结果如表1所示。

表1 调查问卷内容及评分结果

经过对表1的调查问卷结果分析可知,聚合优化后对高校图书馆馆藏资源各方面的满意度明显优于优化前,且经过两步骤深度优化后的满意度明显高于传统优化后;另外,随着优化程度的加深,不仅仅是数字化馆藏资源的满意度大大提高,而且纸质版馆藏资源的满意度也在提升。也就是说,我国高校图书馆馆藏资源在纸质资源和数字化资源方面的内容都在快速的被丰富,满足了高校师生对馆藏资源的各种需求,为高校各学科的创新教育提供了良好的文献资源保障[22, 23]。

4 结论

通过对馆藏实体文献的聚合整理和馆藏数据信息的聚合整理,实现对我国高校馆藏资源的优化,结合笔者所做的实地调查分析可以看出,馆藏资源的不断优化发展,使高校图书馆的馆藏资源由“以图书馆为中心的文献服务”快速转变为“以用户为中心的知识服务”。在信息化时代,高校图书馆馆藏资源急剧增多,深度聚合的馆藏资源能够更好地实现我国高校图书馆馆藏资源进行个性化知识推送的服务目的,并提高我国高校图书馆馆藏资源的利用率,为高校实现各学科的创新教育提供了文献资源保障。

(来稿时间:2016年2月)

参考文献:

1.黄文碧. 基于元数据关联的馆藏资源聚合研究[J]. 情报理论与实践,2015(4):74-79

2.吕红,邱均平,李小涛,等. 国内馆藏资源可视化研究进展分析[J]. 情报资料工作,2014(1):20-26

3.王庆雯,孙丹霞.高校图书馆学科建设中的馆藏资源配置[J]. 图书馆杂志,2015(5):66-69

4.赵蓉英,王嵩,董克.国内馆藏资源聚合模式研究综述[J]. 图书情报工作,2014(18):138-143

5.高惠荣,孙晓玫. 元数据及其在数字图书馆发展中的作用[J]. 图书情报工作,2012(S1):170-172

6.高静萍,徐萍,何静. 高校图书馆馆藏资源建设存在问题分析[J]. 新世纪图书馆,2013(3):50-53

7.毛燕梅,张秋萍,李丽华.网络资源的组织与DC元数据[J]. 情报杂志,2002(1):27-28

8.成全,许爽,钟晶晶.馆藏资源元数据语义描述及关联网络构建模型研究[J].情报理论与实践,2015(4):124-129

9.张宏伟,许慧. 基于DC元数据仓储的数字资源整合研究[J]. 图书馆学刊,2014(6):32-34

10.徐荣华. 基于元数据仓储的资源整合应用[J]. 图书馆杂志,2012(4):67-73

11.李劲,程秀峰,宋红文, 等. 基于语义的馆藏资源深度聚合模型探析[J]. 湖北民族学院学报(自然科学版),2013 (2):212-215

12.沈秀丽,牟冬梅. 数字图书馆知识组织语义互联论纲[J]. 情报科学,2010(3):379-383, 429

13.贺德方,曾建勋. 基于语义的馆藏资源深度聚合研究[J]. 中国图书馆学报,2012(4):79-87

14.成荫. 高校档案馆馆藏资源开发利用创新研究[J]. 兰台世界,2015(2):51-52

15.何超,张玉峰. 基于本体的馆藏数字资源语义聚合与可视化研究[J]. 情报理论与实践,2013(10):73-76, 39

16.丁楠,潘有能. 基于关联数据的图书馆信息聚合研究[J]. 图书与情报,2011(6):50-53

17.王涛. 基于关联数据的馆藏信息资源聚合研究[J]. 图书馆学刊,2012(8):44-46

18.王薇. 基于关联数据的图书馆数字资源语义融合研究[D].南京:南京大学硕士论文,2013

19.杜志银,赵曦,肖婷超, 等. 馆藏资源链接与高校图书馆信息服务研究[J]. 现代情报,2010(3):64-66

20.刘桂宾. 馆藏资源建设与图书馆服务质量定量评价——以南开大学数学科学学院为例[J]. 图书馆工作与研究,2015 (1):67-71

21.高丽,王良超. 大学图书馆特色馆藏资源建设研究——以西南石油大学图书馆为例[J]. 四川图书馆学报,2012 (3):32-35

22.陈丽娟. 基于创新教育的高校图书馆馆藏资源建设研究[J]. 教育与职业,2012(9):191-192

23.陈磊,陈惠兰,詹司佳, 等. 学科竞争力视角下的馆藏资源建设探析——基于Scival跨学科科研评价工具[J]. 图书馆,2015(5):83-86

Analysis of Collection Resources Optimization ofUniversity Library Based on InformationAggregation

Ma Can
( Zhejiang Industry Polytechnic College )

〔Abstract 〕For personalized service problem of university library collection resources in China, this paper studies to improve the utilization ratio of university library collection resources optimization strategy in China at present. With its information aggregation of metadata and semantic mode, and making it more optimized. 200 questionnaires were obtained from sample survey of working condition before and after optimization, and analysis was based on the data of the questionnaire. The results indicate that utilization ratio of university library collection resources is much higher than before,and the aim of push of personalized knowledge is achieved, resulting in rising of library resources utilization ratio, and the results provide the scientifc and technical basis for improvement of the library collection resources optimization in China.

〔Keyw ords 〕University library Library resources Metadata Semantics Information aggregation Optimization

〔分类号〕G258.6;TP311.13

* 本文系国家社科基金项目“用户信息素养教育与信息消费能力长效互动机制研究”(项目编号:13XTQ002)研究成果。

〔作者简介〕马灿(1974-),女,馆员,发表核心文章10余篇,研究方向:数字化信息服务。

猜你喜欢

馆藏资源元数据高校图书馆
基于来源的组织机构元数据构建研究
元数据与社会化标签在微视频搜索中的应用
高等院校智慧校园建设规划与实现
高职院校图书馆馆藏资源建设刍议
按需出版模式下图书馆馆藏结构优化研究
高校图书馆阅读推广案例分析
微信公众平台在高校图书馆信息服务中的应用研究
高校图书馆阅读推广实践探讨
高校图书馆电子资源的宣传与推广
归档网络信息价值判断的元数据描述研究综述