APP下载

新形势下高校机构知识库的功能设计与实现

2019-03-24曹思思2

中华医学图书情报杂志 2019年11期
关键词:知识库学者成果

史 磊,曹思思2,裴 丽

机构知识库(Institutional Repositories,IR)又称机构典藏库、机构仓储等,是利用现代信息技术建立的一种可持续的资源仓储和知识共享空间。机构知识库允许所有研究者参与其中,能够提升机构学术成果的可见度和传播力,在学术交流和共享中产生了积极变革和创新[1-2]。随着我国高等教育的发展及学术环境的改变,高校机构知识库建设和服务面临持续发展的瓶颈。

2015年起,国务院、教育部等部门相继发布了《统筹推进世界一流大学和一流学科建设总体方案》[3]《关于实施一流本科专业建设“双万计划”的通知》[4]。2017年,黑龙江中医药大学(以下简称“我校”)成为全国获评“A+”的3所中医药院校之一[5]。高等教育新形势对我校的学科专业、学术环境、成果收集管理等方面的建设提出了更高要求,而学科化服务需要有充分的元数据知识仓储机构知识库作为底层数据来保障。因此,本文在我校机构知识库建设实践工作基础上,总结了项目建设的经验与体会,为新形势下高校机构知识库的建设提供借鉴与参考。

1 高校机构知识库建设现状与存在问题

1.1 建设现状

1.1.1 以资源存储为中心的机构知识库

国内机构知识库相关研究最早见于2004年。初期的机构知识库主要是在机构成果收藏和图书馆资源建设的影响下,以开放获取为目标发展起来的一种机构资源仓储[6]。该类型机构知识库以资源为主体,强调资源的重要作用。图书馆关注的是资源的收和藏,主要对机构成员的成果进行收集、存储、管理,即内容的收集和组织完全由图书馆主导制定,用户只是被动地接受图书馆提供的资源和服务。2006年,厦门大学学术典藏库投入使用,主要用来长期保存和管理厦门大学教职工的学术著作、期刊论文、毕业论文、工作文稿等具有学术价值的成果,为该类型机构知识库的代表。

1.1.2 以用户需求为中心的机构知识库

2013年,高校机构知识库研究的数量和质量均取得了一定的进展,其建设理念逐渐从以资源存储为中心转向以用户需求为中心。以用户需求为中心的机构知识库是一种主动化的机构知识库构建模式,即在成果收集和资源建设的同时,进行基于用户需求的资源和服务重构。机构知识库设计和运行完全从用户信息行为和需求出发,不仅强调用户的主观能动性,同时也关注挖掘用户的潜在需求,指导机构资源的深层开发,将加工过的知识化产物提供给用户,实现服务内容的知识化。北京科技大学、福州大学等以基于需求的机构知识库信息服务为目标,进行了机构知识库系统的建设实践[7-11];东南大学情报科学技术研究所[12]则以学科用户的需求为导向进行学科机构知识库的建设实践,在高校机构知识库发展中具有一定的前瞻性。

1.1.3 以学科建设为中心的机构知识库

近3年,随着国家对一流学科、一流专业建设工作的部署和要求,高校图书馆相继参与到学校的学科专业建设中。高校机构知识库经过不断发展,已经具备了学科相关的资源和数据,嵌入学科的机构知识库构建模式应运而生。嵌入学科建设的机构知识库,一方面可按照教育部学科分类、ESI学科分类等不同的分类体系,对基础数据进行分析,完成定制化学科分析评价报告,为学校学科建设与人才引进等重要决策提供数据支撑;另一方面可促进图书馆的服务转型,拓展服务领域,为学科服务提供先进技术支持,利于学科馆员以学科机构知识库为抓手开展基于不同学科和用户群体的多层次服务。如华中师范大学、西安交通大学等根据学科建设需求进行机构知识库建设[13-15];徐春等[16]结合中国药科大学药学学科特色,分析药学学科知识库联盟的构建模式,提出“双一流”背景下构建药学学科知识库联盟;山东理工大学图书馆创新性地提出基于机构知识库系统构建学科决策智库[17]。

1.2 存在问题

1.2.1 学者数据清洗不彻底

很多高校机构知识库的建设表面上看无误,但在基础数据方面,因学术成果机构地址不规范、机构拆分合并、同名学者、作者缩写等成果出版时存在的问题造成数据清洗不彻底,致使机构库收录成果出现错漏;或因只收集机构知名人员名单,按名单做学者库(并不能代表机构的全体人员和实力),致使机构知识库成为并不实用的“花架子”。另外,由于后期数据更新维护机制不完善,需要图书馆和用户投入大量人力物力进行成果的认领,导致机构知识库的建设难以延续,很难为用户提供有效服务。

1.2.2 资源与知识组织单一

资源是机构知识库的基石。随着学术环境的改变,用户对资源的需求也发生了改变。当前,机构知识库的资源类型多为期刊论文、会议论文和学位论文等,而学习笔记、科学数据、教学课件、多媒体等隐性资源较少,难以满足e-Science环境下科学研究的需要。知识组织方面,更多注重数字对象本身的表面联系,而忽视了隐含知识的组织和关联,缺乏对知识间关联关系的挖掘,最终阻碍了机构知识库知识再创造价值的实现[18]。

1.2.3 服务难以满足学科建设需求

目前,高校机构知识库多集中于资源存储和满足用户个体的需求。随着“双一流”“双万计划”等系统工程的启动,各高校逐渐将工作重心转向学科专业建设,迫切需要基于学科专业建设的个性化机构知识库。因此,高校机构知识库建设应更多关注学科资源的集成以及学科资源知识化的挖掘和开发,发挥机构知识库的资源和技术优势,利用机构知识库开展学科服务。同时,实现与高校其他系统的互联互通,为用户提供高效率服务。

1.2.4 学术交流共享空间理念缺乏

在大数据、人工智能等新环境下,用户信息交互空间的构建对于机构知识库的发展和应用日益重要[19]。现有机构知识库只是通过资源集成实现数字内容的整合和可视化,因缺乏线上交流、学科讨论组等学术互动交流功能的支持和缺乏学者个人空间、团队研究空间等个性化空间而难以实现用户的个性化标引、收藏、推荐、编辑、发布等,同时因没有激活图书馆员与用户间的互动而直接影响了机构知识库学术资源的实时更新[20]。

1.2.5 知识产权问题凸显

机构知识库在收集学术成果并对其他用户开放成果的复制权、传播权时能否保护原创者的知识产权是用户的关注点[21],因此学者成果的版权许可成为影响机构知识库发展的瓶颈之一。国外有学者对如何解决机构知识库内容获取与版权间的矛盾进行了讨论,指出机构知识库应当遵循法律的规定,对于被版权许可的对象,在重用知识对象时,需要声明作者的版权。建议图书馆采用相应的策略和技巧实施内容获取的管理,并制定机构知识库用户资源的获取政策[22-23]。

2 黑龙江中医药大学机构知识库的设计与实践

2.1 平台的建设内容及目标

黑龙江中医药大学机构知识库基于我校教职工学术成果,建设内容主要体现在成果收集与维护、IR门户、知识服务、系统管理、学科服务、学术社区6个模块,实现学术成果存储、学术资源集成与共享、用户信息交互、知识发现、学科服务等功能。黑龙江中医药大学机构知识库建设的总体目标分为两方面。

机构可通过对其人员的学术成果的统一分类、标引、加工与存储、长期管理与保存,有效保证机构资源的完整性和安全性;通过对底层数据的分析,形成人、出版物、教学科研数据的关联模型,从而全面系统地反映机构的教学和科研成果;通过对数据的分析与评价,实现科学的绩效管理。

学者可通过对机构学者成果的集中展示,增加成果的可见度,提高学术成果的阅读率和被引数,从而提高学者的学术影响力。通过对成果的统一管理与永久保存,便于学者对个人成果进行管理与积累,可见证其在不同阶段的学术历程。

2.2 系统的设计与实现

2.2.1 系统技术架构

我校机构知识库运用Hadoop 2.0分布式技术与HTML 5技术实现平台海量数据的清洗和存储、内容管理、资源与信息的自动化和多媒体化、用户与文档的交互方式等核心功能。机构知识库系统整体架构如图1所示。

2.2.2 系统工作流程

数据清洗:利用脚本化数据格式分析技术和目前已知的大多数格式数据的清洗功能,并将其统一翻译成系统可识别的RefWorks数据格式。同时,通过数据去重、分辨第一机构和通讯机构、社会网络、学术迁徙等方法,以及自动匹配和管理员认领,将成果逐篇指定到学者名下。

数据报送:用户可以选用数据报送功能(需要数据来源的版权授权),云端会定期自动将用户关注的特色来源数据推送到机构知识库本地服务器。

项目管理:机构知识库系统提供接入对应的接口,实现对用户各类型项目的统一储存和管理,最终实现各类型项目数据的一站式储存、分析和挖掘,以图表形式对项目信息进行知识发现。

2.2.3 系统建设难点及解决方案

机构知识库建设初期,数据清洗和规范是核心问题,它直接影响机构知识库的健康运行和持续发展。部分机构知识库系统无法将采集的数据准确分配到正确的高校-二级学院(附属医院)—学系(临床科室)-个人,其原因主要包括收录文献数据库中的机构成果描述不规范,署名单位不规范,同机构多头衔,地址笔误和错漏,同姓名的不同作者,不同姓名英文缩写相同的不同作者,频繁跳槽的学者(学术迁徙)。

为解决这一技术难题,我校机构知识库采用人工智能和机器算法实现数据采集、清洗、归类合并、认领等流程的智能化和自动化。

图1 黑龙江中医药大学机构知识库系统架构

从成果中提取机构和二级机构异名,生成机构成果算法,系统自动筛选和判别各级机构的成果,对系统自动抓取的成果数据同馆员或用户手动导入的数据进行自动去重、标引和有效性检测等。在标引过程中,相应数据标引至对应数据库记录的详细内容页,同一成果数据可有多种数据库标引归属。

系统具备完善的字典管理功能,机构名称支持曾用名和机构名称缩写及其各种变化情况,学者姓名支持简称、全称等各种情况,精确区分同名学者。

系统可对不同来源的同一成果和对同一学者的同一成果进行自动去重,同时支持对英文成果等自定义字段进行去重。

2.3 机构知识库功能实现

我校机构知识库以“双一流”建设等为核心,构建了集资源存储、成果保存、知识服务、学科服务等功能于一体的系统。机构知识库功能如图2所示。

2.3.1 构建长期保存体系,实现资源开放获取

我校机构知识库在设计和建设初期就把长期保存作为一个重要环节来考虑,以避免机构知识库建设走弯路。系统采用开源软件DSpace,从技术层面设定了机构学术资源的长期保存策略。未来还将利用云技术推动机构知识库资源的长期保存向“云端”发展,建立完善机构知识库长期保存和资源获取机制,促进我校学术资源的开放获取。

2.3.2 多层次收集分散数据,构建机构资源仓储

我校机构知识库利用系统的技术优势收集个人用户和团队用户的资源和成果。支持系统自动抓取个人成果,并按照成果收录情况、被引频次等定期推送给个人用户,由用户进行认领,最后系统按照成果类型分类,自动存储至学者空间,提高了用户的各类报奖、项目申报等工作的效率。支持团队成员将之前个人的文献、研究生论文、实验方案、实验记录、开题报告等进行分类集成和保存,提高学科团队的科研产出能力,实现学科团队成果的积累和传承。

2.3.3 多角度展示机构成果,构建学术知识图谱

我校机构知识库支持开通学者个人空间,多角度展示其学术轨迹、H指数、成果被引情况、历年成果趋势等,展示学者ORCID、Researcher ID等信息,建立学者个人科研ID数据库,并可通过设置权限对个人成果进行展示和分享。系统通过可视化、聚类关联等技术对机构、学者与成果进行关联分析,构建学者与机构、学者与研究领域等各类关系间的关系图谱,多角度展示机构成果,扩大个人和机构的学术影响力。

图2 黑龙江中医药大学机构知识库功能

2.3.4 构建网络学术社区,促进学术交流共享

我校机构知识库借鉴“小木虫”“丁香园”等网络社区的形式,构建了基于用户互助模式的机构知识库。系统为用户提供学术朋友圈、在线交流、评论、关注、直播等方式,促进学术活动中学者间的交流和互助,节约学术研究的成本,提升学术研究的工作效率。系统支持用户查看本机构学者通讯录,浏览学者个人空间,关注科研动态,根据学者本人设置的浏览权限可查看其学术博文、科研笔记等学术资源,实现对学者及其研究领域的持续关注。

2.3.5 整合学科资源,构建学科知识服务体系

为保障将我校中药学等优势学科建设成为国家一流学科,我校机构知识库设计了学科服务模块进行学科建设的资源和服务保障。学科服务模块集成了学术搜索、引文库等资源获取和学术评价工具,系统会根据用户的需求找到所需的相关知识,在发现和挖掘论文及其引文方面为用户提供集成式增值服务,为学者及其团队提供决策支持。系统在对图书馆现有资源进行整合的基础上,建设重点学科特色资源库、开放获取学术期刊库、科研基金知识库等特色资源,构建一个资源、知识和服务的“融创系统”。

3 结语

我校图书馆在机构知识库建设方面进行了实践探索,在成果收藏、资源整合、知识服务等方面积累了一些经验。未来的工作中,希望在“双一流”“双万计划”等高等教育新形势下,通过保障学科和专业建设、针对重点学科和专业开展个性化服务、构建智慧化校园等继续加强我校机构机构知识库的建设,以此进一步完善机构知识库的建设与发展,提升新形势下图书馆的服务水平。

开放获取全球化大潮汹涌澎湃,我国高等教育“双一流”“双万计划”等系统工程不断深入。在此背景下,如何整合、管理和利用智力资源助力高校教学科研的创新和发展是我国高等教育界亟待解决的问题。机构知识库凭借其强大的数据、资源和技术优势,为解决上述问题提供了解决方案。我校运用先进的数据处理和媒体交互技术,以学科服务为导向,构建了一个集成果收集和管理、数据挖掘、资源共享、知识发现、学科服务、学术社交于一体的知识化、智能化机构知识库,展示学校学科建设和人才培养特色,充分发挥图书馆专业化、知识化、特色化的信息服务职能,为高校机构知识库建设实践提供参考。

猜你喜欢

知识库学者成果
学者介绍
学者简介
汉语近义词辨析知识库构建研究
学者介绍
验收成果
工大成果
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
“健康照明”成果聚焦
学者介绍
“三医联动”扩大医改成果