面向学科服务的机构知识库建设与应用*
2018-03-25徐晨琛
徐晨琛
(华中师范大学图书馆,湖北 武汉 430079)
1 机构知识库与学科服务
随着用户信息环境、信息需求、信息行为的变化,学科服务从过去的以文献检索获取为中心的服务,到现在的以个性化设计、知识化服务为中心的学科情报服务,呈现出蓬勃发展之势。现有学科服务实际效果如何,如何创新服务模式,如何拓展服务深度,是当今高校图书馆需要思考的问题。
近年来,机构知识库蓬勃发展并被大学图书馆广泛关注。机构知识库(Institutional Repository,IR)源于开放获取运动(Open Access)。国内外学者从资源和服务的角度对机构知识库给出了不同的定义。综合国内外学者的观点,笔者认为,机构知识库是一个机构为方便学术资源的开放存取,促进机构内部和外部的学术知识交流,利用计算机和网络技术而构建的用于提交、储存和管理来自机构内部或外部的知识成果,并提供服务的一种数字化信息资源的集合。机构知识库是研究机构实施知识管理的工具,在提高机构的智力资产信息化管理水平、增强知识的流通、提升科研活动效率等方面表现出了很大的优势。因此,机构知识库也为图书馆学科服务提供了有力的平台和工具。基于此,笔者以学科服务需求为导向,研究面向学科服务的机构知识库的建设和应用策略。
2 建设机构知识库的必要性
2.1 获取学科信息的需要
互联网时代,信息环境日新月异,信息用户面临的问题不再是信息太少,而是信息太多。数量巨大、纷繁复杂的信息使得用户在搜集和筛选信息的过程中面临诸多困难。因此,快速高效地获得高质量的学科信息成为学科用户的首要需求。
2.2 个人成果及文献管理需要
教师需要一个稳定的平台来管理个人成果,不仅能够方便查询个人成果的收录、引用及影响力等信息,还能够搭建一个学术交流平台,使其通过交流获取所在研究领域的最新成果和发展趋势[1]。
2.3 科研成果统计与分析的需要
科研成果统计是高校科研管理部门的一项重点工作。随着科研成果数量的增加,科研成果分析与评价机制不断走向科学化、规范化,迫切需要科研管理者准确而详实地掌握本机构的科研成果数量[2],并通过一系列指标进行机构成果的统计分析等工作。
2.4 图书馆馆员价值体现
馆员为教师和学生提供学科服务,需要有快速全面的资源搜索和获取平台,需要对推送给用户的资源进行过滤、分类和整合。同时,图书馆员还具有强烈的被尊重和认可的需求,图书馆员是馆藏增值的创造者,同样的资源,不同业务水平的馆员为用户提供的价值是不一样的[3]。因此,学科服务平台的建设同样需要关注馆员的需求,体现图书馆员价值的自我实现。
因此,面向学科服务的机构知识库建设,不仅需要整合各类学科信息和机构成果,还要能为教学、科研、管理决策提供服务,凸显图书馆的服务价值。
3 面向学科服务的机构知识库建设
3.1 建设模式和平台结构
为提高建设效率,可以采用外包开发的模式,由图书馆根据用户需求提出功能要求,由第三方公司进行平台设计和开发。平台的建设以学科服务为导向,提供学科资源导航,助力用户的教学、科研、管理决策、学习等。平台功能应尽可能完备,并具有一定的扩展性。
大数据环境下高校图书馆学科服务体系,要求面向学科提供知识服务具有开放性,层次结构简单,能够对各种学科知识资源进行管理、存储与共享,并且创建集成多重服务的信息环境。因此,面向学科服务的机构知识库将多种服务和资源集成于云平台上,以云服务的方式为用户提供服务,将互联网作为一台超级计算机,利用它完成各项计算任务,然后对信息进行加工处理与传递。平台用户通过云端服务器,访问和利用云平台资源和服务,如图1所示。
图1 机构知识库平台网络结构
平台技术架构方面,采用服务器集群、反向代理机制与负载均衡应用,数据存储与前端应用分离。系统采用面向对象设计与模块化开发程序,利用缓存技术,提高数据运行效率,保障系统的稳定性和安全性。
3.2 平台功能模块设计
机构知识库平台的建设充分考虑学科用户需求,整合学科资源和机构成果,从学科网站、个人云空间、机构云空间3个维度来构建机构知识库平台(如图2所示)。学科网站整合学科信息,提供一站式查询和检索;个人云空间为教师提供成果管理、成果展示、成果分析、个性化订阅和推送等服务;机构云空间提供机构成果检索、统计分析、展示等功能。三者各自独立又相互联系,共同构成机构知识库服务平台。
图2 机构知识库服务平台功能模块
3.3 学科网站
通过对学科资源的分类整合,构建学科网站,实现学科领域知识的聚类和导航服务,帮助用户方便、快捷地获取与教学和科研相关的专业学术资源和学科知识信息。学科网站的构建主要考虑以下几个方面的内容。
(1)信息内容和展示。学科网站以学科(院系)为单位建设,将图书馆馆藏、互联网资源与学院信息进行重新组织和整合,将特定学科领域的信息资源、工具和服务集成到一个整体中。主要资源类型包括资源类、新闻类、知识产品类,其中资源类主要是指整合该学科相关的馆藏资源、OA资源、免费资源、视频资源等;新闻类主要是指该学科的学术动态、学术会议预告、项目基金等;知识产品类主要是指经过智力加工的知识服务产品,如学科分析报告、发文分析、引文分析、热点论文等。除此之外,还可以将对应学科的专家学者信息及学术机构信息也整合进来,为用户提供一个方便、快捷,面向学科的信息检索和服务入口。
(2)质量控制。学科馆员对平台信息资源的质量进行把控。学科馆员应该尽量收集具有权威性的学术组织、学科专家网站、国内外学科机构网站、学术博客等作为学科资源的来源,从而保证构建的学科资源具有利用和保存的价值[4]。部分网络资源由学术搜索机器人自动抓取,推送给学科馆员,再由学科馆员进行信息过滤、筛选、分类、整合、发布和更新。
3.4 个人云空间
教师云空间建设以管理个人成果、获取资源、追踪科研成果为目的,主要考虑以下几个方面的内容。
3.4.1 成果类型和收集方式
成果类型主要包括机构成员的期刊论文、会议论文、著作、专利、项目、奖励等,且其成果应该是数字化可复制的形式,作者授予图书馆享有在机构知识库中保存并传播该成果的权利。
根据以往的建设经验,由教师自己录入的方式容易导致教师参与意愿低的情况,因此应该设计多种成果录入方式。一种是由系统自动抓取机构成果,系统根据用户的真实姓名、所在单位、研究方向等基础信息与科研行为,构建用户的科研学术模型和学术画像,从WOS核心合集、EI、知网、万方等数据库中,根据匹配程度推送给用户进行认领,可单条成果认领或者批量认领。第二种是批量导入,图书馆与科研部或者院系合作,将教师科研成果、项目等进行批量导入,或者由用户自己批量导入。第三种是单篇添加,用户通过输入各种成果类型的基本字段信息、作者信息及全文信息,完成成果添加;用户还可以选择成果权限是否公开,是否将成果提交至机构。
3.4.2 功能设计
考虑到教师具有科研、教学、考核等方面的需求,云空间功能主要包括:
(1)成果管理。可实现成果检索、成果排序(如按照时间、WOS被引频次等排序)、收录情况、成果分析、成果导出等功能。教师和科研人员在职称晋升、项目申请、评奖报奖、年底考核时,需要整理个人或团队学术成果,但因用途和需求类型不同,导致对这些成果重复整理,花费大量的时间和精力。借助云空间的成果管理功能可以帮助教师快速整理其个人成果,按照不同需求进行分类导出,提高工作效率。(2)追踪和定制。根据用户构建的追踪条件,匹配最新或最有学术影响力的论文信息推送给用户;根据用户的科研方向和已经认领的科研成果,推荐最适合用户的期刊。实现期刊推荐、期刊检索和期刊管理等功能。(3)个人主页。用户可以对个人主页上的内容进行编辑,主要包括成果展示和个人简介、教育背景、工作经历、学术兼职等。个人自愿选择将个人成果公开或部分公开至个人主页,个人主页也可以同步到学科网站和机构主页。
个人云空间为教师提供了一个便捷的云存储空间,教师和科研人员可以将自己的个人成果、教学资源、相关文献存储进去,随时取用,从而克服各部门及个人分散保存信息的弊端,提高管理效率。
3.5 机构云空间
基于教师个人成果的录入,以机构为粒度对资源进行重新组织,通过构建机构词表,采用机器和人工处理的方式,对机构所有的成果进行采集、清洗、入库和利用,实现机构成果检索、数据统计等功能。对机构名称的变种名、曾用名、书写错误等进行全方位识别,院系数据归属采用人工精准划分方式,实现机构成果收集和管理的自动化,辅助机构保存和管理自有成果。通过机构主页展示和传播机构的科研产出、科研实力,使之成为内外部学术交流的重要平台。
(1)检索功能。可对科研成果、专家学者进行快速检索查找,科研成果可分期刊论文、会议论文、著作、专利、项目、奖励等进行分类检索。
(2)数据统计和分析。实现对机构数据的统计和分析,是深度开发、利用机构知识库的基础。数据的统计主要包括:机构成果的统计、院系成果统计、个人成果统计等。具体而言,可以从成果类型、年度总量、收录情况、ESI学科类别、语种、机构署名情况、院系归属、发表的期刊分布等多维度进行细分统计,同时支持成果字段筛选导出,从而可以生成各种类型的统计分析报表。基于各类统计数据,还可以进行深度的数据分析。如ESI学科分析、ESI学科竞争力分析、ESI高水平论文分析、ESI优势及潜力学科论文分析、本校ESI论文分析等,为机构学科建设和管理决策提供依据。
(3)机构主页。机构主页展示机构成果和学者信息,实现数据导航、数据检索、数据统计等功能。教师可自愿选择将其个人主页同步到机构主页。
机构云空间在承担知识存储的同时,也是展示和传播机构和个人科研产出与科研实力、进行内外部学术交流的重要平台。机构知识库存档的数据能够被搜索引擎发现和收割,利于存档成果在全球互联网上被发现、被获取和被利用。提高机构学者、学术成果的曝光度和利用率,从而提高机构影响力。借助互联网和机构联盟的优势,实现新的学术交流方式,实现知识的传播和再利用。
3.6 管理员后台
管理员后台主要功能包括数据的审核和处理、数据的推送、学科网站的维护、权限的管理等。不同学科的学科馆员负责各自对口学院的平台管理和服务。内嵌的学术搜索机器人根据教师的订阅或是从教师论文、项目中自动抓取关键词,搜索相关学术成果、学术会议、科研项目、人名(潜在的合作伙伴)等信息,推送给学科馆员,由学科馆员进行过滤和筛选,推送给教师及对应的学科网站。
4 机构知识库应用对策
机构知识库为图书馆学科服务提供了平台和工具,如何吸引教师创作内容而不增加教师的负担,如何让学生有效利用学科网站的信息,学科馆员如何为全院教师提供深入的、个性化的服务,要解决这些问题,需要建立相应的运行和推广机制,将服务落到实处。
4.1 组建图书馆学科服务团队
组建学科服务团队,按照纵向和横向进行分工,纵向按照不同的学科分为文学、理学、工学、管理学等学科团队,每个院系按照学科分类由不同的学科团队负责,每个院系设一个主要负责馆员,负责该学院学科服务;横向按照服务内容,分为信息素养小组、院系联络小组、资源建设小组、情报服务小组等,负责各项服务内容、服务模式的规划和指导等。机构知识库服务平台基于学科馆员的学科分工,每个团队(学科馆员)对各自院系学科网站和教师云空间负责,负责平台的内容建设、管理、更新、维护、推送等。
4.2 自上而下的宣传和推广
通过各种方式宣传机构知识库优势,推广机构知识库服务。如通过自上而下的方法,以学校领导、院系领导、资深教授等作为首先宣传推广的对象,激发他们对机构知识库的认同和支持,进而在全校范围起到带头和引领作用。可先选择院系的一名教师,如院长或知名教授等,由学科馆员为其进行教师云空间的内容建设,以此为范例在全院进行宣传和推广;教师亦可授权或指派其硕博士研究生,协助其建立教师云空间。定期开展学科网站的宣传和推广活动,让学科网站成为学生、老师获取学科信息的重要来源。
4.3 基于机构知识库拓展图书馆服务
(1)为学术评价提供数据支持。机构知识库平台支持机构成果多维度细分统计,可以按照院系、作者、年度变化、发文期刊、收录情况、机构署名等维度进行统计分析,帮助科研管理人员生成机构成果统计分析报表。基于对各种收录情况的统计和分析,如SCI/SSCI/A&HCI/CSSCI/EI等,可以从个人、学院、机构等不同层面进行数据统计和学术评价,对科研人员引进、考核、学科建设、机构排名等提供定量决策依据。
(2)为学科分析与预测提供数据。对于高校或者科研机构的决策者来说,他们除了关注评价数据,更加关注机构与各学科未来的发展与规划相关的信息。如哪些是其优势学科需要加大建设力度?哪些学科在全球处于上升趋势而本身非常薄弱?哪些学科需要压缩或者向交叉方向发展等前瞻性和预测性的信息。传统的从数据库直接导出的数据是针对学科或者主题进行分析,这种学科或主题分类与机构的学科设置不一定能够完全对应[5]。而基于机构知识库平台,可以以院系为单位进行数据统计,对重要成果(如SCI/SSCI/ESI等)优先分析,全部数据以分析说明加可视化分析图谱的形式展示,发现本校优势学科、潜力学科,帮助学校管理层有重点地建设学校一流学科,更加合理高效地进行资源和资金的配置。