构建以科研管理为导向的医院机构知识库
2020-01-06
机构知识库(Institutional Repository,IR)又称机构库、机构仓储、机构典藏库,指以学术机构为主体建立、搜集及存储该机构内成员创造的包括学术论文、会议报告、多媒体资源等各类知识资源,并提供公开检索及利用的数字知识库[1]。在2002年首次提出机构知识库概念的学术出版与学术资源联盟(Scholarly Publishing and Academic Resources Coalition,SPARC)高级顾问Raym Crow认为,机构知识库是学术机构为捕获并保存本机构的智力成果而建立的数字资源仓库[2];Clifford A.Lynch则认为,一个学术机构的机构知识库是机构为科研教学人员所提供的一系列服务,服务的目的是管理和发布由本机构及其成员所创造的数字资源[3]。不管从资源角度还是从服务角度来说,机构知识库都是一个机构重要的知识管理工具。当前机构知识库大多局限于成果保存和展示等方面,与科研管理系统的衔接和协作方面几乎是空白的。结合医院科研管理的电子化、系统化需求,机构知识库可积极融入科研管理的各个阶段,通过拓展数据库功能,为研究人员提供科研辅助,为科研管理人员提供数据支撑,为医院管理者提供决策参考,使其成为医院科研管理的重要工具[4]。
1 构建广东省中医院机构知识库的必要性与意义
1.1 构建医院机构知识库的必要性
广东省中医院(下文简称“我院”)作为全国最大的中医院之一,有着中医系统内数量最多的重点专科/学科,以及一大批名中医、专家、学者,每年有大量论文、基金、专著、专利等,但是医院这些宝贵的知识财富尚未得到很好的传播、推广和应用;同时我院每年也在积极申报各级别重点专科、重点实验室、诊疗中心等,为广州中医药大学“双一流”建设添砖加瓦。因此,需要对自己和竞争对手的科研实力有所掌握和比较。此外,我院科研管理任务繁重,包括职称的申报审批,项目的审批和检查、验收,论文、专著、专利、奖项的收集和奖励,每年还要根据自定的评估指标体系对各个科室、团队进行科研绩效评估,这些工作需要耗费大量人力和物力。为了方便获取、保存、管理、利用本机构的智力成果,为本机构科研人员的绩效评估及学术交流提供重要参考来源,以科研管理为导向构建广东省中医院机构知识库极为必要。
1.2 构建医院机构知识库的意义
1.2.1 保存和管理数据的数字仓储
机构知识库可以长期保存院内文章、专著、专利、标准等各项成果,保存名医经验、手术视频、实验报告和学者上传的个人数据,如笔记、课件、实验数据、科研进展报告、病例报告等。数据库支持多媒体数据格式,成果可以是文档、超链接、图片、视频等形式。
1.2.2 科研管理和绩效评估的工具
机构知识库包含了项目管理、人员管理、成果管理、奖励管理等科研管理的功能,可提升科研管理与评价的效率。如院内学者申报职称、申请项目时及各种需要奖励成果的列表可以直接从机构知识库获取其成果列表,省去多次提交和审核的繁琐。另外我院每年都要对各科室、团队进行科研绩效评估,不同类型和级别的成果按我院自行制定的评分体系有不同的分值和权重。利用机构知识库节省了提交、审核成果的麻烦,让绩效评估工作变得简单快捷,还能减少遗漏、错误和纠纷。实践证明,通过机构知识库进行科研服务可节省工作量,而且能降低错误率[5]。
1.2.3 展示、交流和学习的平台
机构知识库打破了“信息孤岛”,能让大家了解院内各学科研究的发展水平、趋势、重点、热点、合作作者和机构,为自己的学习、研究、合作对象的选取提供一定的参考,大大促进了院内人员的学术交流及人才队伍的建设和学术水平的提高。
1.2.4 学科建设和“双一流”建设的依据
为振兴中医药发展、推动中医药现代化和信息化,我国加强了对中医药院校及其附属医院的建设和投入,建立了临床研究基地,将中医药学科纳入国家“双一流”建设,设立重点学科和重点专科[6]。机构知识库在保证学科团队和学者的科研成果得到有效管理和利用的同时,也能准确地定性、定量评估本机构的学术水平,以及与其他竞争对手进行比较,为学科建设、管理决策提供参考。
2 广东省中医院机构知识库的构建设想
我院机构知识库的建设遵循以科研管理为导向,层级结构清晰、功能完备、可扩展等原则[7]。在充分进行管理和技术需求评估的前提下,以开发系统接口方式,将机构知识库与科研管理信息系统进行整合,将原有机构知识库及科研管理系统下的不同功能模块定义为服务;通过网络对松散耦合的粗粒度功能服务模块进行整合、使用;通过将科研管理系统嵌入机构知识库,实现围绕项目工作流、信息内容驱动的机构知识库管理、科室分析、学科建设、知识图谱、机构学者、个人知识中心等管理功能。
2.1 系统架构
系统架构主要包括数据采集层、数据处理层、数据仓储层、功能应用层、界面展示层(图1)。
图1 医院机构知识库系统架构
2.1.1 数据采集层
数据标准以《GB/T 25100-2010 信息与文献、都柏林核心元数据元素集》等为基础,参考科技部、国家图书馆等机构发布的相关元数据规范;数据采集方式主要包括数据库公司抓取、管理员录入和作者主动缴存。
2.1.2 数据处理层
依托数据库公司的资源,对文献进行回溯与更新,以“自动+人工辅助”的方式对文献进行规范化的数据加工和处理。对元数据的收集、清洗、整合与增补包括文献回溯与更新、数据筛选与剔重、不同数据库来源的元数据的匹配、字段的增补与二次开发(对文献评价的辅助信息进行增补以及对文献内容进行人工标引),辅助信息及人工标引包含全文链接、中科院大小分区、JCR分区、影响因子及区间分段、成果评分赋值字段等。系统支持管理员自定义元数据的描述,即字段的标引。
2.1.3 数据存储层
数据仓储主要保存文献数据(主要提供检索、统计等服务)、用户数据(主要保存用户和验证权限等)和日志数据(主要保存系统运行日志、用户纠错记录等)3种数据。
2.1.4 功能应用层
功能应用层主要用于界面展示层和数据仓储层的数据组织和使用,主要包括机构成果模块、科室分析模块、学科建设模块、知识图谱模块、机构学者模块、个人中心模块6个功能模块。
2.1.4.1 机构成果模块
机构成果模块展示机构内所有员工的各种成果,包括论文、专著、专利、成果、精品课程、新药、标准(下分标准、指南、诊疗方案)、科研项目、科研奖项等。建立以题名、作者、关键词、期刊为检索字段的快速检索框,并实现以成果类型、时间、作者(下分第一作者、通讯作者、全部作者)、语种、期刊名称、文献类型、合作作者、合作机构、国家及地区、重要成果(下分热点论文、高被引论文)、学科、中科院分区、JCR分区、影响因子分段、收录情况(SCIE、MEDLINE、CA、SSCI、EI、ESCI、A&HCI、ISR、CPCI(含原ISTP和原ISSHP)、CSCD、北大核心、ESSCI、中国科技核心期刊目录自然科学卷和社会科学卷)等为检索字段的二次检索。每项成果后显示按我院科研绩效评估体系给予的分值。检索结果可通过点击字段名按时间、被引频次、下载数自动排序,可选中并以题录形式导出,导出字段可以自由勾选。
2.1.4.2 科室分析模块
广东省中医院有5个院区和3个分门诊,包括几百个大小科室、研究团队。机构知识库根据我院实际情况提供按院区、大科、小科(包括所有团队)分类的导航,为所有科室建立主页。首页显示科室团队简介、人员(名字链接到个人主页),并由负责人进行信息维护;以数字显示科室发文(按收录情况)、专著、新药、专利、成果、标准、获得奖励和基金情况等,点击数字会显示具体成果列表;在各项成果题名后增加显示科研评估分值的字段。在统计页面提供人员职称统计图,各个类型成果的产出趋势图,成果类型、收录情况、研究主题和文献类型的分布统计图,发表期刊top10、被引频次top10、研究人员产出top10的统计图,关键词、主题词云图,合作机构、合作作者网状图等;能够选择不同年份进行统计,并且图可以下载。此外还提供院区、大科、小科(包括所有团队)的对比分析,可对多个同级或者不同级的科室成果进行多角度的对比分析。所有科室名称后设置汇总分值计算按钮和对比按钮,可一键计算科研绩效分值以及勾选科室后加入对比。
2.1.4.3 学科建设模块
学科建设模块提供了所有学科的导航,为所有学科建立的学科主页能显示学科简介、人员(名字链接到学者个人主页),由学科负责人进行信息维护。学科建设模块以数字显示学科发文(按收录情况)、专著、新药、专利、标准、科研奖项、科研项目、精品课程等,点击数字将显示具体成果列表,在统计页面提供类似上述科室分析模块的常用功能。“双一流”高校建设的核心是学科建设,机构知识库除了展示学科技术、人才、成果等外,还可与对标机构进行竞争情报分析,实现学科动态预警[8]。
2.1.4.4 知识图谱模块
知识图谱模块对机构知识库中的资源进行多维度统计,提供详尽、直观的统计结果,医院成果类型分布、语种分布、收录情况分布、研究主题分布、文献类型分布的统计图,各类型成果产出的趋势图,机构学科规范化的学术影响力趋势图,论文期刊分布top20、被引频次top20、下属机构产出top20、学科产出top10、研究人员产出top20统计图,关键词云图,主题词云图,合作机构网状图,合作作者网状图,词频共现关系图谱。机构的知识图谱能够选择不同年份进行统计,且图可以下载;能够可视化地说明本机构谁在做什么、有无特色、是否重复、与谁合作等。利用本机构图谱与全领域知识图谱、竞争对手知识图谱等的比较分析,可以找到自己的竞争优势和劣势、研究空白,发现潜在的竞争对手和合作机会,还可利用知识图谱进行科研布局规划和提出学科建设策略[9]。
2.1.4.5 机构学者模块
机构学者模块提供以姓名、工号、ORCID为检索字段的快速检索框。左侧纵向以科室为分类的导航栏,右侧横向以姓氏首字母为检索字段的导航栏。因我院一名学者可以隶属于多个科室/团队,以及存在同名、更换科室的情况,这些字段信息需要对接人事系统并及时更新。为所有学者建立学者主页,包括在职的学者以及退休的专家,显示学者简介、研究方向、所属科室或团队、H指数,学者可自行修改个人信息、提交和认领成果。以数字显示学者各类成果,点击数字将显示具体成果列表,在各项成果题名后增加显示科研评估分值的字段。所有学者名字后设置汇总分值的计算按钮和对比按钮,可一键计算科研绩效分值以及勾选学者后加入对比。在统计页面还提供类似其他模块的常用统计分析功能。
2.1.4.6 个人中心模块
个人中心模块可以修改并保存个人基本信息,上传、认领、撤回个人成果,支持各类型格式的数字资源;提供存储空间,支持个人上传并存储学术论文、科研进展报告、技术报告、硕博士论文、实验数据等其他灰色文献,以及未发表的数据,如临床医生自己的个人数据、手术视频、特殊病历分析等,可以自行设置不同开放权限。个人中心模块设置有打印报告模板,个人用户可在个人中心模块中进行文献的收录证明、个人论文产出报告、职称申报报告、部门产出报告、医院年度产出报告等的打印。医院学者群体,每年都要向不同职能部门提交各种数据,是重复劳动且与科研关系不大。机构知识库可以简化这一工作,实现“一次提交,数据通用”的功能。此外,为了减轻学者录入数据的工作量,对机构知识库进行数据爬取,学者仅需认领少量不确定的疑似数据及自行上传无法收集到的数据,由管理员进行审核[10]。
2.1.5 界面展示层
界面展示层包括机构库界面、个人界面和科研管理界面以网页的形式对数据进行展示。数据库系统具备可定制化的UI,系统的友好性和功能性强,可根据用户需求进行调整修改。
2.2 系统管理
2.2.1 用户权限管理
由管理员对系统进行平台信息维护、用户权限认证和管理。最高管理员拥有对用户与所有资源的增删改权限,并且可根据组策略为不同用户分配不同的权限。如为图书馆管理员分配成果代认领权限,为科研处管理者分配审核各种提交的报告、评估统计科研绩效的权限等。
2.2.2 数据资源管理
系统的每一个子数据库都具备独立的存储、发布、管理功能。如图书馆管理人员通过定义标引和录入编目,即可对子库内具体成果进行字段增补、检索查找;科研处管理人员通过录入课题信息,即可对课题人员、经费、设备、成果等进行管理。
2.2.3 数据迁移与安全
数据库支持对数据的合并、拆分、批量导入、导出等操作,提供标准OAI数据接口和其他数据交换的接口,支持与医院OA平台、人事管理平台进行数据对接与交换。数据库能实现自动备份或手动备份功能,可以定期进行数据对比检测,及时发现和处理数据错误,保证数据安全。
3 结语
机构知识库在国内高校或科研机构中应用较普遍,在国内医院中还没有被广泛应用,尚处于起步阶段。我院机构知识库的构建无论从内容建设、用户体验还是从知识产权方面来说,都还有很大的改进和完善的空间,在机构知识库中嵌入的科研管理系统也需要进一步完善。
在国际上,机构知识库发展的一个重要趋势便是拓展支撑科研管理方面的服务功能,包括知识管理、知识审计、科研评价、科研项目管理、科研规划等,机构知识库已经成为整个科研管理系统的有机组成部分[11]。我们在构建以科研管理为导向的机构知识库时,既要学习国内外已有经验,也要结合自身情况和需求进行改革创新。建设功能完善的、有特色的、与时俱进的机构知识库,是一项长期而艰巨的任务,还有待深入研究。