基于灰色资源建设的医学机构知识库研究
2024-05-14王红霞汪益
王红霞 汪益
摘要:文章根据医学机构知识库灰色资源建设中存在的问题,提出灰色资源建设的质量控制机制,通过引入区块链技术来加强灰色资源内容建设,对机构知识成果进行再组织与利用,在保证灰色资源质量控制的同时还能黏住用户,拓展机构库的知识服务功能,形成知识成果传播与利用的生态循环链,构建一个可持续发展的共享型机构知识库模型。
关键词:灰色资源;机构知识库;区块链
中图分类号:R197.3;G250.74文献标志码:A文献标志码
0 引言
医学机构在基础研究、临床研究、疾病诊疗等实践中会形成大量优秀的知识成果,这些成果包含多种形式,如传统的期刊论文、会议论文、专著、专利、科研立项书、成果申报报告、影像资料等公开可查的资源,也会有内部期刊、临床实践路径、各类指南、研究报告、博硕士学位论文、一手实验数据、特殊病例或死亡病案讨论分析报告、误诊分析报告、MDT讨论分析报告、某个专题的最新研究动态、某个疾病最新尖端技术报告以及新冠疫情这样的突发事件专题研究等众多种类型的灰色资源。这些灰色资源往往隐匿在医学领域的各个方面,具有针对性、新颖性、隐蔽性等特征。它们不仅具有非常强的专业价值、临床价值以及社会价值,有些甚至比公开发表的资源更具有代表性和专业性。在机构知识库建设中,资源建设是机构知识库建设能否成功的关键要素[1]。灰色资源更是机构知识库建设不可忽视的重要组成部分[2]。机构知识库在保障公开资源建设的同时必须注重灰色资源的搜集、整理和利用,充分发挥其在推动医学发展中的积极作用。
1 机构知识库灰色资源建设现状
1.1 国外研究
国外高校与研究所最初的机构知识库建设主要限于保存研究论文、报告或少部分灰色文献(主要是内部出版物:内刊、报道、会议纪要等)等。随着对研究数据管理和共享的关注不断增加,在这一趋势下,开始加强灰色数据资源的管理,升级和优化传统机构知识库服务功能,如明尼苏达大学 UDC、康奈尔大学 eCommons;同时,一些机构通过构建独立的数据服务平台来实现对灰色资源的长期保存与共享,如伊利诺伊大学厄巴纳香槟分校的Illinois Data Bank、密歇根大学的Deep Blue Data以及普渡大学的PURR[3-5]。
1.2 国内研究
近年来,我国机构知识库数量呈急速增长的趋势,但资源建设未能同步进行[6]。司莉等[5]对高校机构知识库的建设需求做了调研,指出目前机构知识库的功能作用已得到科研人员的广泛认可,但其资源质量的满意度仍不高;邓支青[7]调研显示,目前建成的高校机构知识库大部分是依靠第三方数据库商提供数据建立的相对独立的“重组型”静态数据库,其功能局限于对本机构公开知识成果的收集、整理、保存与检索利用,对灰色资源的资源开发、挖掘和保存严重不足。相对于高校机构知识库,医学机构库的资源类型更少,即便是北京大学医学部機构知识库的资源类型涵盖了20多种,但在官网上可以看到许多资源类型的数量是个位数,这与其学术地位与学术成果是不匹配的[8]。
综上所述,我国无论是高校还是医学机构知识库的灰色资源建设、开发与利用等方面都严重不足。由于灰色资源自身的特殊属性,全面性、安全性、保密性以及患者个人隐私等问题成为制约建设的主要原因。要从根本上解决这些问题,就需要建立完整的灰色资源质量控制机制,通过引入区块链技术的分布式存储、智能合约、共识机制、加密钥匙与隐私保护等手段,可以有效解决用户担忧的全面性、版权问题、个人隐私、长期安全保存、可使用性、可追溯来源性等方面的问题。这些技术的应用不仅有助于提升灰色资源的质量和可信度,还有望促进知识库建设的可持续发展。
2 构建医学机构知识库灰色资源建设的质量控制机制
2.1 学术质量控制机制
灰色资源通常是未公开发表的,来源复杂且种类繁多,缺乏统一的检验标准,缺乏同行专家学者的评审。机构知识库系统管理员很难全方位评估这些资源,如果没有进行质量评估就进行收录和存储,将导致资源繁杂无序,学术质量参差不齐,降低用户对机构库的资源质量的信心。因此,在保障资源数量的同时,应注重学术质量的把控。在收纳灰色资源时,可以结合资源存缴对象的学术背景和资源质量,设定一个相对统一的价值认定标准和评审制度,设置自动查重机制,以保障学术质量的同时防止资源冗余或无效。在做价值认定时,可以根据灰色资源的内容将其分为学术型和应用型,或根据内容质量将其分为科学型、创新型、实用型、一般型等。对于不同的内容和质量可以赋予不同的权重,这些权重可以根据同行专家评价来确定。这样的学术质量控制机制有助于提高机构知识库的整体学术水平,确保用户对资源的信赖。
2.2 元数据质量机制
灰色资源种类繁杂,大都散落在个人手中,通常以自主提交的方式进行资源的存缴。在这个过程中,元数据的质量难以控制,经常出现格式杂乱、有效信息缺失、资源内容和属性不符、拼写错误、数据冗余等问题。根据美国信息标准组织提出的6条原则,元数据标准是要支持互操作、控制使用权限、用内容标准来描述对象、包含使用条款、支持长期保存、具有良好质量[9]。除上述原则外,灰色资源的元数据质量控制还应遵循便捷性、准确性、智能性、可扩展性和用户需求性的原则[10]。基于这些原则和标准,建立一个灵活、简单、便捷、实用、可扩展的元数据库至关重要。元数据的输入可以通过自动选择、手动输入、与语音录入相结合的方式,节省缴存时间。通过元数据库质量控制机制不仅有助于提高元数据的整体质量,也更符合用户的实际需求。
2.3 版权界定和共享机制
灰色资源具有信息含量高、社会价值大等特点。然而,由于这类资源没有对外公开发表过,且流通范围有限,一旦发生剽窃很难被发现和界定,常常会因为怕被侵权而不愿分享,因此对灰色资源的版权保护和界定在机构知识库建设中尤为重要。为确保用户的版权权益,在提交资源时,用户需要通过签署授权协议书和知识共享许可协议来进行法律保障。在授权协议书中,用户需要声明自己所提交的内容不侵犯他人的知识产权和隐私,且不包含国家机密或商业机密;同时为保证资源提供者的合法权益,机构会开通权限设置,允许提交者设置开放对象、时间和范围,同时具有更改权。机构根据现有资源存缴政策、版权法、著作权法等法定规定制定本机构的知识共享许可协议,将缴存成果分为法定共享型、著作权保护原创型、文化保存等,从而有效界定和保护作者、机构、用户的版权范围,降低版权侵权和纠纷的发生。通过版权界定和共享机制有助于维护知识库的合规合法性,能促进资源的共享与利用。
2.4 弹性自存储与即时使用机制
成本因素包括在自存储过程中额外付出的时间和精力,是影响学者存储积极性的主要原因之一[11]。为了克服这一障碍,可以利用新的信息技术来简化存储流程,实现随时随地的弹性存储,加强与各个系统平台之间对接,避免用户重复操作或反复存储同一资源。利用新的信息技术,如可以将用户的电子名片加入微信小程序,用户只需打开微信即可获得自己的学术成果,也可以及时推广自己的学术成果。通过弹性自存储机制与即时使用机制,可在尊重用户成果的同时尊重用户的使用体验,让用户在机构库内可以感受到自我成就的实现感和被尊重感。这样可以有助于降低存储成本,提高学者存储的积极性,并创造更加便捷、高效的学术成果管理体验。
2.5 完善存缴政策,建立激励机制
通过多部门合作,结合项目考核、职称评定等方面,完善存缴政策,给予缴存者配套的奖励机制,同时采取有效的版权保护措施,以确保灰色文献资源长期存缴和保存工作的顺利进行。灰色文献的交存可包括采购、捐赠、呈缴、交换、现场收集、索取、网络检索获取、复制、资源共享等途径。
3 借助区块链技术搭建共享型医学机构知识库平台
3.1 区块链技术与机构知识库建设具有很好的匹配性
区块链原本是比特币等加密货币存储数据的一种独特方式。广义上讲,区块链技术是利用块链式数据结构验证与存储数据、利用分布式节点共识算法生成和更新数据、利用密码学的方式保证数据传输和访问的安全、利用由自动化脚本代码组成的智能合约编程和操作数据的一种全新的分布式基础架构与计算方式[12]。从更宽泛的角度来看,两者都是基于互联网的数据库产物,管理对象涉及分布式存储、长期性、开源性、共享性、再利用性以及安全性等问题,因此区块链技术与机构库建设之间有很好的匹配性。
3.2 区块链的特性为机构知识库灰色资源建设提供的技术支持与保障
运用区块链去中心化技术实现机构库用户自由自主参与成果存储。区块链的分布式账本具有的去中心化特点,意味着网络中任意节点均具有对等的权利和义务,不需要作为可信第三方的硬件或仲裁机构[13]。通过区块链技术构建信任的微环境,打破了传统知识产权时间和空间的限制,让机构库系统中的用户能够放心、自由地在各个节点上传、交换、记录、更新成果,从而解决机构知识库建设过程中的各类资源,尤其是灰色资源收集难题。
运用区块链不可篡改来保障机构库数据信息真实性。区块链是一个链式结构,由一个个的区块根据哈希指针首尾相连,每一个区块一旦形成便不可改变。机构库利用区块链技术让每个成果都添加了唯一性标签,使得只有数据拥有者能够使用自己的私钥对已锁定权限的数据进行修改,从而防止其他人的篡改来保障数据信息的真实性。这样就可以为机构库提供有效的保障措施,确保了数据的不可篡改性。
运用区块链的共享机制与共享账本来确保机构库数据透明性和可溯源性。区块链上所有的数据基于共识机制,保障每个节点共享数据具有有效性及透明的可利用性,从而构建信任基础。机构库用户通过区块链的共识机制获得机构库中高质量的数据资源,并根据使用需求追溯到数据的完整来源。这样不
仅提高了数据的透明度,也增强了机构库用户对数据可信性的信任感。
运用区块链的非对称加密和授权技术来保障机构库的数据安全性。尽管存储在区块链上的信息是公开的,但用户身份信息是经过高度加密的,只有在数据拥有者授权情况下才可以访问,从而保障数据安全性。机构库利用加密技术对审核过的数据进行加密后存储,同时开放权限的控制权交给数据拥有者,使其能够自主选择全部公开、全部加密或仅向部分用户公开等,有效保护用户的知识产权与各类隐私问题。这样不仅保证了数据的安全存储,也尊重了用户对其数据的控制权和隐私权。
运用区块链的智能合约实现机构库与其他多系统的互通。区块链是利用自动化脚本代码组成的智能合约实现自动交易的。在机构库中,数据提供者全部以智能合约的形式写入机构库的网络节点,实现知识成果产权登记、确权、流通和侵权、追溯等功能,同时系统可以自动化地执行预先设定好的规则和条款,实现多系统的数据互通。这样不仅提升了知识成果的管理效率,还使机构库能够更加智能地与其他系统进行协同操作。
3.3 基于区块链技术搭建医学机构知识库模型
区块链的分布式存储与时间链的特性能帮助机构库实现灰色资源长期安全保存与利用。其开源特性不仅可以帮助机构库实现数据汇集、数据挖掘、决策咨询以及知识服务四者之间形成一个知识增值的生态链,还可以自如地与其他系统互通与融合。因此本研究设想建立一个基于区块链技术的医学机构知识库模型以加强机构库的建设(见图1)。该模型的技术构架主要由基础资源层、区块链层、支撑层、应用层、用户层组成。基础资源层涵盖计算、存储等底层资源;区块链层主要包含運维监控管理和区块链全生命周期管理两大块内容,其中区块链全生命周期管理包含元数据存储、用户身份存储、智能合约执行、时间日志、安全密钥、隐私保护、数字认证服务等要素;支撑层是在可信安全执行环境下支撑区块链层与应用层之间进行链上加密、链上授权、链下交换;应用层主要包括数据目录管理、授权管理、数据内容管理、区块链配置管理、交通通道配置管理、数据共享交换中心、算法模型管理;用户层包含数据拥有者、数据使用者、数据监管者、数据服务者。
4 结论
基于灰色资源建设的医学机构知识库将通过学术质量、元数据标准、弹性自存储、激励机制等多方面的机制建设来保障资源建设的质量控制。利用区块链技术构建的医学机构知识库致力于解决灰色资源的知识产权保护、个人隐私、长期安全保存、机构知识库与其他系统的互通与融合、学者电子名片的推广和应用,以及通过智能应用程序即时自主提交完善个人科技档案云等问题。建立一个全面、精准、安全的医学机构库,不仅实现了机构库仓储功能,而且能进一步拓展机构知识库的服务功能,让医学知识链形成一个良性的生态循环,真正促进医学知识增值,从而实现机构知识库的可持续性发展。
参考文献
[1]LAGZIAN F,ABRIZAH A,WEE M C.Critical success factors for institutional repositories implementation[J].Electronic Library,2015(2):196-209.
[2]冼怀灵.浅议高校图书馆灰色文献的开发与利用[J].科技情报开发与经济,2015(16):10-12.
[3]都平平,李雨珂,孟勇,等.新一代机构知识库中研究数据的关联组织研究[J].现代情报,2018(12):86-90.
[4]宋秀芬.机构知识库与数据知识库比较研究[J].图书馆理论与实践,2019(9):55-60.
[5]司莉,庄晓喆.我国高校科研数据机构库联盟的建设需求调查与分析[J].图书馆,2017(7):19-26.
[6]邱小红,姜颖.中美机构知识库资源建设现状与特点剖析[J].图书情报知识,2015(3):113-119.
[7]邓支青.高校机构知识库内容质量控制策略研究[J].情报杂志,2018(9):173-178.
[8]蔡思明.面向数字学术资源保障体系的支撑型学术图书馆建设[J].农业图书情报学报,2020(9):67-76.
[9]NISO.A framework of guidance for building good digital collections[EB/OL].(2007-12-01)[2024-03-05].http://www.niso.org/publications/rp/framework 3.pdf.
[10]吴海媛,刘莉.面向高校机构知识库的灰色文献建设机制研究[J].新世纪图书馆,2020(8):11-15.
[11]中国新闻出版研究院全国国民阅读调查课题组.第十六次全国国民阅读调查主要发现[J].出版发行研究,2019(6):33-36.
[12]袁勇,王飞跃.区块链技术发展现状与展望[J].自动化学报,2016(4):481-494.
[13]张珊.区块链技术在电子档案管理中的适用性和应用展望[J].档案管理,2017(3):18-19.
(编辑 姚 鑫编辑)
Research on medical institution knowledge base based on grey resource construction
Wang Hongxia1, Wang Yi2*
(1.Library, The Second Affiliated Hospital of Soochow University, Suzhou 215000, China;
2.The Affiliated Suzhou Hospital of Nanjing Univerisity Medical School, Suzhou 215000, China)
Abstract: Based on the problems existing in the construction of gray resources in the medical institutions knowledge base, a quality control mechanism for gray resource construction is proposed. This involves strengthening the content construction of gray resources by introducing blockchain technology, reorganizing and utilizing institutional knowledge achievements. This not only ensures the quality control of gray resources but also attracts users, expands the knowledge service functions of institutional databases, forms an ecological cycle of knowledge dissemination and utilization, and builds a sustainable and shared institutional knowledge base model.
Key words: gray resource; institutional repository; blockchain
基金項目:江苏省图书馆学会课题;项目编号:22YB007;苏州市图书馆学会课题;项目编号:23-B-08。
作者简介:王红霞(1976— ),女,研究馆员,学士;研究方向:信息分析与研究,信息资源建设。
*通信作者:汪益(1975— ),男,主任医师,硕士;研究方向:影像诊断。