区块链技术在公共图书馆机构知识库中的应用研究
2020-06-09周静
周 静
(肇庆市图书馆,广东肇庆526040)
为了拓展网络图书馆资源,为用户提供更优质服务,国内图书馆相继开启了机构知识库建设,以更加专业的数据管理技术,提升知识共享水平。在图书馆机构知识库建设过程中,区块链技术可在知识产权保护、用户访问数据保护与数据开放方面提供支持。
1 机构知识库学术研究现状
机构知识库(Institutional Repository-KUIR,IR)是基于开放获取理念的新型在线服务平台,集知识发现、保存、利用、传播功能于一体的共享平台[1]。机构知识库与图书馆的结合始于2004 年,IR技术的发展经历了系统论述、理论探索、实践研究三个阶段。机构知识库综述文章多来源于外文文献,研究领域日益细分,统计现有相关研究成果可知,互操作性、联盟建设、评价研究是机构知识库学术界的热点研究方向[2,3]。
1)从IR 的互操作角度看,首先应搭建互操作应用需求框架,互操作制度与行为规范应同时满足各利益相关方需求,中国科学院国家科学图书馆兰州分馆的姚晓娜等人研究通过机构知识库OAI 元数据互操作接口扩展,来实现条目数据与资源集合的实时同步,从而实现复杂元数据格式的数据共享与双向传输。
2)从IR 的联盟建设角度来看,公共图书馆机构知识库联盟建设应重点考虑四个方面:知识产权保护、数据资源质量保障、数据资源存缴制度规范、政策框架搭建。中国科学院文献情报中心的魏蕊等人提出将IR 协同建设与图书馆IR 联盟体系并轨,加大公共图书馆IR 推广力度,以IR 联盟经验促进环雄安区域公共图书馆IR协同建设。
3)从IR 评价角度看,应以9 项原则及其所包含的绩效指标为评价基础,与Altmetrics 指标评价体系结合,以适应不同机构知识库评价需求。
2 区块链技术及其应用场景
区块链(Blockchain)是一个去中心化的数据库,由“中本聪”最早提出,是数据存储、点对点传输、共享机制、加密算法的综合应用场景[4]。区块链技术诞生于金融领域,作为比特币的底层技术,随其暴涨而引发全球关注。其去中心化、分布式账本架构,在打破信息孤岛的同时,降低了数据管理成本。梳理区块链技术要点,包含三个因素:是一种数据记录格式;组合成数据块;用于数据记录。区块链技术诞生于虚拟数字货币应用场景,经历了三个发展阶段:数字货币1.0 阶段;智能合约与数字资产2.0 阶段;区块链社区3.0 阶段[5]。区块链技术分为公有区块链、私有区块链、联盟区块链三个应用场景。
从广义层面来看,区块链技术是一种全新的分布式计算方法与架构基础,数据生成与更新基于分布式节点共识算法,数据存储与验证基于块链式数据结构,数据传输与访问的安全性基于密码学加密算法,数据编程与操作基于自由化脚本代码组成的智能合约。区块链技术并不是单纯的新技术,而是现有加密算法、P2P文件传输等技术的重新组合,成为一种新型数据存储、记录、传输、展示方案,汇聚这些技术优势与现有数据库对接。区块链的核心优势在于去中心化、去信任理念,数据存储与信息记录支持所有参与者的共同参与,依靠集体维护形成一个可靠的数据库,区块链有四个技术优势:
1)非对称加密和授权技术,虽然区块链上存储的交易数据是公开的,但账户身份信息是加密访问的,只有授权的数据拥有者才能够访问,在保障数据安全的同时,保护个人隐私信息。
2)分布式账本,交易记账由多个节点共同完成,这些分布于不同位置的节点均记录完整账目,每个节点可独立监督交易过程的合法性,也可共同进行佐证。
3)共识机制,各个不同节点间达成共识,遵循有效记录的一致性认定原则,作为一种认定手段,同时可以保证数据存储、传输、访问的非改写性。
4)智能合约,以不可篡改的可信数据为参考坐标,自动完成预定规则、条款的执行行为。
在国务院印发的《“十三五”国家信息化规划》中,区块链技术第一次正式列入国家发展规划。继金融领域之后,区块链技术在政府办公、物联网、保险、教育、法律、物流等领域均有不同程度应用[6]。区块链技术在机构知识库中的应用尚处于起步探索阶段,但颇受学术界关注,图书情报档案领域已开始探讨区块链技术对电子文件管理模式以及电子健康档案构建等的影响。具体到图书馆领域,已有学者探讨其对于公共图书馆馆配数字化电子文献资源建设的影响。凭借区块链技术优势,图书馆机构知识库为图书馆、数据资源、终端用户间提供了一个更便于联系的平台,在信息资源上传与访问方面,图书馆与用户的自主空间均得到释放。
3 建设公共图书馆机构知识库的必要性
3.1 公共图书馆科研成果丰富,需要知识管理的平台
公共图书馆为公众提供免费图书资源服务,一般由中央或地方财政提供资金支持,并负责运营、管理。高校图书馆与公共图书馆功能定位互为补充,公共图书馆侧重文献保障、公众服务;高校图书馆、科研机构侧重科学研究,但随着“万众创新”政策的推行,公共图书馆也积累了一定数量的科研成果,且呈现逐年递增态势,其内容保存、展示、服务需要一个集成化平台。本文选取10个公共图书馆样本,统计其在中国知网、万方数据、维普网三大检索平台的期刊论文收录情况,见表1。
表1 国内公共图书馆三大检索平台论文收录情况
上表统计了国内10 个公共图书馆期刊论文收录数据,各馆论文数量绝大部分已超过百条,部分图书馆收录数量超过千余条。科研成果类型除期刊论文外,还包含电子图书、专利文档、项目报告、多媒体资源等多种格式文献。如果这些科研成果可以在公共图书馆机构知识库中存储、交互、展示,其学术价值将得到进一步发挥。
3.2 提升公共图书馆的科研成果共享与利用水平
机构知识库有利于科研成果开放存取,科研成果显示度得到提升,学术期刊对科研成果的垄断格局被打破,营造更加开放的知识共享、传播、应用平台,公共图书馆对科研成果的收藏属性,决定了其与机构知识库天然的内生联系。在纸质期刊出版时代,各机构科研成果分布于不同期刊收录,不具备集中展示平台。机构知识库平台应运而生,面向学者与专业技术人员集中展示机构科研实力,提升公共图书馆整体科研素质[7]。
3.3 科研成果的显示度与影响力得到增强
机构知识库在助力公共图书馆科研成果开放存取的同时,还可降低科研成本,节省科研人员的期刊购置、查阅费用;同时,机构知识库的开放存取属性,使科研成果覆盖范围扩大,获取方式更加便捷,科研成果影响力、引用率、显示度得到增强。
3.4 数据资源的长期保存得以实现,并衍生增值服务
机构知识库除了在学术资源传播与应用方面具备技术优势外,还支持学术数据保存的长期性,机构科研成果管理机制得到完善。同时,机构知识库还支持增值服务扩展业务,提升科研成果应用水平。以中国科学院机构知识库建设为例,在基础功能建设同时,又拓展了科研成果管理、学术价值评估、作者学术名片、科研报告在线浏览与下载等增值业务,为科研人员提供更加丰富的人性化服务。
3.5 OAI-MPH互操作接口支持数据共享、交换
机构知识库提供OAI- MPH 开放接口,支持数据交换、共享,突破了长期制约数据库发展的“信息孤岛”束缚,互操作性能显著[8]。OAI-MPH接口实现了不同机构知识库间的数据一体化检索,如CALIS 机构知识库、中国科学院机构知识库、台湾学术机构典藏机构知识库间的互联网络联盟,实现了零信息孤岛数据互连,用户可在集成检索界面完成数据访问、收藏、下载操作。
4 区块链技术在公共图书馆机构知识库中的应用
对图书馆科研资源机构知识库联盟建设需求调研过程中,司莉、庄晓喆认为科研人员对科研数据上传至机构知识库存在顾虑,如数据的安全如何得到保障、数据涉密及个人隐私、数据是否会被越权使用等。因此,机构知识库建设过程中需重点关注科研资源的长期安全保存与知识产权保护。部分学者还提出数据自主提交需求,避免数据在中间环节提交的改动风险。为了扩大机构知识库覆盖范围及提高应用水平,需要在机构知识库建设过程中发挥区块链技术优势。
4.1 有效保护机构知识库知识产权
机构知识库知识共享业务的实现,需要大量科研数据作为支撑,但专家学者、科研人员普遍存在知识产权保护不到位、科研成果或研究数据被非正常使用的芥蒂,而缺乏科研结论、数据的上传分享意愿。现有知识产权保护手段为事先签署授权协议书或制定严格的知识产权条例,保护手段单一,未形成产权保护体系。区块链提供了技术层面的知识产权保护手段,其不可变更的技术属性成为证明知识作品存在的新方式[9]。区块链技术在知识产权保护领域的应用,打消了科研工作者的产权顾虑。
数字化公证与区块链验证搭建了一条虚拟的数据链条,信息一旦写入区块链便无法更改,研究人员的科研数据上传后,便获得了不可更改的数字化身份。同时,全部版权信息被设计为公开透明的,以供追溯查询操作,在遭遇版权不清晰纠纷问题时,可通过查阅、举证来组织有效维权。抄袭现象有望永久消失,因为数据使用记录会被永久保存。在区块链技术中,合约会以数字化形式智能写入,机构知识库用户默认其知识产权保护条例,凭借区块链技术的不可更改特性,保障科研数据存储、访问、下载流程的透明化及可追溯性。
4.2 保护机构知识库个人隐私,助推数据开放
数据的开放性与安全性是相互矛盾的,对公共图书馆机构知识库而言,用户的参与程度与使用体验直接决定了数据资源获取的便捷程度。
机构知识库的建设初衷决定了其开放性,应尽量减少权限设置,否则会降低用户获取数据的便捷性,降低机构知识库使用频次,无法达到用户期望水平,阻碍公共图书馆机构知识库的进一步发展。同时,应该设置必要的数据开放权限,部分研究数据包含被调研者的个人隐私信息,区块链技术提供的身份验证功能可很好地实现访问权限设置。以电子健康档案为例,包含大量个人隐私信息,在区块链技术支持下,通过不同的电子签名权限授予机制,避免隐私数据被恶意修改,从而实现数字化健康信息的安全有效保存。
电子签名同样适用于科研数据开放时涉及的个人隐私保护问题,存储于区块链上的科研成果与学术信息,通过哈希加密算法生成私钥和公钥,私钥可以是单一的,也可以是多重的,同时支持加入时空维度信息。研究人员的个人隐私信息,获得了加密技术与身份验证双重保护[10]。不同级别用户设置差异化的数据获取权限,以访问不同的数据内容,专家学者与科研人员的个人隐私得到进一步保护。数据开放权限与图书馆管理体系剥离,数据上传主体依据信息重要等级,自行选择适用全部公开、特定用户公开、特定用户加密,或全部加密权限。
4.3 确保机构知识库数据存储的安全性与稳定性
区块链技术可以构造一个顺序相连的时间链条,建立环环相扣的一对一信任关系,基于共享机制,保证数据记录的真实性与准确性,分布式存储技术在保障数据安全的同时,还支持数据校验,构成一个去中心化的分布式数据库,有序且可信。以区块链技术作为支撑,图书馆机构知识库便可实现科研人员所上传实验数据、学术报告、论文、著作等资料的长期安全存储,数据校验机制在很大程度上保证了数据的完整性;同时,区块链技术的可溯源、不可改写、加密传输、智能合约特性,可辅助数字化资源的长期安全存储。共享机制是一种多方受益模式,去信任化理念构造了一个纯粹的信任系统,科研人员成果上传后,不用再顾虑抄袭、滥用风险,用户也无须提供信用度,图书馆等第三方机构不再提供用户高可信度担保。参与者对机构知识库的信任不是建立在人与人之间的信任关系之上,由于技术安全的客观性,随着参与度的深入,数据安全性呈现正比例提升,数据内容在整个过程中是公开透明的。
4.4 图书馆机构知识库的去中心化问题得以解决
区块链的显著技术优势在于去中心化,但是去中心化不是绝对的,应辩证看待。去中心化涉及三方面内容:政治决策层面、控制逻辑层面、程序架构层面。在政治、决策与程序架构层面,区块链的去中心化是容易实现的,而在控制逻辑层面应该是中心化的。程序架构层面的去中心化是通过分布式技术实现的,控制逻辑层面的中心化,是指统一记账与数据统一,即Global Leader 中央集权模式。政治决策层的去中心化也不是必然的,视决策制定规则的差异性而定,部分研究学者在探索非中心化的公共图书馆机构知识库系统。机构知识库的主体是科研数据的上传者与终端平台用户,公共图书馆是平台提供者与参与方。区块链技术出现前,图书馆在机构知识库建设中扮演协调管理与宣传推广角色;区块链技术的到来,弱化了图书馆的管理属性,取而代之的是数据上传者与使用者的群体自治性。因此在资源收集方面,公共图书馆职能应由包揽向辅助数据上传者转变。