文献信息安全保障的思考
2022-02-08申晓娟
申晓娟
(国家图书馆,北京 100081)
最近,一个突发事件引发科研人员广泛关注。2022年3月11日,全球科学和知识产权信息服务大型提供商之一,科睿唯安(Clarivate Analytics)宣布停止在俄罗斯的所有商业活动。此时距俄乌冲突爆发仅三周,战火从政治、经济领域已经蔓延到教育、艺术、体育、科研等领域。这一事件引发科研人员对我国基础科研数据和知识产权数据保障能力的担忧,也促使文献信息领域从业人员深入思考当前我国文献信息保障体系建设所面临的严峻形势及未来发展道路。
1 总体国家安全观视角下的文献信息安全保障
“当前我国国家安全内涵和外延比历史上任何时候都要丰富,时空领域比历史上任何时候都要宽广,内外因素比历史上任何时候都要复杂”[1],新形势下的国家安全已引起中央高度关注,并做出相应战略部署。2013年11月12日发布的中国共产党第十八届中央委员会第三次全体会议公报提出,“设立国家安全委员会,完善国家安全体制和国家安全战略,确保国家安全”[2]。2014年4月15日,中央国家安全委员会第一次会议召开,提出要坚持总体国家安全观,构建集政治安全、国土安全、军事安全、经济安全、文化安全、社会安全、科技安全、信息安全、生态安全、资源安全、核安全等于一体的安全体系[1]。2015年7月1日,第十二届全国人民代表大会常务委员会第十五次会议通过《中华人民共和国国家安全法》,指出“国家安全是指国家政权、主权、统一和领土完整、人民福祉、经济社会可持续发展和国家其他重大利益相对处于没有危险和不受内外威胁的状态,以及保障持续安全状态的能力”,要求坚持总体国家安全观,维护各领域国家安全[3]。国家安全观由过去主要关注政治安全、军事安全等传统安全问题,日益向非传统安全拓展[4]。
文献信息保障水平是关系到经济社会可持续发展、科学技术创新进步、公众个人全面发展的重要基础,如何在新的总体国家安全观视角下重新认识文献信息工作,成为业界思考和关注的热点问题之一,情报领域已有不少相关研究成果。2017年10月,参加“情报学与情报工作发展论坛(2017)”的专家学者就如何在总体国家安全观框架内、在国家创新与发展进程中更有效地发挥情报“耳目尖兵参谋”甚至“引领”作用,达成“情报学与情报工作发展南京共识”,提出情报学学科应着眼于国家发展与安全目标,要努力促使情报工作和新时代国家发展与安全的战略需求相匹配[5]。有学者将新时代科技情报工作的战略定位概括为“创新支撑,决策咨询,安全预警,信息保障”[6]。文献信息的安全保障不仅是国家安全体系的重要组成部分,同时更是总体国家安全观其他构成要素的重要支撑,也正因为这个原因,我国文献信息机构的外文科技文献建设与服务正在面临更多新挑战。
长期以来,我国对外文文献的保障主要是通过文献信息机构购买国外数据库供应商的产品与服务,这种供给方式现在看来极为脆弱。一方面,少数数据库商对资源的极高垄断及其高昂的价格和年度涨幅,使图书馆界不堪重负,甚至数度引发国内图书馆界的联合抵制,以至产生“程焕文之问”[7];另一方面,文献信息机构从数据库商处购得的多为资源的网络使用权而非本地存储权,遇灾害、战争或人为干预等因素,就可能突然被断供,此次科睿唯安之举就是例证。近年来,美国对华制裁已从经济贸易扩展到科技领域,西方国家正在逐渐加大对我国信息交流尤其是科技交流的限制,我国对外文科技期刊的访问和使用受到重大阻碍[8],文献信息及服务无法购得的情况时有发生。2018年以来,美国定向能协会会议录、美国政府四大科技报告等重要文献不再向我国销售,部分中国科研机构、高校被美方列入出口管制“实体清单”,禁止其使用美国信息产品,部分美国数据库对名单中的中国机构、企业和学校停止服务[9],冷战时期的科技情报封锁又在重演[10]。我国文献信息安全保障形势不容乐观,已无法满足新时期国家安全体系构建的需要,提高文献信息保障能力迫在眉睫。
2 构建自主可控的文献信息保障体系
2015年,党的十八届五中全会公报提出要实施“国家大数据战略”,同年,国务院印发《促进大数据发展行动纲要》,提出“大数据正日益对全球生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生重要影响”,要求“加快建设数据强国”“着力推进数据汇集和发掘,深化大数据在各行业创新应用”[11]。2020年4月,《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》[12]将数据作为与土地、劳动力、资本、技术并列的要素,提出要加快培育数据要素市场,推进政府数据开放共享,提升社会数据资源价值,加强数据资源整合和安全保护。数据已成为重要的生产要素,是国家基础性战略资源。为使国家治理、基础研究、科技创新、产业升级及社会发展各领域能够获得稳健的数据支持服务,充分发挥数据资源的战略性作用,应当机立断,从国家层面统筹构建以数据安全为核心的文献信息保障体系。
第一,可考虑在现有文献信息机构合作机制的基础上,进一步建立统筹规划、共建共享的数据保障体系。
在传统介质时代,世界上就已经没有任何一个图书馆能够仅凭一已之力完整收藏全世界的所有出版物,在大数据时代就更无此可能了。据统计,全世界在2018年创建、捕获、复制和消耗的数据总量为33ZB,2020年这一数字增长到59ZB,预计到2025年将达到令人难以想象的175ZB[13],相当于175万亿GB,增长量逾430%。因此,文献信息机构特别是国家级文献信息机构间基于数据的分工合作与共建共享比过去更为重要。应当在国家层面建立重要战略性数据资源的统筹采集、保存、共享与整合服务机制,形成以国家级文献信息机构为中枢,以行业性、地区性大中型文献信息机构为主干的数据采集保存体系。
特别是对当前我们面临的“面向科技创新与科技体制改革的科技文献保障需求,与西方国家对我国科技信息封锁日益加剧的现状之间存在巨大矛盾”[8]的困境,应当重点确保对国内外重要科技文献、社会科学领域文献、重要组织与机构出版物、与国家安全紧密相关的重要国家和地区数据建立保障性协调采购入藏机制;对开放科学数据、开放存取资源、社交媒体资源等其他互联网重要开放数据资源建立分工采集保存机制;对国外重要垄断性商业数据库可通过集团采购模式争取本地镜像与国家保存权益。
第二,应推动我国科学数据的汇聚与管理,为重点领域科学研究与技术攻关提供核心数据开放支撑服务。
当前,科学研究已逐渐演化至第四范式,即数据密集型科学,科学研究高度依赖数据的聚集与分析[8]。2018年,国务院办公厅印发《科学数据管理办法》,要求政府预算资金资助形成的科学数据应当按照开放为常态、不开放为例外的原则,面向社会开放共享,并提出建立科学数据中心,使其成为促进科学数据开放共享的重要载体[14]。高校与科研机构科学数据存量大、创新量高、增长快[15],是科学数据最重要的生产地,应使科研人员的科研成果预印本、工作论文、学术报告、实验报告及各类型科学数据、研究成果等,能够在本校或本机构得以完整汇聚、保存。在此基础上,可在国家层面逐步形成若干专业领域科学数据中心,推动建立科学数据开放共享机制。对于国家财政资助立项的各类科研项目,应建立项目研究成果及研究过程中产生的观测数据、调查数据、研究数据、实验数据等科学数据向科学数据中心提交,并鼓励向社会开放的政策。
图书馆具有较强的专业化信息管理能力,是承担科学数据汇聚、保存、服务、管理职能最为合适的机构。“到2030年,科学不仅使用数据来创造,任何科学发现的基本产出也是数据”[16]。图书馆需要适应科研转型发展的趋势,扩大馆藏文献信息采集入藏、整合利用范围与类型,主动为科研人员提供研究过程科学数据管理服务,逐步履行科学数据中心职能。国家层面应对各学科门类、各地区科学数据中心的分布进行统筹谋划,依托国家级文献信息机构设立若干国家科学数据中心,汇聚国家级重点实验室、国家级科研项目、国家重大创新工程等产生的科学数据,并对各地区、各专业领域科学数据及根据国家政策开放给社会的各类科学数据进行加工整理,建立数据集之间的关联关系,提供统一发现服务,促进数据共享与再利用。
第三,应建立面向科学研究与技术创新过程的知识服务平台,支持全社会的数据增值开发。
最近,围绕中国知网(以下简称“知网”)发生的一系列事件受到广泛关注,中南财经政法大学退休教授赵德馨夫妇先后状告知网侵权[17],中国科学院因费用高昂暂停使用知网[18],国家市场监督管理总局依法对知网涉嫌实施垄断行为立案调查[19],不少学者提出建设国家知识资源数据库和共享平台的建议[20],也有许多网友在微博上发表评论或“喊话”国家图书馆,认为知网所建学术论文数据库应当由国家图书馆建设,并面向社会提供公益服务。专家学者与网友的意见虽然出发点与立足点有所不同,对有关知识产权保护现行法律法规的规定了解程度也有不同,但有一点是一致的,就是对于将学术资源作为国家的基础性、战略性资源,如何在更大范围内以更小的代价和障碍实现知识传播利用的关切。
数据的价值不仅在于其规模,更在于数据与数据之间的关联,在于数据对新型交流模式、学习模式和研究模式的支撑,在于数据的增值开发。“让每个读者有其书,每本书有其读者”,大数据时代,图书馆这一核心职能的履行面临更大的挑战,“充分利用大数据智能时代的技术,将科技文献、科技数据、分析工具等与科技创新全生命周期密切相关的科技资源进行关联、融合、集成和综合开发利用,实现全方位协同保障”[10]是一个必然选择。为此,在国家图书馆的动议下,中央财政于“十四五”时期支持立项全国智慧图书馆体系建设,这个项目建设的核心是多源数据资源的融汇共享及基于关联揭示的知识服务。一方面,全国文献信息机构应致力于建设安全可靠的文献信息保障基础平台,建设物理分布、逻辑关联的全网知识内容集成仓储,支持各类公益性、商业性和非营利性数据资源的开放接入,从而在国家层面实现科研数据跨领域、跨类型、跨机构的存储、管理及开发利用的基本支撑;另一方面,在实现数据汇聚的基础上,还应当充分发挥图书馆行业在资源组织、挖掘、揭示方面长期积累的专业优势,加强数据资源的细粒度加工与关联揭示,支持对数据知识内容的深度挖掘和智能分析,推动建立贯通知识内容创作、发布、存储、传播、利用等全域链条的社会化合作机制,为支撑科学研究、技术研发和公众学习提供先进智能的知识服务。
“面向世界科技前沿、面向经济主战场、面向国家重大需求,加快各领域科技创新,掌握全球科技竞争先机”,是我国建设世界科技强国的出发点,而文献信息支撑则是各领域科技创新的必备基础条件。将文献信息视为一种重要的基础性战略资源,提升我国文献信息安全保障能力,是一项事关国家总体安全,事关国家和民族未来发展的事业。全国各类型文献信息机构应当协同发展,坚持三个面向原则,共建国家科技文献信息保障体系,为我国高水平科技自立自强之路提供更高水平、更加精准、更为智能、无处不在、方便可用的知识服务。