公益性科技名词数据资源共享的原则和方法
2014-12-22裴亚军覃德兵
裴亚军 覃德兵
(1.全国科学技术名词审定委员会,北京 1000717;2.湖北长阳民族高级中学,湖北宜昌 443500)
充分运用信息、网络等现代技术,实现科技名词数据资源共享,对推动科技领域的交流合作与知识传播,促进科技成果应用与转化,支撑科技进步与创新,实现科技名词价值的最大化,具有重要意义。本文通过分析当前公益性科技名词数据共享中存在的问题,探讨公益性科技名词数据共享的原则和方法。
一 公益性科技名词数据的性质和特点
科技数据资源共享之所以能成为当代科技创新发展的关键因素之一,主要在于科技资源与现代信息技术紧密结合,使众多科技资源具备了数据化特征,从而能够用机器进行自动分析和加工,为科技资源的使用效率带来了质的飞跃[1]。
1.数字化和数据化
谈数据共享,首先要弄清两个极容易混淆的概念——数字化和数据化。数字化和数据化的主要区别在于,能否用计算机来自动处理和分析文本中的信息。一些科学文献被扫描然后存入服务器的高分辨率数字图像中,书本上的内容变成了网络上的数字文本。不过这种方式只能被叫作文本数字化,而不是数据化,因为这些图像文件只能依靠人的阅读才能转化为有用的信息,文本中的内容不能用计算机来自动处理和分析。但是,如果能使数字化文本中的信息可以通过软件自动采集、分类、统计、存储、查询和分析,数字化图像就转化成数据化文本,实现了数据化。因此,“数字化带来了数据化,但是数字化无法取代数据化”[2]。
2.公益性科技名词数据的性质和特点
科学数据是网络时代重要的学术资源,具有可传递性、可增值性、可共享性等特征,在科学研究中发挥着重要作用,是科技创新、经济发展和国家安全的重要战略资源。
科技名词数据是一种重要的科学数据资源,对社会经济活动起着基础支撑作用。按照投资主体的不同,科技名词数据可以分为公益性数据和一般性数据。由国家和政府投资或资助产生的科技名词数据是公益性数据。比如,由全国科学技术名词审定委员会(以下简称全国科技名词委)审定公布的规范科技名词就属于公益性数据。公益性数据的所有权属于国家和政府,具有公益性质。从共享和使用的角度看,公益性科技名词数据涉及知识产权、隐私权等法律问题较少,是一种共享障碍少、共享程度和使用效率都极高的基础性科学数据。
二 目前公益性科技名词数据资源共享中存在的一些问题
实现数据共享是有效开发和利用科技名词数据的重要手段之一。新中国成立以来,依托科技名词规范化工作的快速发展,我国公益性科技名词数据资源建设取得长足进步,仅全国科学技术名词审定委员会就建立了包含30多万词条,覆盖科学技术各领域的规范科技名词数据库。今后几年,还将建成包括两岸科技名词,汉蒙、汉藏、汉维、汉哈(哈萨克)、汉朝(朝鲜)等多语种科技名词对照数据库,形成比较丰富的数据资源体系。但是长期以来,这些科技名词数据资源并没有得到充分利用,有关共享的意识还没有完全确立,共享机制与体系还十分不完善,已经阻碍科技名词作为科技创新发展基础支撑作用的正常发挥。
概括起来,当前我国公益性科技名词数据资源共享工作中存在的问题主要表现为如下五个方面:
1.缺乏对科技名词数据共享问题的顶层设计和宏观协调管理,在人才储备、资金投入、标准建设、评估监测、保障体系建设等方面有待合理布局。
2.多数科技名词资源的共享还处于数字化阶段,没有实现真正的数据化共享。计算语言学领域有一个说法,称为“机器可读(machine readable)”,简单数字化(例如扫描后的文本)资源仍属于机器不可读资源,只有经文字识别(OCR)或其他编码化处理后才成为机器可读资源,才能进一步支撑后续的分析、理解和处理任务。
3.服务供给整体水平较低,符合用户需求的高质量产品匮乏,基于基础数据的产品创新能力不足,资源利用率不高,无法产生大规模经济效益和社会效益。
4.信息化和网络化服务体系不完善,科技名词数据共享平台建设整体水平不高,数据交换能力不足,不太重视平台与平台、平台与用户、用户与用户间的相互交流,用户体验有待加强,因此基本上没有形成面向社会的有效的数据共享基础条件。
5.全社会主要的科技名词数据生产部门或机构间缺乏沟通,数据生产标准不太统一,数据整理、汇交和建库工作相对滞后,对于部分政府生产、拥有或政府资助生产的公益性科技名词数据,“完全与开放”的共享机制尚未完全确立。
三 公益性科技名词数据共享的原则
面对当今知识经济时代的世界新格局,为了更好顺应时代发展对科技资源多方面、多层次的需求,必须根据公益性科技名词数据的性质特点,从科教兴国战略高度出发,转变传统思维,提倡和推行全局观念、资源观念、合作观念、创新观念和服务观念,努力推进科技名词数据共享[3]。
在实现公益性科技名词数据共享过程中,应当确立如下八项原则:
1.公益性原则。公益性科技名词数据是针对公共领域的基础性科学数据,由国家和政府投资,采取事业性运行模式,用户可以从公共网络免费获取科技名词数据。
2.保证数据质量原则。共享数据的价值主要体现于数据质量和数据完整性。应当从用户需求出发,科学规划数据生产流程,缩短数据生产周期,保证数据生产质量。
3.保证数据完整性原则。科学数据的用途和特点决定了它必须尽可能提供完整信息。在科技名词数据生产过程中,除涵盖科技名词数据本身的全部要素以外,还应当包含数据产生的相关信息。
4.用户便利性原则。为了便于用户使用,科技名词数据生产部门应当遵照社会的基本标准生产数据。同时应当通过因特网形式,加强共享平台建设,形成基于网络的、简单、及时、用户友好的开放环境,便于用户获得。
5.服务持续性原则。当今世界正处在大发展大变革大调整时期,科学技术日新月异,学科交叉十分频繁,部分科技名词的演变也十分迅速。应当适应经济社会发展需要,强化科技名词数据生产的周期性、时效性,保证用户对科技名词共享数据长期有效获取。
6.协作性原则。科技名词数据是维持科技发展的基础数据,应用范围广泛。应当构建基于现实和网络的互动环境,形成各科技名词数据生产者之间、数据生产者和使用者之间的良好互动,协作提高科技名词数据的质量和共享水平。
7.法律一致性原则。科技名词共享数据不得违背已有国家安全、隐私和机密、贸易秘密、知识产权、稀有物种保护等法律。
8.保护知识产权原则。经过规范的科技名词数据是汇编作品,著作权受到我国现行《著作权法》的保护。对于科技名词共享数据在应用与共享过程中有可能产生的利益均衡问题,应当通过法律手段予以解决。
四 加强公益性科技名词数据共享的几点建议
在实际操作中,无论是公益性科技名词数据,还是由私人投资生产的科技名词数据,建议生产者相互打破藩篱,互通有无,相互促进,协同增强科技名词数据的生产能力,扩大使用范围,提高使用效率。基于这一认识,笔者建议:
1.提高公益性科技名词数据的全民共享意识。围绕科技进步、科学效率和教育发展等问题,公益性数据生产部门应当从国家利益、公共利益角度出发,牢固树立共享观念,倡导共享精神,主动减少共享障碍,提高公益性科技名词数据的共享程度和使用效率,促进科技名词基础支撑作用在经济社会发展中的有效发挥。
2.加强公益性科技名词数据共享工作的整体规划。科技数据资源共享是一项政策性很强的工作,复杂程度高,实践执行难度大。在公益性科技名词数据共享工作中,应当从提高科技名词工作水平入手,主动优化资源配置,强化专业化人才队伍建设,确定数据管理制度,加强数据共享整体协调工作,逐步建成适应科技名词数据共享需要的基础条件支撑体系。
3.加强公益性科技名词数据共享平台建设。科技名词数据资源共享平台是对促进科技名词数据资源进行的战略重组和系统优化,提高全社会科技名词数据资源高效配置和综合利用水平,增强科技创新能力的重要基础设施。国家应当协调相关资源,充分发挥现代网络技术和公共网络基础设施,构建基于用户的、服务于全社会科技活动的跨地域、实时的网络协同环境,确保公益性科技名词数据得到高效利用[4]。
4.加强公益性科技名词数据质量管理,提高科技名词数据产品的创新能力。第一,要从科技名词规范工作入手,提高基础科技名词数据的生产质量;第二,要加强对科技创新的实时跟踪、了解,最新成果应该及时反映到科技名词数据中来,提高科技名词数据的时代性和现实性;第三,应当从用户需求出发,开展基于基础科技名词数据的二次产品设计与开发,最大限度发挥现有科技名词数据资源的潜能。
5.确立科技名词数据资源共享的广泛合作机制。公益性科技名词数据的应用相当广泛,作为公益性科技名词数据的主要生产者,全国科技名词委应当在规范科技名词数据资源供给中发挥主导作用,同时充分调动相关部门、高等院校、科研院所、行业协会、企业、个人用户等各方面积极性,参与科技名词数据资源整合与建设,探索多种利益分配模式,提高科技名词数据共享水平。
五 结语
公益性科技名词数据是一种重要的科技数据资源,也是一种重要的公共资源,应当被全社会平等共享。
公益性科技名词数据资源的共享机制,就是以资源共享为核心,以相关资源系统整合为主线,坚持以人为本,遵循市场经济规律,充分利用现代信息技术和各方资源,搭建布局合理、功能完善、体系健全、共享高效的数据共享平台,通过对具有公益性、基础性、战略性的科技名词数据资源进行战略重组和系统优化,突破科技名词规范化工作和推广普及工作中的瓶颈,从而达到推动科技名词规范化工作长期可持续发展,发挥科技名词作为科技创新和教育发展基础支撑地位的目的。
[1]李娟,刘德洪,江洪.国际科学数据共享研究[J].图书馆建设,2009(2).
[2]Viktor Mayer-Schönberger,Kenneth Cukier.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013:109-110.
[3]李娟.国际科学数据共享原则和政策研究[J].图书情报工作,2008(12):77-80.
[4]科技部、发展改革委、教育部、财政部.2004—2010年国家科技基础条件平台建设纲要[EB/OL].[2014-01-17].http://www.chinfo.gov.cn/kytj/xgwj/0607201.htm.