国防科学数据管理构想与实现
2019-01-28
国务院办公厅2018年4月印发的《科学数据管理办法》(以下简称《办法》)中指出:“科学数据主要包括在自然科学、工程技术科学等领域,通过基础研究、应用研究、试验开发等产生的数据,以及通过观测监测、考察调查、检验检测等方式取得并用于科学研究活动的原始数据及其衍生数据”[1]。
根据该《办法》,本文所讨论的国防科学数据,可以被定义为是由国防科研经费支持的基础研究、应用研究、试验开发领域中产生的科学数据,是大数据的重要组成部分。
国防科学数据管理是以国防科学数据为对象而展开的管理工作,其主要任务是在国防科研活动中建立国防科学数据管理制度,规范生产、完整呈交、安全管理、充分共享、深度挖掘国防科学数据,为国防科技创新发展提供支撑。
1 开展国防科学数据管理的必要性
1.1 贯彻落实中央指示的统一要求
党中央、国务院高度重视科技资源开放共享,着力构建国家科技创新基础制度。习近平主席2014年在中科院第十七次院士大会、工程院第十二次院士大会上指出:“要着力完善科技创新基础制度,大幅提高科技资源开放共享水平”[2];2018年在出席十三届全国人大一次会议解放军和武警部队代表团全体会议时,再次要求“强化开放共享观念,坚决打破封闭垄断,加强科技创新资源优化配置”[3]。
作为促进国家科技资源开放共享的重要举措之一,国家科学数据管理早在1999年就已起步,2002年科技部在部分领域启动国家科技计划项目的科学数据共享工程[4]。之后数据汇交范围不断扩大,直至2018年4月以国务院办公厅名义印发《科学数据管理办法》,从国家政策层面对政府预算资金支持产生的科学数据管理工作进行了规范。
国防科学数据是国家科学数据的重要组成部分,必须汲取国内外经验,发挥后发优势,加紧开展国防科学数据管理的制度研究和建设。
1.2 发挥国防科学数据潜在价值的迫切需要
科学数据是科学研究的重要保障。学术意义上,对以往科学数据的分析利用有助于尽早识别、纠正研究过程中出现的错误偏差,促进新的科学发现产生;经济意义上,对以往科学数据的广泛共享有助于促进成果转化和新的合作研究,避免重复研究,节省成本支出,缩短科研周期;管理意义上,对科学数据实行集中统一管理有助于识别科研违规行为和欺诈行为,检测、阻止、杜绝不良科学,促进科研诚信。
但是,上述科学数据作用的发挥,有赖于首先对科学数据进行完整保存和充分共享。我国国防科学数据管理存在以下问题,导致其潜在价值很难实现。
一是数据流失严重。由于大量数据处于分散、无序管理状态。不少课题组获取了数据,发表了论文,评完奖后就束之高阁。时间一长随着人员流转,这些花费了巨额国防科研投入产生的数据,就容易因长时期搁置或无章可循、无处可交而流失了[5]。
二是数据共享严重不足。由于缺乏统一的数据生产、采集、加工和服务标准,各单位自成体系、互不融合,使用困难。缺乏顺畅的交流共享渠道,因此在数据大量流失的同时,被零散保管起来的数据则形成了一个个封闭的“数据孤岛”,难以进行交流使用。
1.3 满足大数据时代数据管理共享需求的必然途径
伴随着大数据时代数据密集型科研应运而生,国防科学数据管理和共享面临的需求日益强劲。
一方面,随着我国国防科技由“跟跑”向“并跑”“领跑”转变,具有国际领先水平和自主知识产权的第一手数据呈现井喷式增长[6],要求从源头上加强管理和积累,再不能像过去一样坐视这些宝贵技术资产的随意流失;另一方面,国防科技创新越来越依赖于对海量数据的分析挖掘和综合利用,越来越依赖于大量、系统、高可信度的科学数据[7],对数据共享使用的层次方式、广度深度提出了更高的要求。发展是硬道理,为解决当前国防科学数据管理滞后和需求紧迫之间的矛盾,唯有加快发展,别无他途。
2 国防科学数据管理分析
本文拟通过开展工作性质分析,理清国防科学数据管理的力量构成和各方职责,谋求形成合力,推进工作发展。通过开展工作定位分析,理清国防科学数据管理与其他相关工作之间的关系,以便统筹协调,提高管理效益。通过开展工作内容分析,理清国防科学数据管理的各项重点任务及其关键所在,切实增强具体制度设计的科学性、可行性、针对性。
2.1 工作性质分析
要想认识科学数据管理的性质,需要先认识其管理对象——科学数据的性质。科学数据首先是科研成果的一部分,是以科学数据形式体现的科研成果;其次,虽然科学数据的最初产生并不以信息资源为目的,也不是注定要成为信息资源,但由于其对促进科技发展和交流具有重大作用,信息管理部门有责任将其有目的、有计划地作为信息资源进行培育、发展和利用。因此,科学数据从本质上说,既是科研成果的一部分,同时又是一种重要的信息资源,是从科研成果转化过来的一种信息资源。
科学数据的科研成果属性决定了其产生必定是科研工作和科研管理工作的一部分,信息资源属性决定了对其的收集、处理和使用属于信息管理工作的一部分。国防科学数据管理作为科学数据管理的一个分支,其工作性质也是一样的。
在科学数据管理中,由于对科学数据实施集中统一呈交和管理的主张主要是信息管理部门基于促进信息资源使用的目的而提出的,因此信息管理工作和信息管理部门必然处于主导地位。我们在进行科学数据管理制度设计和工作过程中,既要充分发挥信息管理部门的主导作用和积极主动性,利用专业的信息处理技术和广泛的服务网络做好科学数据的加工处理和使用,同时也必须在法规上对科研管理部门提出明确要求,充分利用其对科研项目权威的管理和控制职责,及时而高质量地产生科学数据。
2.2 工作定位分析
国防科学数据管理不是一项孤立的工作。
首先,从国家层面讲,国防科学数据管理是国家科学数据管理的重要组成部分,两者的工作性质、工作目的和工作内容完全相同。两者之间的不同主要在于:一是根据我国国防科研管理体制要求和惯例,国防科学数据并行于国家系统之外实行单独管理;二是国防科学数据包含大量的涉密信息,保密要求更高,但即使如此,其公开和解密部分也应当按照军民融合要求纳入国家系统之中。因此,在进行国防科学数据管理制度设计和工作过程中,应充分吸取国家相关制度措施,特别是在标准规范上应尽量与国家保持一致。如果国家已经有成熟的标准规范,国防科学数据管理应尽最大程度予以采用,要么直接使用,要么在国标基础上结合国防科研实际情况进行微调,尽量避免另起炉灶再搞一套。
其次,应借鉴国防科技报告管理并与之融合。两者均以系统积累和交流使用国防科研成果为目的,在生产和呈交环节具有相同的责任主体及相近的工作程序、工作内容和要求,国防科技报告中可能还会包含部分国防科学数据[8]。两者的主要区别是国防科技报告管理以文献为载体形式,国防科学数据管理以数据为载体形式。因此,在开展工作时两者有必要密切配合、联袂推进,这既有助于双方相互补充、相互促进,也可减少对基层单位的干扰。由于国防科技报告工作开展较早,已经形成了一套比较完善的管理体系、工作渠道和队伍,因此在进行国防科学数据管理制度设计和工作过程中,应有计划地加强与国防科技报告管理体系的融合,充分依托已有的国防科技报告工作渠道和队伍,提高管理效益。
2.3 工作内容分析
国防科学数据管理包括数据生产、审核、呈交、加工、使用、保管等一系列活动,其中审核围绕呈交展开,加工、保管围绕使用展开。除此之外,安全管理作为不可须臾放松的要求,应贯穿国防科学数据管理的全过程和每一环节。下面将重点分析生产、呈交、使用和安全管理这4项工作内容。
2.3.1 国防科学数据生产
国防科学数据生产的责任主体是项目负责人,项目负责人应该根据项目进度,有计划地组织项目组成员按照统一的标准要求生产数据。
国防科学数据生产是随着科研项目进展自然而然发生的科研行为,从有国防科研以来,无论是否实施国防科学数据管理制度,数据生产从未间断过。实施国防科学数据管理制度之后,对数据生产的内容和格式规定了统一的标准,从便于生产和后续加工的角度,一般还会要求采用统一的电子填写系统或模板。如前所述,这个标准最好与国家科学数据管理保持一致。
2.3.2 国防科学数据呈交
国防科学数据呈交的责任主体是项目承担单位,项目承担单位应在组织完成数据内容完整性、真实性以及格式规范性审核之后,按照项目下达渠道或其他途径及时向上呈交,最终呈交至统一的国防科学数据管理机构。
生产与呈交是国防科学数据管理的基础环节,但与生产一直在进行中不同,呈交是国防科学数据管理制度实施之后的一个全新开始。呈交还是国防科学数据管理的最大难点,其关键在于如何确保呈交上来的数据完整而真实。国防科学数据作为与科技报告性质相似的科技资源,其呈交也可能会出现类似问题,必须早做预防。为解决这个问题,须多管齐下,进行系统的呈交机制设计。
首先是建立强制呈交制度,取得科研管理部门配合,将数据呈交纳入科研管理程序,明确数据呈交作为项目验收的一个必备条件,未按照规范要求呈交数据,不予验收结题。通过建立强制呈交制度,能够初步解决数据完整性问题,但无法彻底解决数据完整性问题,而且也解决不了数据真实性问题。完全解决这两个问题,还有赖于以下两项制度的配合:一是要取得科研管理部门和人力管理部门的配合,建立对项目承担单位、科研人员呈交数据的激励机制,将呈交数据的数量质量情况与后续承担项目、职称评定、实力评估等挂钩。培育呈交数据是一种荣誉、具有利益、可以“名利双收”的氛围,促使科研人员和项目承担单位自愿呈交高质量的数据。二是要尽力完善国防科学数据中包含的技术秘密保护制度,保障项目承担单位的技术权益不因数据的呈交和共享而受损,这样才能让项目承担单位没有后顾之忧,从而能够呈交完整真实的数据。相对而言,这是国防科学数据管理难点中的难点。
2.3.3 国防科学数据使用
组织开展国防科学数据使用的责任主体是国防科学数据管理机构。国防科学数据管理机构对数据按照统一规范进行加工建库之后,组织开展共享服务和深度挖掘,充分发挥数据的作用价值。
使用是国防科学数据管理的中心环节,从服务对象和服务内容上讲,数据使用可以分为两大类。
一类是共享服务。这是数据使用的主体方式,以科研人员为主要服务对象,以用户自助式查询为主要服务方式。为了促进数据共享使用,首先需要加强数据通报,促进用户对数据的了解;其次要扩大用户查询获取数据的渠道,增强数据查询获取的方便性,使不同环境条件下的用户都能够方便、无差别地使用数据。为此要多管齐下,建立广泛的共享渠道,如依托全军和各部门各行业涉密网络开展涉密数据的网络查询服务,依托京内外涉密场地开展涉密数据的场地查询服务,依托互联网开展公开和解密数据的查询获取服务,针对重点专家、重点单位、重点项目的需求开展数据精准推送服务。
另一类是深度挖掘。组织领域专家和相关专业机构,综合国内外各类科技信息资源,对国防科学数据开展统计分析和深度挖掘,定制开发数据集等产品和研究分析报告。深度挖掘以科研管理部门和特定用户为主要服务对象,主要提供决策咨询支撑服务。
为了切实保障、促进上述各项服务工作的有效开展,需要建立以下制度。
一是建立国防科学数据分级分类使用制度。国防科学数据包含大量的国家秘密信息,很多数据还含有单位的技术秘密信息。这些信息虽然尚未上升到国家秘密高度,但同样甚至比国家秘密信息更需要限定具体的知悉范围,必须明确规定其在一定时期内禁止或只允许某个范围内的人员接触,否则可能不会完整真实地呈交这些数据。不管国防科学数据是否包含国家秘密信息或是单位的技术秘密信息,都要求必须同时符合使用人员的涉密程度与数据的涉密等级相符、该人员属于该项数据的知悉范围之内这两个条件才能对其进行使用。鉴于保密规定仅对此进行了原则性要求,具体操作无章可循。为了切实促进国防科学数据的使用,需要研究制定国防科学数据分级分类使用办法,最终目的是根据人员的涉密程度、业务领域和使用目的,为其科学准确地分配相应密级和知悉范围的数据使用权限,既能确保国家秘密和单位技术秘密信息安全,又能保障用户在权限范围内充分使用数据。
二是建立国防科学数据密级动态管理制度。根据国内外安全形势变化、国防科技发展情况以及军民融合发展需要,定期对国防科学数据的密级、保密期限和知悉范围进行审查,对不再需要保密或维持原来高密级的数据,应该按照规定程序及时进行解密、降密,不断扩大数据的使用范围。
三是建立国防科学数据使用需求沟通机制、效果反馈机制。全面准确了解用户使用数据的目的、方式、使用习惯和偏好,收集用户对服务工作的意见建议,科学评估当前的使用服务工作,针对用户需求不断改进服务方式,提高服务质量。
2.3.4 国防科学数据安全管理
国防科学数据是国家重要的技术资产和宝贵的知识财富,是国家战略性、基础性科技资源,包含大量的国家和军队秘密信息,必须确保安全保密,不得存在任何丢失损坏和失泄密隐患。
安全管理应当贯穿国防科学数据生产、呈交、加工、使用、保管全过程,每一个责任主体、每一个环节均须把安全保密摆在第一位。
其中最关键的是确保国防科学数据管理机构对数据集中保管的安全以及服务时的使用安全,因为在这两个环节集中管理着各单位汇交上来的全部数据,面对来自不同行业领域、使用权限各不相同的用户,情况复杂,不容闪失。
国防科学数据集中保管安全是指国防科学数据管理机构对数据实施安全保密的长期保存,为此要具备符合安全保密要求的场地环境、网络系统等硬件设施和严密的运维制度,具有完善的应急管理和容灾备份机制,确保无论出现任何意外数据都安全可靠。
国防科学数据使用安全是指国防科学数据管理机构在组织开展服务时,要建立严密的用户审查验证程序,严格开展用户权限分配和使用行为监控,禁止超密级、超权限范围使用数据。
3 国防科学数据管理框架的构建
在上述分析的基础上,笔者提炼出国防科学数据管理的总体目标、建设原则和建设框架,希望对国防科学数据管理制度建设和实践有所裨益。
3.1 总体目标和建设原则
国防科学数据管理的终极目标是充分发挥国防科学数据的作用价值,为国防科技创新发展提供重要支撑;直接目标是规范生产、完整呈交、充分使用、安全管理国防科学数据。
国防科学数据管理应当坚持以下原则:保持与国家相关制度相衔接,应最大程度采用国家科学数据管理已有的成熟适用的标准规范,避免另起炉灶;加强与国防科技报告管理的融合,充分依托已有的国防科技报告工作渠道和队伍,提高管理效益;将国防科学数据生产和呈交融入科研管理,充分与科研管理部门配合,完整而真实地生产和呈交数据;在国家层面对国防科学数据实行集中统一管理,在确保安全保密的前提下,共享国防科学数据。
3.2 建设框架构想
3.2.1 建立集中统一的管理体系,实现对国防科学数据的集中管理
一是在国家层面组建国防科学数据工作主管机关,对由国家财政支持的国防科研活动产生的国防科学数据实施集中统一管理。建立国家级国防科学数据管理中心,负责全国范围内国防科学数据的统一接收、集中保管和使用服务。
二是各有关部门的科研管理部门负责组织、监督本部门数据的生产和呈交,督促项目承担单位按规范要求及时呈交数据;信息管理部门负责本部门数据的集中保管和使用服务。
三是作为项目承担单位的科研管理部门,负责管理本单位国防科学数据,组织、督促项目负责人按照规范要求及时生产数据,并在组织审核后及时向上呈交。
3.2.2 建立系统有效的呈交机制,促进国防科学数据完整而真实地呈交
一是建立国防科学数据强制呈交制度,将数据呈交纳入科研管理程序,明确数据呈交作为项目验收的必备条件,未按照规范要求呈交数据,不予验收结题。
二是建立国防科学数据呈交激励机制,将数据呈交情况作为实力评估、职称评定、后续承担项目的条件之一,激发呈交数据的积极性,促使科研人员和项目承担单位生产和呈交高质量的数据。
三是完善数据中包含的技术秘密保护制度,保障项目承担单位的技术权益不因数据呈交和共享而受损,解除项目承担单位的后顾之忧。
3.2.3 开展广泛的使用服务,促进国防科学数据充分使用
一是建立国防科学数据分级分类使用制度,保障用户在权限范围内充分使用数据。
二是建立国防科学数据密级动态管理制度。定期对数据的密级、保密期限和知悉范围进行审查,及时解降密,不断扩大数据使用范围。
三是建立国防科学数据共享服务体系,为科研人员提供查询服务。加强数据通报,促进数据传播;建立广泛顺畅的共享渠道;依托互联网,开展公开和解密数据的查询获取服务;针对重点用户,开展数据精准推送服务。
四是开展国防科学数据统计分析和深度挖掘。定制开发数据集等产品和研究分析报告,为科研管理部门和特定用户提供决策咨询支撑服务。
五是建立国防科学数据使用的需求沟通、效果反馈机制。了解用户使用习惯、偏好和意见建议,持续改进服务方式,提高服务质量。
3.2.4 强化安全保密管理,确保国防科学数据安全
将安全保密要求贯彻到数据生产、呈交、加工、使用、保管全过程和所有责任主体必须确保两个重点:一是在国防科学数据管理机构建立健全符合安全保密要求的场地环境、网络系统、运维制度和容灾备份机制,对数据实施安全稳妥的长期保存,确保数据集中保管的安全;二是各级国防科学数据管理机构在开展服务时,建立严密的用户审查验证程序,严格用户权限分配和使用行为监控,禁止超密级、超权限范围使用数据,确保数据使用安全。
3.2.5 建设国防科学数据管理与服务系统,实现信息化管理
设计开发集生产、审核、呈交、加工、保管、使用和评价等业务内容为一体的国防科学数据管理与服务系统,作为开展国防科学数据管理的基本手段和技术依托,从数据产生源头开始,全面系统地积累序化国防科学数据管理全过程产生的各类信息,有效提升国防科学数据管理的信息化水平和质量、效率,实现国防科学数据的完整规范产生、安全高效管理、充分有效共享、深度挖掘利用。
4 结语
加强国防科学数据管理,对于促进国防科学数据广泛共享、避免重复研究、促进科研诚信具有重要意义。国防科学数据既是科研成果的一部分,又是一种重要的信息资源。国防科学数据的生产是科研工作和科研管理工作的一部分,而其信息资源属性决定了对其的收集、处理和使用属于信息管理工作的一部分。本文在明确工作性质和定位的基础上,详细分析了国防科学数据生产、呈交、使用、安全管理等各阶段的工作内容,指出了生产是国防科学数据管理的基础,关键是建立统一的数据生产标准,确保数据统一规范;呈交是国防科学数据管理的难点,关键是建立强制、激励和保障相结合的数据呈交机制,促进数据完整而真实地呈交;使用是国防科学数据管理的中心,关键是建立分级分类的使用制度和广泛顺畅的共享渠道,保障用户在权限范围内充分使用数据;安全保密是国防科学数据管理的前提,贯穿国防科学数据管理全过程,关键是确保数据的集中保管安全和服务时的使用安全。因此,国防科学数据管理的目标是规范生产、完整呈交、充分使用、安全管理国防科学数据。为实现此目标,提出了以下建设框架:建立集中统一的管理体系,实现对国防科学数据的集中统一管理;建立系统有效的呈交机制,促进国防科学数据完整而真实地呈交;开展广泛的使用服务,促进国防科学数据充分使用;强化安全保密管理,确保国防科学数据安全;建设国防科学数据管理与服务系统,实现信息化管理。