APP下载

汇交地质资料电子文件原始性保证技术研究

2016-12-12马飞飞胡麟臻王成锡郭慧锦

中国矿业 2016年11期
关键词:资料馆数字签名纸质

马飞飞,胡麟臻,王成锡,郭慧锦

(1.中国地质大学(武汉)国家地理信息系统工程技术研究中心,湖北 武汉 430074;2.中国地质调查局发展研究中心,北京 100037;3.全国地质资料馆,北京 100037)



汇交地质资料电子文件原始性保证技术研究

马飞飞1,2,3,胡麟臻2,3,王成锡2,3,郭慧锦2,3

(1.中国地质大学(武汉)国家地理信息系统工程技术研究中心,湖北 武汉 430074;2.中国地质调查局发展研究中心,北京 100037;3.全国地质资料馆,北京 100037)

地质资料的原始性是地质资料真实、可靠的前提,是地质资料汇交过程中急需解决的难题。本文基于目前我国保证地质资料原始性工作的发展历史与现状,利用可行时间戳、数字签名、MD5散列算法三种不同原始性保证技术,并对比这三种方法在汇交地质资料方面的优缺点。通过实践证明MD5散列算法在地质资料原始性检验方面具有操作简单、成本低、无负担等优势,但是由于地质资料保密性和数据格式复杂等原因,MD5散列算法尚需完善。

地质资料;原始性;MD5散列算法

本文所提及的汇交地质资料专指地质工作结束后,由地质资料汇交人按照法律法规和相关技术标准对地质资料进行规范化整理并提交给资料馆藏机构的过程。由于地质资料汇交过程历时长、经手人员多,同时地质资料数据本身具有易纂改和不稳定性,导致了地质数据在资料汇交过程中很难保证其原始性,因此如何利用现代化的高新技术和在地质资料汇交工作实践中的经验,保证地质资料数据的原始性是我馆急需解决的问题。

1 地质资料原始性的概念及工作现状

地质资料原始性是指在地质资料汇交、转送、接收、验收过程没有被改动,地质资料数据的格式、内容、组织方式等都没有做过任何改动,可以作为最原始的信息状态,是由地质资料形成单位提供的一手数据。

我国地质资料采用统一管理的机制,由国家和省两级管理机构负责资料接收、验收、保管和提供社会化服务工作。2003年以前,我国汇交地质资料只需交纸质载体的文件,在2002年国土资源部发布了《关于开展成果地质资料电子文件汇交工作的通知》后,地质资料汇交从只提交纸质载体变更为纸质与电子资料同时汇交的模式,这标志着地质资料汇交进入了数字化时代。在电子文件汇交前期,纸质载体还是主要的信息载体,但是,随着信息化的不断发展,以及地质工作新技术新方法的应用,地质资料汇交电子文件已经逐渐成为主体,尤其近年来数据库建设和软件开发的项目越来越多,这些项目形成的资料无法或很难打印在纸上,电子文件成为信息形态的近乎唯一的表现形式。可以看出地质资料汇交工作目前可以分为三个阶段:第一阶段是纸质载体汇交;第二阶段是以纸质载体为主的纸电汇交;第三阶段是以电子文件为主的纸电汇交。

地质资料汇交工作的变化决定了地质资料原始性保证手段的变化。第一阶段只汇交纸质载体时,保证资料的原始性相对简单,这是由其纸质文件自身特点所决定的。首先,纸质地质资料的产生是由资料形成人直接打印,保留着最原始的记录;其次,纸质资料在流转过程中不易被修改,即使被修改也容易被发现;最后,纸质资料通过盖章来保证其原始性,汇交的纸质资料需加盖形成单位的公章和资料编者的签名。第二阶段以纸质载体为主的纸电汇交阶段,地质资料馆藏机构人员在验收资料时,以纸质载体为依据,对照电子文件内容,纸电内容完全一致时就认为其保持了原始性。第三阶段以电子文件为主的纸电汇交阶段,其中汇交的纸质资料依旧通过盖章的方式保证其原始性,汇交的电子文件部分内容无法完全呈现在纸质资料之上,纸电内容无法保持完全一致,这样的情况下就需要采用信息化技术手段来保证地质资料的原始性。

汇集纸质地质资料盖章信息,如表1所示。

表1 汇交地质资料加盖公章信息表

2 汇交地质资料电子文件原始性的重要性分析

2.1 地质资料档案性决定需保持原始性

地质资料具有档案性属性,地质资料的档案性表现为对地质历史的记录,一般资料年代越久远,其档案性越强。地质资料的档案性具有巨大的开发和利用价值,例如全国地质资料馆纪念抗日战争胜利70周年展览,就是通过研究抗日战争时期形成的地质资料,生动再现日本帝国主义对我国矿产资源有掠夺和我国地质先辈为全面抗战胜利作出的重大贡献。地质资料是地质历史的记录,所以需要保证资料的原始性才能真实的再现历史。

2.2 地质资料凭证作用需保持原始性

地质资料最主要的类别为矿产勘查资料,其中的探矿权采矿权资料是矿产投资的重要依据,矿产投资是高风险高回报的产业,涉及到巨大的经济利益,如果在投资矿产时参考的地质资料有问题,将会导致决策失误,我国资源安全和人民财产流失,损失不可估计。在司法采信的证据中,作为原件的地质资料是其作为证据的主要因素[1]。馆藏机构作为地质资料社会化服务的提供者,需要能回溯地质资料的来源,并能证明地质资料为探采矿的地勘单位提供的原始数据。地质资料的原始性与凭证的真实性是紧密相连的,发挥地质资料的凭证作用必须保持资料的原始性。

2.3 电子文件特性决定需保持原始性

电子文件具有信息的易读取、易修改和易搬迁性,信息对硬件设备依赖性,信息与载体易分离性[2-3]几个基本特性,由于电子文件的特性,在其流转、保管和利用的环节都有可能被修改或者丢失文件,需要通过技术手段保证电子文件的原始性。

2.4 地质资料汇交过程需保持原始性

地质资料汇交是环节复杂过程缜密的工作。地质项目通过专家评审后,进入了资料汇交阶段,资料汇交人需向国家或省级地质资料馆藏机构提交地质资料,馆藏机构在接收资料后进行检查验收,验收不合格的资料退回汇交人进行补充修改,直到验收合格,验收合格的资料由负责接收资料的馆藏机构转送相关馆藏机构,这是一个完整的资料汇交过程,所以必须保持资料的原始性才能确保资料来源可靠。

2.5 社会化服务需要提供原始数据

地质资料管理的重要的目的之一是社会化服务,全国地质资料馆每年发布一系列服务产品,如公开版25万地质图数据、全国生态环境地质专题、整装勘查地质资料等。除提供经过资料开发利用整合后的数据外,全国地质资料馆的服务主体是汇交人汇交的原始数据,据全国地质资料馆服务量数据显示,2014年全国地质资料馆共为3540人次提供了23572份次的地质资料的服务。地质资料服务工作提出了需要保持资料的原始性才能更好的为用户提供最真实的服务产品。

3 汇交地质资料电子文件原始性保证技术

全国地质资料馆探索试用了可信时间戳、数字签名、MD5散列算法三种不同的技术来保证资料的原始性,下面将具体介绍每种方法。

经过管理后,观察组的不良事件发生率为护理安全事故7.41%(2例),护理纠纷为3.70%(1例),不良事件发生率为11.11%(3例)。对照组患者的不良事件发生率为护理安全事故14.81%(4例),护理纠纷为11.11%(3例),不良事件发生率为25.92%(7例)。两组结果对比,观察组的不良事件发生率明显低于对照组,差异有统计学意义(χ2=7.269,P=0.007)。

3.1 可信时间戳

可信时间戳是指由权威、可信时间戳服务中心签发的一个能证明数据电子文件在某一时间点是已经存在的、完整的、可验证的,具备法律效力的电子凭证,可信时间戳主要用于电子文件防篡改和事后抵赖,确定电子文件产生的准确时间,是一种符合《中华人民共和国电子签名法》的技术,能有效证明数据电文(电子文件)产生的时间和内容的完整性,解决了数据电文(电子文件)易被篡改伪造的问题,保证了数据电文的客观性、真实性[5]。

经验证可信时间戳技术并不适合于汇交地质资料电子文件原始性的管理。首先,虽然对于单个汇交地质资料电子文件授予可信时间戳其成本较低,但汇交地质资料电子文件数量庞大,全部授予可信时间戳,其总体成本将非常高,操作过程的工作量亦非常大;其次,汇交地质资料电子文件具有一定法律属性,要求其在必要时刻可作为法律证据,所以不能采用自建时间戳的方式,因此在授予可信时间戳时需和权威时间源绑定,并由国家授时中心(可信任的第三方权威机构)负责授时和守时,以保障并保持时间源的绝对可靠性,并进行实时监测,这就要求汇交地质资料电子文件具有网络特性,而这和汇交地质资料电子文件的保密特性是相冲突的。

3.2 数字签名

数字签名(又称公钥数字签名、电子签章)是一种类似写在纸上的普通物理签名,其使用公钥加密领域的技术实现,是一种用于鉴别数字信息的方法。一套数字签名通常定义两种互补的运算,一种用于签名,另一种用于验证。数字签名是非对称密钥加密技术与数字摘要技术的应用[5]。

数字签名的设计初衷是为了保障电子文件的传输安全,虽然数字签名可以用来验证电子文件的真实性和完整性,但并不能满足地质资料电子文件安全管护的全部需要。首先,地质资料组成较为复杂,其包含的电子文件存在文件数量多、文件类型多的特征,数据签名技术在保障地质资料文件完整上存在缺憾;其次,数字签名技术过于依赖私钥安全,在实际操作过程中,私钥的安全保管和安全使用将成为汇交人和馆藏机构的一大负担。

MD5算法是一种散列算法,可以将一段任意长度报文(数据文件,文本文件或者二进制文件),通过一系列运算压缩成一段128 位的信息摘要,目前广泛应用于电子文件数字指纹的提取和校验。MD5散列算法在电子文件原始性校验方面的应用是利用了它的单向加密性,即不可逆性,对某一指定电子文件,MD5算法可根据其内容生成一组128位摘要数据,当文件内容发生变化时(增加内容、修改内容和删除内容),再利用MD5算法运算将得到完全不同的一组128位消息摘要。

通过运算压缩成一段128位的信息摘要如图1所示。

图1 MD5算法示意图

从理论和逻辑模型上,MD5加密技术相对适用于地质资料原始性校验的应用。首先,MD5加密技术操作相对简单,没有专业技术门槛的要求;其次,MD5加密技术成本低,MD5加密技术在地质资料电子文件原始性审计的使用过程中几乎没有额外成本;第三,MD5加密技术不会增加太多附加的管理负担,MD5算法计算结果只是电子文件本身的一个信息摘要,并不需要汇交人和馆藏机构保管多余的秘钥。因此,相对其他技术,MD5目前较为适宜作为地质资料原始性校验方法。

4 MD5技术在汇交地质资料原始性中的应用

由于MD5技术在使用复杂度、应用成本和管理负担有等方面都具有一定优势,全国地质资料馆在地质资料电子文件原始性保证上使用了MD5技术。

在使用ED-Maker软件进行地质资料汇交资料包(以下简称汇交包)制作时,系统自动提取汇交包中所含电子文件的MD5摘要信息,并将其记录到汇交包指定的附加文件(A文件)中,待计算和记录过程完成后,系统再计算A文件的MD5摘要信息,并将A文件的MD5摘要信息记录到电子文件登记表上,在地质资料汇交时,采用双套制的汇交办法,要求纸质电子文件登记表加盖汇交人单位公章,汇交验收时要求纸电一致,这样就能形成地质资料汇交过程中原始性审计的完整闭环。

MD5码在汇交地质资料中原始性审计流程见图2。

地质资料原始性验证时,首先通过纸质电子文件登记表上所记载MD5摘要字符串确认A文件是否被修改,如A文件已被修改,原始性验证失败,如A文件未被修改,则A文件记录信息则可验证汇交地质资料中所有文件的原始性。

图2 MD5码在汇交地质资料中原始性审计流程图

汇交地质资料原始性验证流程图见图3。

5 结 论

本文通过对地质资料原始性及其保证技术的研究,得出以下结论。

1)地质资料具有保密的特性,在技术的选择上受到保密的约束,不能采用依附于网络的技术。

2)地质资料汇交动作由各资料形成单位完成,因此本文把资料原始性技术定位在地质资料入馆前。全国地质资料馆是资料的保管单位,只需保证资料是形成单位提交的没有经过修改的,不对资料的内容进行验证。

图3 地质资料原始性验证流程示意图

3)在实际应用中发现MD5散列算法虽然是最经济快速的算法,但是由于地质资料的数据量巨大,同类型文件多,文件存储零散路径深等特性,会存在电子文件和MD5码不能做到完全一一对应的情况。MD5散列算法在汇交地质资料的应用上还需要继续改进。

[1] 蔡学美.数字时代档案原始性的特征和应对策略[J].中国档

案,2012(7):68-70.

[2] 张正强.再论对电子文件特性的科学认识[J].档案学研究,2011(2):4-10.

[3] 杨建军.电子档案的原始性和真实性认定及保护[J].数字与缩微影像,2006(4):11-15.

[4] 易彦君.论可信时间戳在电子档案中的应用[J].云南档案,2013(8):28-30.

[5] 张先红.数字签名原理及技术[M].北京:机械工业出版社,2004:15-98.

Research on protecting aboriginality of electronic geological data

MA Fei-fei1,2,3,HU Lin-zhen2,3,WANG Cheng-xi2,3,GUO Hui-jin2,3

(1.National Engineering Research Center for Geographic Information System,China University of Geosciences(Wuhan),Wuhan 430074,China;2.Development and Research Center,China Geological Survey,Beijing 100037,China;3.National Geological Archives of China,Beijing 100037,China)

The facticity and authenticity of the geological data is attributed to its aboriginality,which has become a difficult issue badly in need of solution.In this paper,based on the review of development history and present status for the work of ensuring the data aboriginality in China,three different aboriginality assurance technologies contains the credible time stamp,the digital signature and the MD5 hash algorithm had been used and compared with each other in the collection of geological date.Finally,the MD5 hash algorithm proved that has the advantage of simple to operation,economical and free of burden in verification of geological data aboriginality.But due to the confidentiality and the complexity of data formats for geological data such as reason,the MD5 hash algorithm still need to be further improved.

geological data;originality;MD5 hash algorithm

2016-07-20

中国地质调查局地质矿产调查评价专项“地质资料资源汇聚与管理”计划项目所属子项目“地质资料服务基础设施建设”资助(编号:1212011220354)

马飞飞(1981-),女,硕士,2008年毕业于中国地质大学(北京)地球探测与信息工程专业,主要从事地质资料汇交管理方面的工作。E-mail:mafeifei9299@163.com。

胡麟臻(1984-),男,硕士,2009年毕业于中国地质大学(北京)地球探测与信息技术专业,主要从事地质资料电子文件备份管理方面的工作。 E-mail:hlinzhen@mail.cgs.gov.cn。

C931.9

A

1004-4051(2016)11-072-04

猜你喜欢

资料馆数字签名纸质
基于正交拉丁方理论的数字签名分组批量验证
交通运输行业数字签名系统的设计与实现分析
浅析计算机安全防护中数字签名技术的应用
四川省图书馆发布2019年阅读报告
法国电影资料馆举办贾樟柯作品回顾展
布达拉宫纸质文物修复——以佛经公文为例
独立书店浪漫的纸质生活
掌握方法用好数字签名
2012年北京国资联年会日程表
军事科学院军事图书资料馆珍藏的各种版本《毛泽东自传》