电子发票核心元数据构成与捕获研究
2018-09-19张雅君李泽锋
张雅君 李泽锋
摘要:本文依据新修订的《会计档案管理办法》,《文书类电子文件元数据方案》等档案行业标准,引入全生命周期管理思想,以电子发票的电子属性与电子签名等构成其核心元数据,提出捕获前应实施严格的前端控制,捕获中采取系统自动捕获与嵌入两种方式。
关键词:电子发票核心元数据捕获
电子发票作为电子会计资料中一个重要的支付凭证,必将归档作为电子会计档案进行保存,但存在着归档后的真实性保障问题。本文依据新修订的《会计档案管理办法》、财政部《财政电子票据管理基本流程》、《文书类电子文件元数据方案》(DA/T 46-2009)等,引入全生命周期的管理思想,将财政部门、开票单位、缴款单位三方对电子发票的管理通过元数据建立有机联系,研究电子发票核心元数据的构成,提出核心元数据的捕获策略。
一、电子发票生成流程
电子发票从制样开始,经历赋码、开具、传输查验、入账和归档等流程环节,有财政部门、开票单位、缴款单位三方参与其中,都需要对电子发票进行归档与管理。其中,财政部门归档作为备查依据,开票单位归档作为记账依据,缴款单位归档作为报销凭据。也就是说,同一份电子发票应在三个机构进行归档,需要“分别按照《会计档案管理办法》的有关规定进行归档,形成符合长期保管要求的电子会计档案”。[1]
二、电子发票核心元数据构成
元数据管理有助于保证电子文件的真实性、完整性、可靠性、可用性,保障电子文件的证据特性,这一观点已是学界的共识。新《会计档案管理办法》第十二条规定,“电子会计档案移交时应当将电子会计档案及其元数据一并移交,且文件格式应当符合国家档案管理的有关规定”。[2]
(一)电子发票核心元数据构成
目前,电子会计档案元数据方案尚未制定,按照《电子文件归档与电子档案管理规范》(GB/T 18894-2016)规定,专业类电子文件元数据的归档范围可以参照《文书类电子文件元数据方案》(DA/T 46-2009,以下简称《方案》)执行。
《方案》中许多元数据在纸质档案管理中有了成熟的获取与管理经验,如《方案》中M21-M39关于题名、主题词等的元数据,M76-M79关于机构/人员的元数据,M80-M83关于业务行为的元数据等,和纸质档案的著录有相通之处。还有一些元数据是电子文件所特有,对电子文件的真实性、长期可读性有着至关重要的作用,如电子属性(M46-M51)、数字化属性(M52-M56)、电子签名(M57-M64)等。从长期保存视角,本文定义这些电子文件所特有的元数据为核心元数据。
由于数字化属性元数据是当电子文件由扫描或缩微影像转换形成时才是必选元数据,而电子发票是原生性电子文件,因此将电子属性、电子签名两方面的元数据作为电子发票的核心元数据。
(二)确定核心元数据中的各子元素
《方案》中,电子属性与电子签名是容器型元数据,包含若干个元数据。[3]
1.电子属性
《方案》中电子属性包括格式信息、计算机文件名、计算机文件大小、文档创建程序与信息系统描述五个子元素。电子发票所選用的文件格式应该满足行业标准《版式电子文件长期保存格式需求》(DA/T 47-2009)的要求,目前主要使用有国家标准支撑的PDF/ A-1格式,《方案》中的“文档创建程序”“信息系统描述”这两个元数据就没有必要作为电子发票的元数据再加以著录。
因此,电子发票元数据的电子属性元数据可以保留格式信息、计算机文件名、计算机文件大小三个元数据。
2.电子签名
《方案》中编号M57的“电子签名”含7个子元素:签名规则、签名时间、签名人、签名结果、证书、证书引证、签名算法标识。
电子签名一般由CA认证中心颁发,其对每一个颁发出的电子签名有其相应的记录,并归档保存。对于电子签名元数据来说,把电子签名涉及技术相关的内容交由认证中心来保障,电子文件元数据只记录电子签名使用的过程,在档案实际工作中更容易操作,更有利于档案人员对元数据的著录与捕获。按照该思路,《方案》中“签名规则”“签名算法标识”可由CA认证中心进行保障,将“证书”分为“证书颁发者”、“证书编号(在认证中心的唯一编号)”,电子文件通过这两个元数据建立与CA认证中心的联系,进一步提供“签名规则”、“签名算法标识”元数据。《方案》中“证书引证”用于指向验证签名证书的链接,由于建立了与CA认证中心的联系,该元数据也可不用。因此,电子签名元数据所包含的子元素应有签名证书颁发者、签名证书编号、签名人、签名时间。
按照财政电子票据基本流程,电子发票开票单位开具生成含有单位签名的票据信息后,通过系统自动上传到财政端,以追加财政监制签名,制作生成完整的财政电子票据,即电子发票有两个电子签名。
因此完整的电子发票电子签名元数据包括证书颁发者、签名证书编号、签名人、签名时间、签名原文引用、签名值。其中,签名原文有两类:开票单位电子签名原文与财政部门监制电子签名原文。前者包括财政电子票据头部、财政电子票据票面信息,后者包括开票单位电子签名原文的Hash值、开票单位电子签名。
三、核心元数据的捕获
(一)捕获前核心元数据的前端控制
在电子发票全生命周期过程中,要特别关注核心元数据捕获的及时性。一旦前一阶段忽略了相应元数据的著录,后面阶段将很难再弥补。
电子签名元数据所包含的子元素是电子发票真实性的重要保障,《方案》专门对其信息来源进行了描述,“由形成、处理、管理电子文件的系统捕获或手工著录”,实际上,在发票生成阶段如果没有著录该元数据值,归档后基本不可能再进行补录。对于电子属性元数据,一般来说在文件归档后很难再进行捕获或手工著录,即使著录也会出现著录不全的问题。考虑到电子发票的特殊性,其格式较为固定,归档后可以补录,但归档时涉及电子票证较多,最好还是由前端进行记录,归档时进行捕获。
从以上分析可以看出,电子发票长期保存所需的核心元数据大多在其形成阶段生成,电子发票管理系统应当在电子发票生成过程中,实施严格的前端控制,将核心元数据如实记录并保存在管理系统中。考虑到核心元数据的技术特性,人工著录困难,其记录与保存应该由系统自动完成,可以保证元数据的完整齐全、真实可信。这就要求发票管理系统(含财政端和单位端)应具有电子文件管理的特定功能,真正实现前端控制。
(二)核心元数据的捕获方式
1.系统自动捕获
该方式主要是针对财政部门与具有接口的开票单位,实现财政部门归档作为备查依据、开票单位归档作为记账依据。这些单位可较好实现电子发票管理系统与档案管理系统的对接,核心元数据由系统自动生成、捕获,并通过捕获接口将电子发票及其相关元数据连同其他相关电子会计档案一起归档到档案管理系统中,该捕获接口应包含捕获的时机、动作、范围、封装等内容[4]。
该方式可以实现电子发票及其元数据的实时捕获,电子发票一旦在管理系统中生成,其相应元数据同时生成,这时不论其是否办理完毕,均按照既定要求进行捕获。更进一步的是,在设计电子发票管理系统功能时,将电子发票的归档范围和归档要求设计在发票管理系统之中,属于该范围的电子发票一经生成就被加上归档标识,自动生成并捕获相应核心元数据,使之具有防止非法修改和删除的属性,确保其安全留存和内容真实。通过指针、链接等方式在核心元数据和发票文件之间建立联系,并始终维护其关联,从而真正满足《电子文件管理系统通用功能要求》(GB/T 29194-2012)的要求。
2.嵌入到电子发票中
该方式主要针对于使用生成系統单位端或第三方服务公司开具电子发票的开票单位与缴款单位。其特征是单位难以与发票管理系统建立接口,不能实现元数据的实时捕获,由于电子发票已脱离了管理系统,就需要采用嵌入方式将核心元数据嵌入到电子发票中,以满足前端控制。
按照《电子档案管理基本术语》(DA/T 58-2014),嵌入是指“将元数据内嵌于电子档案的过程”。电子发票是一个标准的版式电子文件,完全可以通过设置规范的元数据,以XML方式内嵌入电子发票中,用于描述其属性特征。实际上,电子签名的颁发者、使用者、序列号、哈希算法等均已嵌入到了电子发票中,成为电子发票计算机文件的有机组成部分。嵌入的信息并不是都成为核心元数据,应按照前述分析挑选相应信息作为元数据。这种方式下,档案管理系统应具有从电子发票中提取核心元数据的功能。
*本文系河南省教育厅人文社科研究一般项目“新《会计档案管理办法》下的电子发票归档保存研究”(2017-ZZJH-559)的成果之一。
参考文献:
[1]中华人民共和国财政部.财政电子票据管理基本流程[Z].2017.6.
[2]中华人民共和国财政部,国家档案局.会计档案管理办法[Z].2015.12.
[3]国家档案局.DA/T 46-2009文书类电子文件元数据方案[S].
[4]李泽锋,于红焱.全生命周期管理中电子文件捕获工作实现研究[J].北京档案,2017.5.