APP下载

大亚湾核电站电子文档元数据著录研究

2020-01-08生态环境部核与辐射安全中心廉旭姣

办公室业务 2019年23期
关键词:著录文档信息

文/生态环境部核与辐射安全中心 廉旭姣

大亚湾核电站的文档管理贯穿于核电生产活动中的各个方面,根据HAF040《核电厂质量保证安全规定》的要求,必须按照书面程序和指令建立和执行有关质量保证记录的产生、鉴别、收集、标引、立卷、存放和处理的制度,必须在质量保证大纲实施过程中编写质量保证记录,以证实核电厂已经按照特定要求完成影响质量的各项活动。为此,大亚湾核电站制定出了严格的文档管理体系,具体的工作大致分为文档控制、文档管理和文档服务,从文件的产生、生效、分发、使用、记录报告的收集等各个环节进行了文件控制管理。为了有效地运作文件管理体系,依据《核电电子文件元数据》NB/T20418-2017的要求,分析大亚湾核电站文档管理元数据著录的规范。

一、元数据标准体系

元数据标准体系由元数据标准框架、根据元数据标准框架扩展出来的专门元数据标准以及对应的元数据标准管理系统和元数据著录系统构成。其中,元数据标准框架又由核心元数据标准和它的扩展原则构成。它们之间的相互关系如图所示。

二、元数据元素定义方法

元数据表中各个元素都用13个属性进行描述:1.编号:按一定规则排列的元数据的顺序号。2.中文名称:元数据元素的中文标识。3.英文名称:元数据元素的英文标识。4.定义:元数据元素含义的描述。元数据的一般定义是关于数据的数据(data about data)。详细来讲,元数据是指提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述。其作用是描述信息资源或数据本身的特征和属性,规定数字化组织,具有定位、发现、证明、评估、选择等功能。标识信息是指:根据文档的来源信息,为科学、有序地管理文件及档案而赋予文档的各种标识符。内容信息是指:内容信息是描述、揭示与文档内容相关的内部与外部特征的信息,如题名、版本信息、语种、主题、内容描述。结构信息是指描述文档的物理结构,如排列组合方式、文件构成方式、各构成部分之间的连接方式、相关文件之间的关系及在存储器中的构成等信息的元数据,包括文件集合类型、文件格式、文件大小等。背景信息是指描述生成文档的职能活动、作用、办理过程、结果、上下文关系以及对其产生影响的历史环境等信息。即文档在归档之前产生的各种信息。背景元数据由文件的生成、流转、登记、分发、办理、关联信息、技术环境信息等构成。管理信息是指记录文档所有管理操作活动的信息,包括鉴定信息、归档信息、权限管理、维护历史等信息。1.目的:描述该元数据元素必要性和作用。2.约束性:说明采用该元数据元素的强制性程度,分“必选”“条件选”和“可选”。“必选”表示必须采用;“条件选”表示满足某一特定条件,则必须采用;“可选”指根据用户需要选用或不选用。3.可重复性:元数据元素是否可以重复出现。4.数据类型:为表达元数据元素值而规定的值集合的描述符。本标准数据类型包括字符型、数值型、日期时间型。容器型元素没有数据类型。5.编码修饰体系:对该元数据元素信息的描述应遵循的编码规则。6.值域:可以分配给元数据元素的值。7.缺省值:该元数据元素的默认值。8.信息来源:元数据元素值的来源。9.注释:对元素的进一步说明或事例。

三、核电文档元数据集结构

根据核电文件、档案的构成,及其生成、管理与利用等不同时期的特征,对核电文档元数据表进行了定义。核电文档元数据子集分为:标识信息、内容信息、背景信息、管理信息。每个元数据子集对应的元素和子元素,元数据属性中[M]表示必选,[O]表示可选,[C]表示条件选(满足条件时必选),[R]表示可重复(数据可多次输入,不覆盖)。结构信息贯穿于标识信息、内容信息、背景信息、管理信息这些核电文档的元数据子集中,结构的形式根据具体要求可以是聚合层次,元数据的属性为[O],还可以文件组合类型,元数据的属性为[C]。载体信息有载体规格(元数据的属性为[M])、计量单位(元数据的属性为[M])、介质(元数据的属性为[M])、载体数量(元数据的属性为[O])。电子文件大小的元数据属性为[M],电子文件格式、电子文件类型的元数据属性为[M][R]。

(一)标识信息元数据子集。1.档案标识:编号为M1。档案标识元素对应的子元素为:(1)档案馆代号:编号为M1-1,元数据属性为[C]。(2)档案馆名称:编号为M1-2.元数据属性为[C]。(3)全宗号:编号为M1-3,元数据属性为[C]。全宗号需要在系统里进行著录。(4)全宗名称:编号为M1-4,元数据属性为[C],全宗名称需要进行著录标引。(5)全宗形式:编号为M1-5,元数据属性为[C],全宗形式需要进行著录标引。2.核电站标识:编号为M2。核电站标识元素对应的子元素为:(1)核电站代号:编号为M2-1,元数据属性为[M][R],核电站代号需要进行著录标引。(2)核电站名称:编号为M2-2,元数据属性为[M][R],核电站名称需要进行著录标引。(3)反应堆类型:编号为M2-3,元数据属性为[O],根据核电厂具体采用的反应堆类型进行著录标引。(4)机组号:编号为M2-4,元数据属性为[M]。在业务上需要进行著录标引。(5)机组功率:编号为M2-5,元数据属性为[O],根据核电厂机组的功率进行著录标引。(6)核电基地名称:编号为M2-6,元数据属性为[O],根据核电厂基地进行著录标引。3.文档标识:编号为M3。文档标识元素对应的子元素为:档案编码(编号为M3-1)、文件编码(编号为M3-2)、文件编码说明(编号为M3-3)、文件原文编码(编号为M3-4)、接收渠道号(编号为M3-5)。其中档案编码、文件编码的元数据属性[M],二者在业务上都需要档案和文件控制。文件原文编码和接收渠道号的元数据属性都为[O],在业务上,文件原文编码进行著录标引,接收渠道号需要进行文件控制。4.位置标识:编号为M4。位置标识的子元素有存档位置(编号为M4-1)、存档号(编号为M4-2)、逻辑位置(编号为M4-3)、物理位置(编号为M4-4)、存储载体标识(编号为M4-5)、电子文件名(编号为M4-6),其中存档位置、存档号、存储载体标识的元数据属性为[M],在业务上需要库房管理。

(二)内容信息元数据子集。1.题名:编号为M5。提名标识的子元素有文件中文题名(编号为M5-1)、文件英文题名(编号为M5-2)、案卷中文标题(编号为M5-3)、案卷英文标题(编号为M5-4)、副标题及提名说明(编号为M5-5)。文件中文题名和案卷中文标题的元素属性为[M],在业务上都需要文件控制或者是档案控制,文件英文题名、案卷英文标题、副标题及提名说明的元素属性为[O],文件英文题名和案卷英文标题在业务上需要档案控制,副标题及提名说明在业务上进行著录标引。2.版本信息:编号为M6。版本信息的子元素有稿本(编号为M6-1)、版本号(编号为M6-2)、版本日期(编号为M6-3)。版本号和版本日期的元素属性为[M],在业务上进行文件控制。稿本的元素属性为[O]。3.主题:编号为M7。主题的子元素有中文主题词(编号为M7-1)、英文主题词(编号为M7-2)、中文关键词(编号为M7-3)、英文关键词(编号为M7-4)、人名(编号为M7-5)、地名(编号为M7-6)、机构名(编号为M7-7)、系统代码(编号为M7-8)、厂房代码(编号为M7-9)、设备功能位置码(编号为M7-10)、设备类型代码(编号为M7-11)。其中中文主题词、英文主题词、英文关键词、厂房代码、设备功能位置码、设备类型代码的元素属性为[O][R],在业务上根据核电厂的具体情况需要进行著录标引。人名、地名、机构名的元素属性为[O],系统代码的元素属性为[O][R],中文关键词的元素属性为[M][R],在业务上进行著录标引。4.内容:编号为M8。内容的子元素有风险等级(编号为M8-1)、质量安全等级(编号为M8-2)、摘要(编号为M8-3)、覆盖范围(编号为M8-4)、附件(编号为M8-5)、卷内文件的起始日期(编号为M8-6)、卷内文件的终止日期(编号为M8-7)、图纸类别(编号为M8-8)、基准文件(编号为M8-9)、文件分类(编号为M8-10)、文件类型(编号为M8-11)、文件等级(编号为M8-12)、页数(编号为M8-13)、发文单位(编号为M8-14)、收文单位(编号为M8-15),其中风险等级、质量安全等级、摘要、覆盖范围、卷内文件的起始日期、卷内文件的终止日期、图纸类别、基准文件、文件分类、文件类型、发文单位、收文单位的元素属性为[O],在业务上根据核电厂的具体信息进行著录标引。文件等级、页数的元素属性为[M],在业务上进行著录标引。附件的元素属性为[O][R],根据核电厂的具体信息进行著录标引。

(三)背景信息元数据子集1.文件制作:编号为M9。文件制作的子元素有编制单位(编号为M9-1)、编制者(编号为M9-2)、编制原因(编号为M9-3)、编制日期(编号为M9-4),编制单位、编制者、编制日期的元素属性为[M][R],在业务上进行著录标引。编制原因的元素属性为[O][R],根据核电厂进行著录标引。2.文件流转:编号为M10。文件流转的子元素有校核者(编号为M10-1)、会签者(编号为M10-2)、会签日期(编号为M10-3)、校核日期(编号为M10-4)、审核者(编号为M10-5)、审核日期(编号为M10-6)、批准者(编号为M10-7)、批准日期(编号为M10-8)、批准者(编号为M10-9)、流转状态(编号为M10-10)、紧急程度(编号为M10-11)、接口状态(编号为M10-12)、文件审查结果(编号为M10-13)、母本文件移交时间(编号为M10-14)、签收人(编号为M10-15)、签收日期(编号为M10-16)。校核者、会签者、会签日期、校核日期、审核者、审核日期、批准者、流转状态、签收人、签收日期的元素属性都为[O][R],紧急程度、接口状态、文件审查结果、母本文件移交时间的元素属性都为[O],批准者和批准日期的元素属性为[M][R],文件流转的子元素中,除了签收人和签收日期在运用中需要库房进行控制,其余的子元素在业务上需要文件控制。3.分发信息:编号为M11。分发信息的子元素有主送单位(编号为M11-1)、主送人(编号为M11-2)、主送日期(编号为M11-3)、抄送单位(编号为M11-4)、抄送人(编号为M11-5)、抄送日期(编号为M11-6)、分发方式(编号为M11-7)、发布日期(编号为M11-8)、发布者(编号为M11-9)。主送单位、主送人、主送日期、抄送单位、抄送人、抄送日期的元素属性为[O][R],在业务上根据核电厂的具体情况进行文件控制。分发方式、发布日期、发布者的元素属性为[O],在业务上进行文件控制。4.办理信息:编号为M12。办理信息的子元素有批示人(编号为M12-1)、批示日期(编号为M12-2)、批示意见(编号为M12-3)、承办部门(编号为M12-4),这些子元素属性为[O][R]。5.数据接收:编号为M13。数据接收的子元素有数据接收方式(编号为M13-1)、数据接收日期(编号为M13-2)、原始信息系统(编号为M13-3)、原始文档管理系统(编号为M13-4)、原始文件大小(编号为M13-5)、原始文件格式(编号为M13-6)、源计算机文件名(编号为M13-7)。数据接收方式、数据接收日期、原始信息系统、原始文档管理系统的元素属性为[O],原始文件大小、原始文件格式、源计算机文件名元素属性为[M],在业务上都需要信息控制。6.运行环境:编号为M14。运行环境的子元素:网络环境(编号为M14-1)、操作系统(编号为M14-2)、硬件环境(编号为M14-3)、应用软件(编号为M14-4)、文件专用浏览器(编号为M14-5),这些子元素的属性为[O],在业务上需要进行档案控制或者信息控制。7.知识产权属性:编号为M15。知识产权属性的子元素有知识产权类型(编号为M15-1)、知识产权归属(编号为M15-2)、知识产权说明(编号为M15-3),这些子元素的属性为[O],在业务上需要知识产权控制。8.关联:编号为M16。关联的子元素有关联项标识(编号为M16-1)、关联类型(编号为M16-2)、关联描述(编号为M16-3)、案卷链接(编号为M16-4)、文件链接(编号为M16-5)、相关记录链接(编号为M16-6)、相关文件链接(编号为M16-7),关联类型、关联描述、案卷链接、文件链接、相关记录链接、相关文件链接的元素属性为[O],关联项标识的元素属性为[C],在业务上进行著录标引。

(四)管理信息元数据子集。1.归档描述:编号为M17。归档描述的子元素有归档单位(编号为M17-1)、归档方式(编号为M17-2)、归档类型(编号为M17-3)、归档日期(编号为M17-4)、归档人(编号为M17-5)、组卷人(编号为M17-6)、实体标识(编号为M17-7)。归档方式、归档类型、归档人的元素属性为[O],归档单位、归档日期、组卷人、实体标识的元素属性为[M],这些子元素在业务上需要进行档案控制。2.鉴定信息:编号为M18。鉴定信息的子元素有鉴定类型(编号为M18-1)、鉴定方法(编号为M18-2)、鉴定日期(编号为M18-3)、鉴定者(编号为M18-4)、鉴定意见(编号为M18-5)、保管期限(编号为M18-6)、审查周期(编号为M18-7)、下次升版日期(编号为M18-8)、替换程序(编号为M18-9),鉴定类型、鉴定方法、鉴定日期、鉴定者、鉴定意见的元素属性为[O],在业务上需要档案控制,审查周期、下次升版日期的元素属性也为[O],但是在业务上需要依据核电厂采用著录标引。保管期限的元素属性为[M],在业务上需要进行档案控制,替换程序的元素属性为[O][R],在业务上进行著录标引。3.处置信息:编号为M19。处置信息的子元素有注销日期(编号为M19-1)、注销人(编号为M19-2)、处置责任者(编号为M19-3)、处置日期(编号为M19-4)、处置类型(编号为M19-5)、处置说明(编号为M19-6)、处置结果(编号为M19-7)、销毁审批者(编号为M19-8)、销毁者(编号为M19-9)、销毁日期(编号为M19-10)、销毁原因(编号为M19-11)、移交部门(编号为M19-12)、移交责任者(编号为M19-13)、移交日期(编号为M19-14)、接收部门(编号为M19-15)、接收人(编号为M19-16)、接收日期(编号为M19-17)。处置责任者、处置日期、处置类型、处置结果、销毁审批者、销毁者、销毁日期、销毁原因、移交部门、移交责任者、移交日期、接收部门、接收人、接收日期这些元素的属性为[M],在业务上需要档案鉴定和文件控制。注销日期、注销人的元素属性为[C],业务的说明是依照核电厂进行文件控制。处置说明的元素属性为[O],在业务上进行档案鉴定。4.权限管理:编号为M20。权限管理的子元素有授权对象(编号为M20-1)、授权行为(编号为M20-2)、授权起始日期(编号为M20-3)、授权终止日期(编号为M20-4)、使用条件(编号为M20-5)、使用范围(编号为M20-6),授权对象、授权行为、授权起始日期、授权终止日期的元素属性为[O][R],在业务上受制于文档服务的控制。使用条件、使用范围的元素属性为[O],同时也是受到文档服务的控制。5.利用反馈:编号为M21。利用反馈的子元素有利用效果(编号为M21-1)、问题反馈(编号为M21-2)、改进意见(编号为M21-3),这些元素的属性都为[O],在业务说明上需要文档服务。6.管理历史:编号为M22。管理历史的子元素有修改人(编号为M22-1)、修改日期(编号为M22-2)、作废日期(编号为M22-3)、作废原因(编号为M22-4)、签入日期(编号为M22-5)、签出日期(编号为M22-6),这些元素的属性都为[O],其中修改人和修改日期适用于所有的业务上。

四、结论

核电站电子文档元数据著录具有可扩展性,可以根据业务需要对元数据集进行扩展。大亚湾核电站电子文档元数据集的建立,描述了核电站运营过程中的各个业务环节活动中电子文件的形成,核电站电子文档管理的元数据是电子文件形成的命脉,在电子文档元数据的基础上,大亚湾核电站建立了文档管理的信息系统、电子文件生成系统、程序数据库,用于捕获、登记、分类、存储和保管、利用、跟踪、处置、传输、归档移交及长期保存等过程中的元数据,确保电子文件的真实性、完整性、有效性的凭证作用,实现对大亚湾电子文档的全过程管理与监控。

猜你喜欢

著录文档信息
著录格式执行GB/T7714-2015《参考文献著录规则》
著录格式执行GB/T7714-2015《参考文献著录规则》
浅谈Matlab与Word文档的应用接口
《航空材料学报》参考文献著录要求
有人一声不吭向你扔了个文档
轻松编辑PDF文档
订阅信息
Word文档 高效分合有高招
展会信息
健康信息