APP下载

GB/T 42147—2022《政府网站网页电子文件元数据》标准解读

2023-02-02朱彬章建方陈其胜

中国标准化 2023年17期
关键词:政府网站元数据解读

朱彬 章建方 陈其胜

摘 要:随着计算机技术和网络技术的高速发展,各级政府的网站信息化程度日益提高,网站网页规范化管理的重要性日渐突出。GB/T 42147—2022《政府网站网页电子文件元数据》的发布与实施,为政府网站网页提供了元数据有关技术要求。本文对标准中的网页电子文件实体及其结构等核心内容进行了解读,帮助读者更好地了解标准内容,更好地推动标准贯彻实施。

关键词:国家标准,政府网站,网页电子文件,元数据,解读

DOI编码:10.3969/j.issn.1002-5944.2023.17.024

Interpretation for GB/T 42147-2022, Metadata for webpage electronic document of government website

ZHU Bin1 ZHANG Jian-fang2 CHEN Qi-sheng1

(1. Guangdong Huizhou Quality and Technology Supervision Standard and Coding Institute; 2. China National Institute of Standardization)

Abstract: With the rapid development of computer and network technology, the informatization level of websites of government at all levels is increasing, and the importance of standardized management of websites and webpages is becoming increasingly prominent. The release and implementation of GB/T 42147-2022, Metadata for webpage electronic document of government website, provides technical requirements for metadata related to government websites and webpages. This paper provides an interpretation of the core content of the standard, such as the entity and structure of web electronic fi les, to help readers better understand the content of the standard and promote its implementation.

Keywords: national standard, government website, web electronic document, metadata, interpretation

0 引 言

近年來,随着政府机关“互联网+政务服务”能力的不断提升,许多政府网站具备信息发布类页面、解读回应类页面、办事服务类页面、互动交流类页面以及其他具有保存价值的页面,记录了政府与公众通过网站交流活动的相关信息,具有重要的凭证和归档保存价值。但随着网站更新、迁移、整合等变化,部分政府网站的网页资源管理不善,没有得到有效的保存,就失去了重要的凭证价值。国务院办公厅印发的《政府网站发展指引》[1](国发办〔2017〕47号)提出:“政府网站遇整合迁移、改版等情况,要对有价值的原网页进行归档处理。归档后的页面要能正常访问,并在显著位置清晰注明‘已归档和归档时间。”

面对政府网站网页电子文件的大量产生和归档要求,元数据则成为电子文件管理不可或缺的重要工具。元数据是用来描述网页内容、结构、背景、管理过程的数据,能够完整描述网页信息内容,可以记录电子文件在设计、形成、传递、维护等运转流程中的全部情况,是网页电子文件管理活动中极其重要的一部分。只有在元数据的基础上,才能对政府网站网页电子文件进行有效而安全的管理,同时元数据也是电子文件信息组织、维护和检索的重要依据。因此,制定并推广应用政府网站网页电子文件元数据标准具有非常重要的意义。

1 标准概述

《政府网站网页电子文件元数据规范》国家标准于2019年下达编制计划(计划号20194237-T-469)。标准起草组经过多次调研、专家咨询、内部研讨等环节,按照《国家标准管理办法》规定的流程和要求,基于“适用性原则”“规范性原则”“兼容性原则”开展编制工作,于2021年12月14日顺利通过全国电子业务标准化技术委员会(SAC/TC 83)的标准审查并报批。国家标准化管理委员会于2022年12月30日以“2022年第21号”公告正式发布,并于2023年7月1日起实施,标准编号为GB/T 42147—2022。

GB/T 42147—2022规定了政府网站网页电子文件的元数据集,以及网页电子文件元数据的扩展原则和方法。根据网页电子文件管理过程的要素,本标准采用了多实体的实施方式,明确了六类业务实体或数字对象,用以描述网页电子文件内容信息、机构人员、业务、管理过程、操作权限及其之间相互关系的数据,并记录网页电子文件在设计、形成、传递、维护等运转流程中的全部情况,以及网页电子文件的采集、转化、归档、封装、存储备份、处置等全生命周期的管理,以确保网页电子文件的证据特性,为网页电子文件管理系统的设计和实施提供依据。标准共分八章,篇章结构构成情况见图1。

2 标准核心内容解读

2.1 网页电子文件实体及其结构

结合目前我国政府网站网页电子文件管理和电子档案管理实际,GB/T 42147—2022明确了网页电子文件实体、网页电子文件管理机构人员实体、网页电子文件记录的业务实体、网页电子文件管理过程、网页电子文件操作权限实体、实体相互关系等六大类数据实体,构建了政府网站网页电子文件元数据实体及其相互关系。各实体或数字对象是基于管理业务活动的需求制定的,在采集、转化、归档、封装、存储与备份、处置的全过程中对网頁电子文件加以管理和利用,并以实体相互关系为纽带,将各个实体联系起来,实现整个管理业务活动的互联,见图2。

标准还明确了涉及的元数据种类。通过表格形式列出了六大实体内部根据各类实体的属性与内容确定的元数据元素。标准中共有83项元数据元素,并对每个元数据元素设定了10项描述内容,包含编号、中文名称、英文名称、定义、约束性、出现次数、数据类型、数据格式、值域和缺省值。在83个元数据元素中,核心元数据元素是必选项共44项,可选项是39项,见图3。

2.2 文件实体元数据的描述

文件实体元数据实体主要是描述网页电子文件自身信息内容的数据,可以是单个网页电子文件,也可以是多个网页电子文件的集合,该实体包含20个元数据元素。

2.2.1 分类

分类方式主要根据国家档案管理有关规定(如依据《中国档案分类法》及其使用指南)并结合网站实际情况制定网页电子档案分类方案,并按照“宗、类、卷、件”方式进行创建,也可按照网站栏目结构进行创建。

2.2.2 标识

标识名称常用的有网址、电子文件编号、档案编号、数字对象标识符、全局唯一标识符等。标识符是以字符形式赋予网页电子文件的唯一标识。

2.2.3 内容描述

主题词是反映网页电子文件信息内容特点的词语,按照《中国档案主题词表》及各行业相关规范化的词表进行标引。来源、作者、部门名称和时间提供了网页电子文件的出处和背景信息,利于理解、溯源和利用,记录网页电子文件的责任主体。

2.2.4 形式特征

文种使用汉字简化字、汉字繁体字、英文等文种来显示网页电子文件信息,应避免在应用中网页电子文件管理系统使用不同文种导致显示乱码。

2.2.5 电子属性

格式信息记录网页电子文件创建时的文件环境,明确了网页电子文件采用的格式,在应用中利于分类管理、格式转换、保存和利用。

2.3 管理机构人员实体元数据的描述

网页电子文件的管理和利用应该授权管理责任者按照操作权限进行管理,确保只有授权人员才能利用文件。该实体包含2个层次7个元数据元素。

2.3.1 人员描述

人员名称和人员代码是对网页电子文件进行相关操作的人员的称谓和唯一编号,一般使用身份证的真实姓名和个人的证件号码。

2.3.2 机构描述

机构类型是对网页电子文件进行相关操作的机构的类型,可以是单位或其内设机构。机构名称是对网页电子文件进行相关操作的具体机构的称谓,应使用登记机关或批准机关核准注册或登记的名称,一般使用全称或不易发生误解的通用简称。

2.4 业务实体元数据的描述

业务实体元数据主要是关于描述网页电子文件管理业务过程中的业务行为信息的元数据,记录业务流程中对网页电子文件的处置活动,提供网页电子文件业务活动的真实性证明,维护电子文件的证据特征,便于网页电子文件的控制、管理和利用。

业务名称是网页电子文件管理业务行为的名称,用于记录业务活动的具体行为,主要包括采集、封装、归档、处置等,不同的业务活动可以在业务名称中进行区分。业务时间是记录发生网页电子文件活动业务的具体时间。业务描述是对网页电子文件业务活动相关信息的描述。业务执行人是对实施网页电子文件具体业务活动的人员名称。

2.5 管理过程实体元数据的描述

该实体元数据是本标准中包含元素数量最多的一个部分,体现了对网页电子文件管理过程的充分关注,也强调了管理过程元数据对于网页电子文件管理业务的重要意义,该实体包含6个层次45个元数据元素,其中24个核心元数据元素。

2.5.1 采集

采集时间根据网页电子文件管理系统的开发设计,采集时间可以设置自动采集或手动采集。网站名称应使用规范的名称,政府门户网站和部门网站一般以本地区、本部门机构名称命名,一般在政府网站头部标识区域显著展示网站全称。链接地址应符合域名规范的要求。采集格式名称和采集格式版本是该网页在网站上所采用的格式名称和格式版本,用于记录生成的网页电子文件读取、格式转换、存储与交换的实现方式。

2.5.2 版式文件转化

为确保网页电子文件内容的完整性和可用性,网页电子文件归档时需将不符合要求的文件格式转换为符合要求的文件格式,利于网页电子文件的显示阅读、交换和利用,保障网页电子文件内容信息的完整性。

目标格式名称是网页被相关软件或模块进行化形成网页版式电子文件的格式名称,建议采用GB/T 33190规定的格式或数据结构。目标格式版本是网页被相关软件或模块进行化形成网页版式电子文件的格式版本,通常使用网页版式。转换软件名称是网页电子文件进行相关转换的软件或模块的名称。格式转换时间是网页电子文件信息被相关软件或模块转换成另一种格式时的时间。版式文件大小是网页电子文件信息被转换成版式电子文件后的文件大小。

2.5.3 归档

对政府网站网页进行归档保存,利于实现网页电子文件的安全存储和利用。归档范围可根据业务需求以及档案相关标准来确定,可参照DA/T 80—2019《政府网站网页归档指南》的规定,也可参照《机关文件材料归档范围和文书档案保管期限规定》的规定[2]。

归档时间可以参照《电子文件管理暂行办法》规定。归档提交人和归档接收人是对网页电子文件进行归档提交和接收的人员名称,按具体提交和接收人实名设定。归档格式可以是PDF、OFD、WARC等格式,不同的归档格式可以满足不同的存储需求。经过格式转换的归档文件,需要确认是否发生版式内容变化,是否影响电子文件内容的真实性。

宗名利于区分网页电子文件来源,一般由接收或保管网页电子文件的机构设定。在网页电子文件管理中,某个政府网站的所有网页归为一个宗。类名可以按照专题或主题对网页电子文件分类、按照时间周期对网页电子文件分类。

2.5.4 封装

封装方式可选择本标准规定的四种方式:按时间周期封装、按专题内容封装、按网页栏目结构封装、按组合封装。封装包格式一般采用公开标准的规范化格式,可以是数据压缩文件、光盘映像文件、开放式版式文档、互联网存档等多种格式。

2.5.5 存储与备份

存储位置是描述网页电子文件在物理层面存储位置的相关信息,以免被篡改、丟失或损坏。保管期限不能少于网页电子文件的生命周期,可参照《机关文件材料归档范围和文书档案保管期限规定》[3]提出的“机关文书档案的保管期限定为永久、定期两种。定期一般分为30年、10年”规定,结合实际自定义。

2.5.6 处置

在网页电子文件管理和操作过程中,描述和记录对网页电子文件续存、迁移或销毁等处置行为。修改日期记录了处置网页电子文件续存、迁移或销毁时间具体时间。

2.6 操作权限实体元数据的描述

该实体是关于描述网页电子文件管理中所涉及的操作权限信息的元数据,描述业务活动的管理依据,记录网页电子文件利用的详细信息。

权限名称是在对网页电子文件进行管理和操作中,所需的某种权限的名称,是描述允许某种具体操作权限的名称,可以为政策、法规、标准、制度、需求等名称,用于记录网页电子文件业务活动的权限管理。

2.7 实体相互关系元数据的描述

该实体是描述实体和实体之间的相互关系。关系标识符是标识电子文件不同实体之间关系,确保实体之间建立关系,彼此对应,利于网页电子文件的管理和利用。关系标识符应是唯一的,文件管理系统应设置统一的规则编制关系标识符,避免发生冲突。

2.8 元数据扩展原则和方法

随着数字化、智慧化互联网时代的到来,网页电子文件的管理必然趋向于数据化、智慧化的进程发展,对元数据的结构和信息会有更高的要求,在给出的元数据元素无法完全适用于网页电子文件管理时,标准给出了扩展原则和扩展方法进行元数据扩展。如果需要扩展某个实体的元数据,对这个实体增加元数据,而其他的实体元数据不会受到影响。

3 标准实施建议

GB/T 42147—2022《政府网站网页电子文件元数据》的编制与发布实施,为实现“对有价值的原网页进行归档处理”提供了一个必不可少的依据和指导,从而保证政府网站网页电子文件的真实性、完整性、安全性和有效性,同时也为第三方系统软件开发商据此扩展其他网站建设制定网页电子文件元数据方案提供依据。

3.1 加大标准的宣传宣贯

建议标准编制单位、标准技术归口单位等独立或联系开展标准的宣贯活动,特别是加强政府信息化部门的宣贯力度,让他们知晓标准的相关内容。宣贯形式可以多种多样,召开标准宣贯会、制作相关的宣传图册等,都可以起到一定的宣贯效果。

3.2 加强标准的实施监督

标准的效果重在实施。只有很好的实施了标准,才能使标准发挥其效果,起到应有的作用。各政府部门的网站管理人员应在全面知悉标准内容的基础上,按照标准要求对网页电子文件的内容进行管理,从而实现政府网站网页电子文件的规范化管理。

参考文献

[1]国务院办公厅.关于印发政府网站发展指引的通知[EB/OL].(2017-06-08)[2023-10-11].https://www.gov.cn/ zhengce/content/2017-06/08/content_5200760.htm7.

[2]王大众.《政府网站网页归档指南》解读[J].中国档案,2020(6):34-35.

[3]国家档案局. 机关文件材料归档范围和文书档案保管期限规定[EB/OL].(2006-12-18)[2023-07-27].https://www. saac.gov.cn/daj/xzfgk/202112/206a56e657fb4758b837b24 4cb1f6672.shtml.

作者简介

朱彬,本科,高级工程师,研究方向为服务业标准化。

章建方,硕士,副研究员,研究方向为电子政务(电子文件管理)、电子商务等领域标准化。

陈其胜,本科,工程师,研究方向为服务业标准化。

(责任编辑:张瑞洋)

猜你喜欢

政府网站元数据解读
基于来源的组织机构元数据构建研究
元数据与社会化标签在微视频搜索中的应用
高等院校智慧校园建设规划与实现
保定市政府机构网站外宣翻译对策研究
保定市政府机构网站外宣翻译对策研究
政府网站建设及在提升治理能力中的作用分析
解读日本摄影家植田正治的摆拍写实现象
关于对电子政务发展中政府门户网站建设的思考
黑龙江省方正县政府门户网站建设研究
关注生成,激活学生认知