APP下载

话题1:对标准数字化顶层设计的理解与建议

2024-05-11

中国标准化 2024年3期
关键词:顶层机器语义

对标准数字化顶层设计的理解与建议,我主要分 三个层面来说,一是标准数字化顶层设计的理解,二 是标准数字化的需求和存在问题,三是标准数字化的 建议。

第一、标准数字化顶层设计的理解

对 标 准 数 字 化 顶 层 设 计 的 理 解 离 不 开 I S O SMART的定义,ISO SMART(Standards M a c h i n e A p p l i c a b l e , R e a d a b l e a n d Transferable)为机器可应用、可识读、可理解 的标准。第0层是传统纸质标准(PAPER)。第1 层是开放数字格式标准,“提供检索和阅读,比如 PDF格式”。第2层是机器可读文档,即“结构化标 准文档,内容可被软件处理”,这是在“语法”层 面把标准进行拆解,拆成篇、章、节等段落,以及 表格、图片等语法层面的内容碎片,进而存成XML (Extensible Markup Language, 扩展标记语言) 或JSON(JavaScript Object Notation,一种轻量 级的数据交换格式)。目前,标准馆用技术手段把所 有的标准进行了OCR识别,并自动生成机器可读文 档,该项工作在2013年已经全部完成。第3层为机器 可读内容,即“语义增强内容,为一个目的接受多个 标准的内容”,这是在“语义”层面,把标准组织成 知识图谱,也是我们常说的标准剪裁。举个例子,喝 茶至少和三类标准有关,茶叶标准、饮用水标准、杯 子标准,可三类标准剪裁成专门针对喝茶的标准。尽 管其存储形式也是XML或者JSON,但“机器可读 内容”与“机器可读文档”最大区别正是其语义的表 达。产品标准的语义,就是揭示标准化对象及其属性 的关系。这也是标准馆目前在做的工作。我们针对 26,000余项国家、行业、地方标准中的产品标准, 做了标准化对象和指标项的知识组织,形成了87万 余条的指标数据,初步具备了开展机器可读内容层面的标准知识服务能力。第4层为机器可解释内容,即 “具备信息建模能力以表达内容关联要素,具备自学 习的分析验证闭环能力,使得内容可达可推理,形成 不间断的价值流,提供智能问答或预测内容”。这是 在“语用”层面,描述标准文献的智能应用,主要包 括:智能问答,基于标准知识图谱,能够去理解和回 答问题,在一些实践应用场景,也能基于标准化对象 和属性自动生成文档;不间断的价值流,就是展望从 标准研制到应用的全流程,全部是数据形式,机器识 读,没有人的参与,这就是价值流的不间断;具备自 学习的分析验证的闭环能力,使内容可达可推理,即 基于标准构建流程模型,使得内容可以进行推理,形 成作业流程指导或者根因分析等专家系统,这也是我 们目前正在研究的方向。

我认为标准数字化是一个交叉学科,包括图 书馆学指导业务,标准化定义应用场景,计算机突 破技术瓶颈,最终共同实现价值体现。我们需要用 图书馆学、语义网和知识本体的理论去指导这个方 法,用标准化理论与方法的来定义各种场景的应用 需求。作为管理学科,在企业的应用场景中有没有 数字化赋能标准化的需求,这种需求如何去提升, 如何去挖掘?这是标准化学科需要做的事情。计算 机学科做的是突破技术瓶颈,如高效计算、机器学 习和自然语言处理等,机器能解决的只是代替人的 重复性工作,解决的是从1到N的问题。从0到1的 过程,一定是标准化的研究人员去根据需求分析出 来,根据应用场景去设计。最后是价值体现,数字化赋能标准化、提升标准的实施能力,这是我现在认 识的两个价值。我认为标准化本身是一个管理学科, 在政府或企业的应用场景中,标准化还是应充分体现 出管理特性,不管是標准大数据、标准制修订或者标 准编写等软件平台,都是为政府或企业的标准化实施 应用服务的,目标是提升它的数字化实施能力,让标 准能够快速地应用到企业的具体工艺场景中,能够快 速地让政府做出正确的决策。

第二、标准数字化的需求和存在问题

在需求上,标准数字化的信息服务,主要包括情 报服务、检索服务和行业应用。情报服务,主要包括 起草单位大数据分析,提出单位、归口单位、起草人 和国别分析;检索服务,主要包括扩展全文搜索,建 设指标数据库,细化检索体验,也就是要做到查到、 查全、查准、关联;行业应用,包括标准制修订、标 准编写、标准管理、标准查新查重、标准对比等。

信息服务包括传统服务和增值服务。传统的服 务包括文献检索、文献阅览、信息咨询、信息跟踪、 信息培训和信息推送,传统服务尽管需求明确,但是 缺乏服务深化的潜力,而且供给饱和;增值服务主要 包括专题的数据服务、知识服务、情报服务和工具服 务,其主要问题为行业需求不明确,需要技术引领, 产品先行,更多地引导和挖掘。

第三、标准数字化的建议

现阶段国家标准馆的标准数字化主要发展方向, 一是定位需求痛点,用数字化赋能标准化,进而解决 政府和企业的标准化管理需求,需求痛点就是标准化 需要数字化赋能;二是补足短板,我们需要一个面向 各行业的全流程解决方案,我们现有的全流程解决方 案还存在着用户体验以及技术上的难题需要突破,需 要大量的需求磨合和软件迭代升级;三是应用人工智 能技术,包括解放传统工作和助力创新工作;四是延 伸产品线,把标准数字化集成到企业的流程、设计、 制造、管理、运维工具中。

点评:于欣丽

甘克勤介绍了ISO SMART的定义,介绍了标准馆这几年对标准数字化所做工作,以及取得的 成果。标准馆在2013年已经达到了SMART第2层,现在正在做第3层,取得了很好的成效。我们看 到,在顶层设计方面,我国已经有了一个比较清晰的思路和框架,当然还需要不断完善。

猜你喜欢

顶层机器语义
机器狗
机器狗
语言与语义
汽车顶层上的乘客
未来机器城
顶层设计
“上”与“下”语义的不对称性及其认知阐释
加快顶层设计
无敌机器蛛
认知范畴模糊与语义模糊