论标准文献服务工作的内容与流程
2022-12-09康云
康 云
(福建省标准化研究院,福建 福州 350000)
1 标准文献工作的发展
20世纪80年代初,我国的标准文献服务工作就已开展,当时的查询对象有国家标准、专业标准、企业标准,国际上有国际标准、区域性标准化组织标准、各先进工业国家标准和有关专业协会标准,服务的主要内容有:标准查询及委托检索服务、标准查新服务、标准有效性确认服务、标准翻译服务、标准水平评价服务,如图1:
图1 20世纪80年代我国的标准文献服务工作内容
这一阶段标准文献工作的特点是服务内容单一,人工干预多,服务效率低。以检索标准为例:首先,客户要上门查找标准,先填写提交索书单,标准文献前台服务人员根据客户需要的内容,要先检索标准纸质目录,或是从目录卡片查找对应的标准,再转交库房管理员提取标准,并交给客户,客户根据自身需要,要么现场阅读,要么复制拷贝或购买原版标准带回,写成标准化服务流程就是,如图2。
图2 20世纪80年代我国的标准文献服务工作流程
传统标准文献服务虽有较强的权威性,但工作效率低,难有深层次的扩展服务。随着经济活动的频繁,标准文献的不断涌现,标准化服务推进受到了极大的阻碍,标准文献服务方法亟待改进。
20世纪90年代,随着计算机及数据库技术的发展,单机版的标准信息检索系统的出现,标准文献服务流程也随之改变,如上述流程中手工检索标准题录工作、查找标准索取号工作都可以在计算机上完成。这使标准文献服务工作在标准题录检索、抽取标准文本的时间大为缩短,这一阶段的标准化服务流程变为,如图3。
图3 20世纪90年代我国的标准文献服务工作流程
随着人类科技水平的快速发展,各个学科相互交叉、渗透,学科的综合化、整体化越来越强,社会对于标准文献的需求量越来越大的同时,对标准文献服务的要求也在不断提升,用户不再单纯需要现有馆藏的原文传递服务,而是迫切希望标准服务机构更多提供有针对性的、多方面、全方位的、综合化的标准文献深层次的知识服务。
进入2000年,随着计算机数据库技术及互联网技术发展,服务方式也有了进一步的发展:标准文献馆藏电子化、标准文献电子版阅读、标准文本远程打印、标准文献资源整合也成为可能。
在标准文献数据加工方面,将数十万份的标准文本通过标准文献加工系统,扫描转化为电子文档,在电脑中储存起来,实现标准文档的电子化,同时建立标准题录数据库,并将题录数据与全文建立关联索引,实现了标准馆藏电子化。
在同一单位实现整合资源,实现共享,使标准文献馆藏电子化加工、检索系统与标准文本远程发行系统整合,改变了传统的服务模式,用信息化、网络化手段实现标准文献、发行资源的整合,建立统一服务窗口,实现统一窗口、统一服务,进一步提高了单位标准文献的服务质量。
调查显示,城市学生的身高、体重、坐高、胸围、肺活量等指标高于农村学生,与杨旭等[4]的研究结果一致,可能与城市学生的营养状况好于农村学生有关。农村学生的握力、50m跑、立定跳远、耐力跑、肌力、坐位体前屈等指标好于城市学生,与顾昉等[5]的研究结果一致,可能与农村学生除学习之外,还参加一定的体力劳动有关。
在全国同级单位,实现标准资源互补,资源共享,节约开支。例如,某省标准化机构与全国其他省份的标准化机构本着互利合作的原则,签订了资源采购互补协议,特别是国外标准,品种多、价格高,通过采购相关原版标准,在各自需要时,通过全国标准资源大市场,以互补方式,获取标准资源,为国家节约了大量资金,实现了标准资源的共享。
综上所述,随着计算机技术发展及网络化程度的不断提高,标准阅读的便利性,标准服务范围从省内用户内转向全国用户还扩大了服务范围,缩小了时空差距,大幅提高了标准文献的服务工作效率,这一阶段的标准化服务流程变为,如图4。
图4 21世纪初我国的标准文献服务工作流程
2 标准文献工作的现状
进入21世纪10年代,大数据的快速发展对互联网技术而言如虎添翼,它具有数量大、数据类型多、商业价值高、处理速度快的特点。如今,它用于标准文献服务工作方面使其内容拓展为:标准文献检索、标准文献阅览服务、标准信息跟踪服务、标准查新及有效性确认服务、标准数据库加工服务、标准内容指标检索与对比、标准全文检索、标准大数据应用服务。
图5中,标准文献服务内容涵盖了我国标准文献服务工作40年的发展内容,不仅含有传统的“标准查新及标准有效性确认”项目,还包括了近年的大数据在标准化方面的应用,例如大数据分析手段,从时间、地域、起草单位等多维度分析各级标准的起草情况。在传统项目方面,由于检索系统设备的更新,效率大幅提高。在标准深加工方面,随着各种系统的开发和应用,标准内容的深度揭示,给标准文献服务工作带来了极大的发展空间。对应的标准文献服务流程也呈现出多头并举发展的态势,见图6。
图5 21世纪10年代我国的标准文献服务工作内容
图6 21世纪10年代我国标准文献服务工作流程
从流程来看,标准文献服务从传统的针对一对多流程转变为多对多的流程,从解决问题的范围来看,能解决更多问题,从解决问题的时间来看,大幅缩短了服务时间,从解决问题的深度看,服务内容更精准,因此,在标准文献服务方面能更广泛、更深刻、更高效地解决对标准文献的需求问题。
“标准有效性确认服务”:依据各类大型标准信息数据库、标准组织的官方网站和期刊等多种权威信息渠道,对标准的有效性进行确认,查验标准的更新、替代、废止信息,并出具权威的确认报告,为企业用户认证、质量评定及标准应用提供技术保障。现有的技术手段,可以自动跟踪各种标准组织官方网站、各种期刊网站的最新标准信息,并在数据库中自动标记更新情况,确保了正确开展标准有效性服务。
“标准文献阅读系统”:可以输入关键词或主题词进行检索,系统在相关的题录中查找相关题录,通过人机互动选择相关题录并引导系统指向相关文本进行阅读。
“标准全文检索系统”:在进行检索前需要对标准进行全文加工,全文加工是对图像进行一系列的处理,最终得到图像上的文字信息,并产生多种形式的文字类型的电子文档。全文加工除了要进行拆分图像、图像处理之外,还要对图像进行版面分析、OCR识别、校对、导出等工序的处理。
版面分析对图像按照其内容的形式进行区域划分,并标记出每一个区域分别是横排文本、竖排文本、图片还是表格,以及每一个文字和表格区域的语言类型等。这部分内容一般由软件自动处理,如果有分析失败的情况,则需要有人工进行调整。
在版面分析的结果之上,由TH-OCR文字识别核心进行自动地识别处理。这一步骤不需要人工干预,完全由计算机程序完成。
校对工序通过提供强大便捷的软件校对技术手段,可以过滤处大部分的识别错误,最后通过人工把关,可以大大提高工作效率。
导出工序可以将识别结果导出为各种形式的文档,例如纯文本的TXT文件、RTF文件、可检索的双层PDF文件等。
在进行全文加工后,对于需要检索特定标准中的特定信息,通过“标准全文检索系统”,可以很方便地实现迅速找到在特定标准中的任意字符,并查看任意字符的上下文关系,快速定位到查找目标。
“标准数据加工系统”:针对标准全文的加工按照加工的精细程度可分为:题录加工、图像加工、全文加工和结构化全文加工。这三种加工方式,每一种加工都比前一种更进一步,但得到的数据也更丰富,在此基础上可以提供的服务也更丰富多样。所谓结构化加工就是按照一定的规则,将标准的内容进行结构化的描述。例如将其中的前言、范围、引用文件、图片、表格、公式等内容以不同的标记标注出来。“结构化全文加工”需要进行结构化全文标注的处理。所谓结构化全文标注是指对标准全文中的不同部分,采用相应的标记进行标识,最终得到一个包含了标注信息的结构化全文文件。这一工序也可以由计算机自动完成,加工人员需要检查自动处理的正确性,并进行手工修正。“结构化加工”的目标是:一是实现数据库共享,通过结构化全文的建设,对国家标准、行业标准进行结构化处理,加工成果可用于在标准信息服务平台进行数据共享。二是数据存储结构设计的合理性:使用关系型模式保存,针对题录数据的特点,设计合理的存储模式,必须要符合关系型数据库的一系列设计规范。全文的存储模式在设计时既要考虑合理性又要考虑其实用性。三是实现对标准全文进行结构化检索。例如,可以在标准前言中检索起草单位,这样就可以很方便地了解特定单位到底参加了哪些标准的制定,是主导制定还是参与制定;也可以在标准范围中进行检索,例如,可以输入“冷链物流”,那么所有在范围中有涉及“冷链物流”的标准都会快速显示出来。
“标准内容指标检索与对比”:通过大数据系统,对特定领域或产品,涉及的国内外标准关键指标进行深层揭示、技术指标提取和对比分析,以信息化作为支撑,对比产品所执行的标准与国标、国外标准的技术指标差异。例如,针对基础标准化研究领域的产品与环境的人性化设计与测评服务(包括产品与环境的人性化设计、用户体验测评、人体工程学设计与测评、人类工效学设计与测评)、中国人体特性数据服务(包括样本年龄、采样地域分布、人体尺寸、力量、关节活动范围、视觉、听觉、触觉、认知以及热感知特性等中国人群的工效学特性数据)、公共信息导向系统规划设计服务、图形符号数据查询服务(包括收集和整理了国内外各类图形符号相关标准,可以对标准图形符号进行查询、浏览和下载)、标准术语查询服务(标准术语的中文词、外文词、定义、符号、出处、相关术语、所在标准信息)等,这些应用标准深层次的标准文献服务随着大数据的出现应运而生,不断推动着标准文献服务工作向更深层次发展。