APP下载

“中华老字号”本体档案资源库的构建研究

2016-07-28鲁晓明张澍雅

创新科技 2016年5期
关键词:本体档案

鲁晓明 张澍雅

(郑州大学信息管理学院,河南 郑州 450001)

“中华老字号”本体档案资源库的构建研究

鲁晓明张澍雅

(郑州大学信息管理学院,河南郑州450001)

[摘要]为了更好发挥老字号档案的价值,本文分析了当前“中华老字号”数字化档案展览现状,提出创建老字号本体资源库,构建老字号档案间的语义互联关系。通过对老字号档案数字化展品的语义组织,深入挖掘潜在信息资源,为用户提供智能化、个性化、便捷化的用户体验。

[关键词]档案;“中华老字号”;语义组织;本体

1 引言

中华老字号是指具有长远发展历史、拥有世代相传的技艺、服务或产品,它拥有鲜明的中华民族传统文化背景、深厚的文化底蕴,并在此基础上取得了社会的广泛认同,形成良好信誉的品牌[1]。无论是在过去还是现在,中华老字号对中华文化都起着深远影响。档案记录着社会历史发展的重要信息,能完整、准确的展现历史发展面貌,具有重要的凭证和参考价值。档案通过对中华老字号从创建到发展过程中形成的各种信息的记载,充分展现了老字号的传统特色和悠久的历史文化价值,这对老字号的进一步继承、创新、发展具有重要现实意义。

新中国成立前创建的老字号企业随着时代背景的变迁一路发展到如今的互联网、大数据、云计算时代,顺应历史的脚步,将老字号企业档案数字化、网络化、语义化不但是记录的需要,也是深度开发利用这些珍贵档案的需要,更是老字号借助先进信息技术发展推广企业文化、创新经营模式的需要。

目前,已有部分档案馆网站设置老字号档案展览版块,如上海档案信息网、青岛档案信息网、北京市档案信息网等,展出了部分中华老字号发展历程中的珍贵图片,但截至目前,档案馆对老字号档案的数字化只是简单地把实体档案进行扫描、拍照,并将图片通过静态网页孤立的展示出来,加之简单的文字描述,并没有提供和图片相关的实体检索链接,这表明老字号档案资源领域缺乏有效的语义组织,和图片相关的各种实体对象之间的联系尚未建立起来,因此无法为用户提供多角度、多入口的检索途径。而对于当前成熟的网络用户而言,基于资源语义组织的检索是一个资源服务单位必备的基本服务项目之一,因此创建中华老字号本体档案资源库尤为重要。通过建立老字号数字档案之间的语义互联关系,形成老字号本体资源库,从而在老字号档案资源生态系统的基础上创新服务模式。

2“中华老字号”数字化档案特征分析

2.1以数字化形式展现

数字化档案是指将纸质档案、照片、胶片等传统档案利用数据库技术、数据压缩技术、高速扫描技术等技术手段转化为数字化的信息[2]。通过查找老字号数字化档案相关信息,了解档案馆网站老字号板块发展现状,发现上海档案信息网、北京档案信息网、青岛档案信息网是目前老字号档案信息较丰富的网站。上海档案信息网将老字号进行分类,划分为商业街区、四大百货公司、餐饮医药、服装、银楼、杂货、老字号新貌七个类别,每个类别附上若干张照片,并对照片进行一句话说明;北京档案信息网老字号信息则分布分散,只对部分老字号信息进行简单的语言描述;青岛档案信息网老字号信息则以散文的形式对老字号进行描写说明,多以第三人称角度。在众多老字号企业网站上,只有全聚德设置了网上展览模块,它分为五个板块,分别为序厅、第一展厅、第二展厅、第三展厅、展馆巡礼,通过图文并茂的形式来展现企业文化和企业发展过程。目前,档案数字化形式一般包括口头档案的数字音频,经过扫描、拍照后的照片档案,但通过调查相关网站的老字号板块,发现当前老字号档案数字化展览并不充分,只是孤立、零散的将照片展现出来,需进一步加强老字号档案展览的开发。

2.2数字化档案的分类

根据老字号数字化档案对象的不同,可将数字化档案分为增量数字化档案信息和存量数字化档案信息两种[3]。在档案馆接收信息的过程中,自身以数字信息方式存储的数据,如光盘、磁盘、硬盘等,且在归档时主要通过网络、数据转移、数据转换、系统等方式进行归档的电子档案,这种档案信息称为增量数字化档案信息。如老字号在形成过程中,直接形成的存储在硬盘上的信息内容。而存量数字化档案信息则将档案馆馆藏的纸质、录像带、缩微胶片等载体存储的档案,进行数字化扫描、转化等加工处理,形成数字化形式的声音、图像、多媒体信息等。这种类型的档案信息主要通过对现有馆藏进行数字化加工、处理得到。如上海档案信息网上的图片展览,通过将照片扫描,以数字化的形式存储在计算机上。通过组织增量数字化档案信息和存量数字化档案信息,以充分挖掘老字号信息资源。

根据老字号企业经营范围不同,还可以将老字号档案相应地分为以下几类:餐饮业、工艺业、零售业、日化业、食品业、烟酒业、医药业七类。其中餐饮业包括当地特色小吃、饭庄;工艺业包括饰品、古玩、文房工具、玉器、剪刀;零售业包括食品、服装百货;日化业主要包括金属类、冶炼类、化学类、纺织类;食品业主要包括粮油加工、烟酒糖茶、干果、糕点;医药业包括西药店、中药店、制药厂、中药厂。

2.3档案内容的相关性

任何档案都不可能孤立存在,总有与其内容相关的档案,因此同一企业的老字号档案在内容上必然存在纵向联系、横向联系和相关联系。在传统档案管理过程中,纸质档案的内容仅仅单纯的记录在纸张上,虽然它与相关档案在一定程度上存在联系,但它们之间的联系很难创建,没有形成系统的体系。而数字化档案展览,则对档案信息资源进行再组织、再加工,建立它们横向、纵向或相关联系,为用户提供智能化的档案新服务。例如,老凤祥企业1848年在上海创建第一座银楼,到如今店铺已遍及全国各地,这一过程正是老凤祥企业不断发展的历程。建立老凤祥企业纵向联系,不仅能让用户从数字化档案展览中感受到企业的发展动态,更有利于企业宣传自身文化价值,实现更大的经济效益。

3“中华老字号”数字化档案的语义组织

3.1语义组织过程

本体是共享概念模型的明确的形式化规范说明[4]。它包括四个层次的内容:概念模型、形式化、共享、明确,本体是通过抽象出客观世界中某些现象的相关概念而得到的模型,它能够通过计算机进行处理,并且所体现的内容是相关领域共同认可的知识。本体能够为概念建立名称、属性和联系,它通过捕获相关领域的知识,包括该领域内共同认可的词汇,来保证对知识理解运用的一致性、正确性、可重用性和共享性,同时提供语义推理算法已经成为主流建模方法。因此,“中华老字号”数字化档案资源的语义组织模型的构建应遵循可重用性和互操作性的原则。

“中华老字号”数字化档案语义组织的通用模型表示为:THBO={C,P,Rc,Rp,E},其中C表示概念集,包含人物、事件、地点、口头档案,图片档案,对应平台所涉及的实体集合;P表示属性,包含C中所有概念的各种属性;Rc代表概念之间的联系,例如口头档案所反映的事件、档案中所包含的人物,档案事件所发生的地点;Rp表示属性之间的联系;E表示概念集C中每个概念所对应的实例集合。以下对THBO模型展开具体介绍。

①概念集C

“中华老字号”数字化档案展览平台可形式化为:C= {person,event,place,oralArchive,imageArchive}

表1 人物基本信息

②属性集P

由于每个概念所对应的实体具有不同的属性,以下分别讨论。

表2 事件基本信息

表3 地点基本信息

表4 口头档案基本信息

表5 图片档案基本信息

“中华老字号”数字化档案语义组织的通用模型如图1。

图1“中华老字号”数字化档案语义组织的通用模型

其中,在事件event中,包含beforeEvent,afterEvent和relativeEvent三个属性。beforeEvent和afterEvent存在时间上的先后关系,例如将老凤祥银楼建立初期和改革开放后的发展状况联系起来,让用户系统的了解到老凤祥银楼的发展历程。relativeEvent表示相关事件的联系,如老凤祥和老庙均为银楼,他们在发展过程中并不存在交叉关系或时间关系,但他们销售对象均为珠宝,如果创建老凤祥和老庙两者的联系,用户在查找老凤祥银楼的信息时,能通过创建的相关关系获得老庙的信息,将为用户带来极大的便捷。

3.2数字化档案个体描述

个体描述即在类中添加实例,就是将以上语义组织过程想象成某一具体老字号品牌数字化展览建模过程,即把老字号档案中的“人物”“采集者”“地点”“时间”等属性值填入到对应地方。例如,图2老凤祥银楼图片档案由创建于1848年的老凤祥银楼、创建于1911年的新老凤祥银楼、当代老凤祥银楼三幅图组成。根据以上建立好的模型进行填充,得到图3上海老凤祥的建模过程。特别是通过建立event属性,将老凤祥银楼创模。

4 语义化的老字号数字档案开发与应用

图2 老凤祥银楼图片档案

老字号作为重要的历史文化资源,受众十分广泛,包括社会全体成员,同时老字号作为企业的重要资源,也必须满足企业的现实要求,增加企业的经济效益。这要求老字号信息资源的获取更加便捷,面对海量的信息资源,用户能方便、快捷的获取到自己想要的信息资源。由于信息技术的进步,信息量的迅速激增,大数据、云计算、“互联网+”已成为不可逆转的发展潮流,人们对信息的需求越来越迫切,呈现出多样化、多层次的特点。传统的老字号网上展览只是将相关图片发布在网上,或是对老字号企业进行简单介绍,信息分布尤为分散,不能系统的进行查找和利用,这种方式已不能很好地满足用户需求,用户更希望从庞大的信息资源中准确快速地查找到想要的信息,从现有展品展示的信息中获取到更多展品背后的信息,从被动的满足用户需要转变为能为用户主动推测信息。

图3 上海老凤祥建模过程

通过建立“中华老字号”数字化档案展览语义组织,将老字号信息资源组成新的体系,挖掘不同内容的档案信息,实现在网络环境中进行整合和管理,更好地满足用户需求。信息服务的发展必须要满足用户需求,档案作为信息服务的组成部分,其发展也应适应用户需求,即用户需求是信息服务的起点,用户需求的满足是信息服务的终点[5]。

用户需求往往伴随着一定的用户行为,让用户获取有效信息的行为更加便捷,则将促进用户需求。网上展览作为老字号数字化档案开发应用的一种方式,通过分析用户需求,了解用户真正需要什么,以便更好地服务用户。其中老字号网上展览需求主要包括信息的利用对象是谁,用户利用的内容和方式是什么,其中包括潜在需求和现实需求,用户希望通过哪些方式来获取档案信息等。

构建语义组织的最终目的是为了实现更加智能化的应用服务。目前我国老字号档案信息资源分布较分散,多以纸质形式散存于各类档案馆、图书馆、博物馆和企业中,老字号档案信息呈现“碎片化”的现象,集中管理的传统方法很难适应老字号档案信息资源的整合和管理,这与用户对老字号数字档案信息资源的需求相矛盾。由于老字号档案管理不到位,缺乏深度开发,档案价值还待挖掘。因此,充分发挥老字号档案信息资源的历史和现实价值,就必须充分利用网络信息技术,通过在线接收虚拟老字号信息资源,实现虚拟信息的整合,同时创建老字号数字档案的语义互联关系,将能实现更加智能的信息检索。

开发档案信息资源是为了利用档案信息资源,建立老字号数字档案的语义互联关系以实现以下目的。一是独具特色、历史悠久的老字号企业无论是在经济层面还是历史文化层面上都具有重要地位。充分挖掘老字号档案的文化内涵,创新企业管理新方式,将使老字号企业更有活力,形成独特的经营特色,增强企业竞争力,同时提升企业文化内涵。二是将老字号档案进行语义整合,创建老字号开发平台。由于老字号档案存在“碎片化”的现象,整合档案资源,将其汇集在一起,打破档案资源分布的时间和空间界限,更好的服务于大众。

5 结语

传统的档案管理方式已不能较好的适应当今时代的发展,随着数字化时代的到来,对老字号档案的管理不仅局限于传统档案管理的方式,更重要的是将分散的老字号资源进行分类、整理、语义分析,对老字号档案照片及其相关资源进行整合组织,构建老字号档案本体资源库,同时借助数字化的工具和设备,提供老字号的数字化档案展览。之前对老字号档案的管理较为松散,意识不足,没有充分发挥档案的历史和现实价值。通过建立老字号档案间的语义互联关系,将过去和现在的信息系统联系起来,为用户提供个性化的档案检索服务,以适应时代发展的需求,让老字号档案重新展现出新的生机和活力,为老字号企业的建设和发展,老字号文化的继承和弘扬提供不竭的力量之源。

参考文献:

[1]谢兰玉.“老字号”档案资源的开发与利用——以上海市静安区档案局(馆)的做法为例[J].中国档案,2014(2):52-53.

[2]李殿环.基于.NET的数字化档案馆研究和开发[D].西安:西安建筑科技大学,2009.

[3]薛四新,陈永生.数字化档案新信息的真实性保障[J].档案与建设,2005(6):6-8.

[4]曹树金,马丽霞.论本体与本体语言及在其信息检索领域的应用[J].情报理论与实践,2004(6):632-637.

[5]连志英.基于用户需求的个性化数字档案信息服务模式构建[J].档案学通讯,2013(5):49-53.

[中图分类号]G250.74

[文献标识码]A

文章编号:1671-0037(2016)05-78-4

收稿日期:2016-4-25

作者简介:鲁晓明(1976-),女,硕士,讲师,研究方向:信息服务、信息组织;张澍雅(1994-),女,在读本科,研究方向:档案服务、档案管理。

Research on the Construction of“China Time-Honored Brand”Ontology Archival Repository

Lu Xiaoming Zhang Shuya
(School of Information Management,Zhengzhou University,Zhengzhou Henan 450001)

Abstract:In order to make better use of time-honored archives value,this paper analyzes the current situa⁃tion of digital archives exhibition of“China Time-Honored Brand”,proposed to create the time-honored ontolo⁃gy repository,construct the semantic interconnection relationship between the time-honored archives.Through the semantic organization of time-brand digital archives exhibition,we dig the potential information resources,to provide intelligent,personalized and convenient user experience for users.

Key word:Archival;“China Time-Honored Brand”;Semantic organization;Ontology

猜你喜欢

本体档案
继齐韵往昔,以今声开来——思考自五音戏主奏乐器的演变、本体及延伸
眼睛是“本体”
一种新型水平移动式折叠手术床
拓展节能档案数字化利用的探索
刍议供电单位档案管理
档案的开发利用在供电公司全面管理中的作用
浅谈北京卫视《档案》的叙述方式
新常态下高校档案工作发展研究
专题
基于NeOn Toolkit的本体重用方法实例研究*