APP下载

我国数字档案馆研究热点与前沿知识图谱分析

2014-06-10

档案与建设 2014年6期
关键词:本体档案馆数字

赵 跃

(武汉大学信息管理学院,湖北武汉,430072)

1996年,戴维·比尔曼将“虚拟档案”的概念引入中国,开启我国数字档案馆研究的大门。2000年,深圳率先开始了数字档案馆建设的探索。2010年,国家档案局发布了《数字档案馆建设指南》,为我国数字档案馆的建设指明了方向。2014年2月,国家档案局成立了“数字档案馆(室)建设领导小组”[1],开始统一领导全国数字档案馆的建设工作。经过十多年的发展,我国数字档案馆研究成果颇丰,实践探索也进入“深水区”,在此关键点,总结当前研究的成果,把握研究的方向,对我国数字档案馆的深入探索意义重大。本文运用知识图谱方法,全面分析了国内数字档案馆研究的热点与前沿问题,以期为新时期数字档案馆的研究提供启示。

1 数据来源与研究方法

在CNKI 的CAJD、CMFD、CDFD 数据库中,使用“篇名=数字档案馆OR 虚拟档案馆OR 电子档案馆”为检索式进行检索(检索日期为2014年2月7日),共检索到1026篇文献,其中核心期刊有553篇,占53.9%,硕士学位论文36 篇,占3.5%,无博士学位论文。本文以核心期刊刊载的553篇文献以及36篇硕士学位论文为研究的数据源,去除重复无效的部分,最终确定548条来源文献数据,每条数据包括作者、标题、出版物、参考文献等字段。本文选择CiteSpace 软件进行可视化的知识图谱分析。通过该方法能够显示一个知识域在一定时期发展的趋势与动向,形成若干研究热点与前沿领域的演进历程。

2 数字档案馆研究研究概况

数字档案馆研究的首篇文献出现于1999年。从2001年开始,文献量开始激增,2005年和2008年分别出现两个研究的顶峰,2008年之后,仍保持在每年87篇以上的较大的发文量,2013年更是再一次达到128 篇文献的最高峰。2008年之后,核心期刊发文量增长的趋势逐渐平缓,但发文量仍保持较高水平。硕士论文在2007年最多,有7篇,此后每年都有2篇以上文献,但数量不多,详见图1。通过对被引频次较高的文献的考察,结合图1,可将我国数字档案馆研究分为三个时期:

图1 国内数字档案馆研究文献的时间分布

(1)萌芽期(1998-2002),该时期的研究成果集中在数字档案馆的定义、特征等基本问题的初探,以及数字档案馆与虚拟档案馆、电子档案馆等概念的辨析方面,为后期研究奠定了基础,是我国数字档案馆研究的重要参考文献。如冯惠玲的《无纸收藏〈拥有新记忆——电子文件管理研究〉摘要之二》;傅荣校的《关于数字档案馆的思考》《认识数字档案馆——兼论数字档案馆与虚拟档案馆的区别》以及谭琤培的《数字档案馆论纲》等。

(2)过渡期(2003-2006),该时期的研究在总结前期成果的基础上,开始将实践探索与理论研究相结合,注重我国数字档案馆建设的模式、技术、问题与对策的研究。如于丽娟的《国外数字档案馆建设概况》;刘东斌的《数字档案馆建设面临的难题》;李国庆主编的《数字档案馆概论》;潘连根的《数字档案馆与相关概念的关系——数字档案馆研究之一》;傅荣校的《数字档案馆模式研究(一)——现阶段不可能有统一模式》;谢海洋的《数字档案馆网络安全技术初探》等。

(3)拓展期(2007-),该时期我国数字档案馆的实践研究与理论研究联系的更加紧密,视阈也更加开阔,档案界对数字档案馆资源建设与服务的相关问题进行了拓展性探索。如袁红军的《数字档案馆服务模式研究》;刘明的《数字档案馆信息服务模式研究》等。

3 数字档案馆研究热点与前沿分析

3.1 数字档案馆研究热点演进分析

结合图2和表1,可将数字档案馆研究的热点问题进行以下梳理:

1999年-2000年的研究热点主要集中在两个方面,一是数字档案馆定义与内涵的探讨;二是数字档案馆与相关概念的辨析。后保管时代的到来,对档案管理理论带来了巨大的冲击。如何管理大量的“电子文件”,开发“档案信息资源”,实现资源的共享,引起了普遍的关注,在这种背景下,数字档案馆的概念就应运而生了。

2001年-2004年的研究热点主要从数字档案馆的资源建设与服务两个方面展开。在资源建设方面,“档案数字化”、“信息资源建设”、“元数据”的编制和“网络档案信息”的采集等问题是关注的热点。在服务方面,数字档案馆的建设为新时期档案服务带来了契机,“信息服务”、“知识服务”、“个性化服务”等新的服务理念不断引入到数字档案馆的研究当中,成为数字档案馆服务模式研究的热点问题。计算机网络技术以及电子政务的兴起,都为数字档案馆的研究带来了重要影响,也有学者关注了网络环境下的“信息安全”及“知识产权”的问题。此外,企业和高校数字档案馆的研究也引起了学者们的关注。

图2 数字档案馆研究领域高频主题词知识谱图(时区视图)

表1 数字档案馆研究领域高频主题词列表

2005年-2013年研究热点呈现出多元化的特点,首先表现在对我国数字档案馆建设模式的总结与分析,学者们通过“OAIS”、“数据挖掘”、“云计算”以及“生态系统”的角度来探讨数字档案馆建设问题。其次,学者们还关注了数字档案馆的用户服务问题以及数字档案馆与“电子文件中心”的相关问题。

3.2 数字档案馆研究前沿分析

CiteSpaceIII 可运用突变词探测技术和算法,通过考察词频的时间分布,将其中频次变化率高的词从大量的主题词中探测出来,依靠词频的变动趋势,而不仅仅是频次的高低,来确定数字档案馆研究的前沿主题和领域。将CiteSpaceIII主题词类型选择为“Burst Terms”,节点类型选择为“Cited Reference”和“Terms”,设置合适的阈值,运行软件,得到12 个主要的突变词,如图3所示。

对图3中的12个主要突变词进行归纳,发现数字档案馆研究主要有以下6个前沿领域:

3.2.1 “本体”与数字档案馆

近年来,本体在计算机和信息管理领域受到大量关注,推动了知识管理及智能化检索的研究,也成为数字档案馆研究的一个重要前沿领域。首先,本体构建对数字档案馆知识管理的实现有重要意义。数字档案馆的知识管理区别于企业的知识管理,偏重对数字档案资源的“知识”组织、提炼和挖掘,使之有序化、可视化。当前,将“本体”技术应用到数字档案馆知识管理研究当中主要体现在两个方面:

图3 数字档案馆研究前沿知识图谱(时区视图)

(1)构建基于知识管理的“本体库”。传统本体库在知识管理方面对于静态知识和绝对知识比较有优势,但是对于动态知识和相对知识没有直接的知识管理机制。而且传统本体库的知识管理粒度比较小,不能够提供多粒度的知识管理模式。基于此,董慧等人提出“数字档案本体分子论”来阐述本体知识的演化过程以及本体分子与本体演化间的动态联系[3]。张继东使用本体概念以及本体描述语言OWL 针对电子政务中数字档案馆中的相对知识和动态知识的特点,提出了一种解决动态知识和相对知识的本体标注的方法来提高数字档案馆的服务效率[4]。

2 设计开发基于“本体”的知识管理系统。周义刚将本体作为数字档案馆知识管理系统的核心技术,以湖北省档案局的政务公文作为原始资料,设计并实现基于本体的电子政务领域数字档案的知识管理系统[5]。张继东论述了数字档案馆知识可视化系统从需求分析、工具选择,到可视化对象设计及最终的可视化实现这一完整过程[6]。其次,“本体”技术能促使数字档案馆的“智能化”的实现。“语义网”技术的出现,使得智能化数字档案馆的构建成为可能,而本体作为语义网的关键组成部分,也决定着数字档案馆能否真正实现智能化[7][8]。

3.2.2 “大数据”与数字档案馆

大数据时代给图书馆、档案馆等文化机构带来了机遇和挑战。2013年,吴绪成首先概述了大数据时代对档案馆的冲击,提出建设适应大数据时代要求的第四代档案馆——智慧档案馆[9];王兰成和刘晓亮探讨了档案大数据知识挖掘研究中的技术问题和重点研究方向[10]。同年8月,东方飞扬公司提出大数据时代档案信息化建设的新思路及档案信息化管理的解决方案[11]。陶水龙阐述了大数据对数字档案馆建设的影响、数字档案馆在大数据时代面临的挑战以及大数据技术在数字档案云平台上的实践[12]。在10月召开的“全国数字档案馆(室)建设推进会”上,杨冬权指出:“大数据时代在不断改造传统产业的同时,也对传统档案管理模式提出了挑战。面对大数据时代的机遇与挑战,我们必须全面推进数字档案馆(室)建设”[13]。数据量大,类型繁多,价值密度低,处理速度快,要求时效性高,大数据时代必将对传统档案管理方式带来巨大冲击。只有充分把握“大数据”与数字档案馆的关系,挖掘数据,开发数据,建立档案“数据中心”,才能变被动为主动,更好地开展数字档案服务,实现档案事业的“数字崛起”。

3.2.3 “云计算”与数字档案馆

将云计算技术引入到数字档案馆的研究当中,是当前研究的重要热点及前沿领域。2009年,尹雪梅率先阐述了云计算对“个人数字档案馆”的启示[14]。自此,学者们开始对“云数字档案馆”的建设模式、管理制度、安全风险、安全保障、服务模式、服务平台、动力机制等问题展开广泛的研究。近年来,如何利用云计算技术实现区域性数字档案资源共享成为档案界关注的焦点。薛四新等人以北京市区域性数字档案馆为例,分析了云计算模式下数字档案馆的构建特征[15]。陶水龙阐释了云计算环境下区域性数字档案馆的建设思路、建设原则、基础架构以及运行机制等问题[16]。黄新荣等人提出在云计算时代,应该采用新的联合模式,即云模式来建立数字档案馆[17]。2012年国家档案局主持的课题《基于云计算的国家公共档案信息资源共享服务平台研究及实践》研究展开,并同时在浙江省、辽宁省、天津市、青海省、长春市档案局等单位进行试点。2013年,国家档案局档案科学技术研究所已正式启动了“国家开放档案信息资源管理与共享利用综合系统建设项目”。该项目将分三期进行,全部建成后,将全面完成国家开放档案信息资源管理与共享利用综合系统建设,进入“平台”全面运行阶段。

3.2.4 “知识服务”与数字档案馆

上世纪90年代末,“知识经济”的概念正式提出。如何发挥文献资源的优势,挖掘蕴藏在图书及档案文献资源中的知识内容,对其进行有效的知识组织并向广大用户提供知识服务成为图书馆学界和档案学界关注的热点。知识服务必将取代信息服务,成为数字档案馆的主要服务方式。近年来,档案学界对数字档案馆的知识服务模式[18][19]、知识服务体系[20]、知识咨询体系[21]、知识服务人才素质建设[22]等问题进行了研究。党的十八大提出创新驱动发展战略,吹响了“创新”的号角。加快数字创新、知识创新将成为数字档案馆提供知识服务的不竭动力。

3.2.5 “集成管理”与数字档案馆

集成管理的理念在本世纪初引入档案理论研究当中[23],它包括资源(数据)集成、系统集成和服务集成。早年,金更达构建了基于内容管理的数字档案馆集成模型[24],他指出数字档案馆应该采用基于元数据的集成管理与集成服务模式[25]。2010年发布的《数字档案馆建设指南》指出“数字档案馆是提供公共档案信息服务和共享利用的档案信息集成管理系统”,明确了集成管理在数字档案馆建设中的重要意义,也指出了数字档案馆的另一建设目标——资源共享。而要实现档案信息资源的共享,必须解决异构数据的集成问题,搭建统一的资源共享平台。早在2008年,刘剑、王兰成就提出了数字档案馆基于.NET Framework 和XML 的 异 构 数 据 整合方案[26]。2011年,王兰成研究了异构档案信息整合的信息组织与检索技术[27]。易菲和龙朝阳提出基于SOA 的联合数字档案馆系统构建思路,通过Web Service、XML 等技术实现对档案信息资源的集成[28]。胡凤华、袁继军探讨了高校信息资源整合交换的原则,并提出了基于SOA架构的数据交换模式,通过使用Biztalk2008 作为数据交换的中间件,来解决高校内部各部门不同时期开发的应用系统与高校数字档案馆信息管理系统之间信息的互联互通、共建共享[29]。2012年12月25日召开的全国档案局(馆)长会议强调,要从2013年开始搭建全国开放档案和政府公开信息资源共享平台[30]。随后,严青云通过对区域数字档案馆资源集成共享的实践的调研与分析,提出对进一步推进区域数字档案信息资源共享的思考[31]。当前,充分利用国家和所在地区的信息化基础设施和政务网、互联网以及各类网络资源,搭建网络化、数字化的档案信息服务平台,实现更大范围的数字档案信息资源集成管理与社会共享,已成为新一轮数字档案馆项目的建设重点和目标。

3.2.6 “评价认证”与数字档案馆

随着各地各级数字档案馆的建成,对不同级别、不同类型的数字档案馆建设成果进行评价、鉴定和验收引起广泛的关注。在评价方面,周林兴和潘连根对提出了数字档案馆构建“评价体系”的问题[32][33];时月娇探讨了基于用户视角的数字档案馆评价指标体系的构建[34];肖秋会以英国UKDA 和TNA 数字资源库为例,探讨了基于OAIS 的数字档案馆功能评价[35]。在认证方面,数字档案馆的认证由北美、欧盟等最早提出,是对数字档案馆各方面管理能力符合标准的合格评定活动。程妍妍分析了国际数字档案馆认证的概念、发展历程、认证对象、目标及认证内容[36],并提出应对我国数字档案馆进行统一认证的观点,明确了我国数字档案馆认证的主要内容,包括组织环境、档案管理系统、技术基础设施和安全风险管理能力三方面认证,深入分析我国数字档案馆认证应用实施的核心策略,希望从国家层面推动我国数字档案馆认证工作的开展和全国数字档案馆评价体系的建立[37]。部分档案馆在建设数字档案馆的过程中急于求成,导致数字档案馆建设质量的参差不齐,因此,必须要通过一定的评价和认证的标准,对数字档案馆的建设质量进行严格控制。

4 结语

借助CiteSpace 软件对我国数字档案馆研究概况以及热点演进与前沿问题的分析我们可以得到以下几个重要结论。首先,从数字档案馆研究情况来看,1999年至今,档案界对数字档案馆进行了广泛的关注,当前,我国数字档案馆的研究和实践已经进入了“深水区”,数字档案馆研究热度不减。其次,从我国数字档案馆的热点和前沿问题来看,通过对研究热点演进的分析,可以看到档案界历年来关注的焦点问题的演进过程。通过对研究前沿主题的探测,可以看到近年来数字档案馆研究的前沿问题,分析出未来几年我国数字档案馆研究发展的重要方向。

由于管理体制、档案服务及共享的观念、定位、建设模式等方面的区别,我国数字档案馆建设落后于美国、澳大利亚、加拿大等国家。经过十多年的探索与实践,我国档案信息化建设虽取得了不错了成绩,并形成了“深圳模式”、“青岛模式”、“萧山模式”等成功的案例,但是各个数字档案馆建设的各项标准不尽一致,建设质量也参差不齐,给馆际之间档案资源的共建共享带来了挑战。要解决这些问题,必须充分依靠“云技术”、“本体”等技术,实现异构数据、异构系统的集成,搭建统一的集成管理平台。必须变被动为主动,探索“大数据”时代的数字档案馆的定位,实现信息服务向知识服务的积极转变。必须敢于借鉴国外数字档案馆建设的经验,考察国外数字档案馆建设标准体系的采用及服务功能的设计,通过严格的评价体系及认证标准对数字档案馆建设质量进行控制。

[1]韩冬.加强领导统筹规划狠抓落实——国家档案局数字档案馆(室)建设领导小组近日成立[N].中国档案报,2014-02-14(1).

[2]侯海燕等.当代国际科学学研究热点演进趋势知识图谱[J].科研管理,2006,27(3):90-96.

[3]董慧等.数字档案本体分子论及其应用研究[J].中国档案,2010(3):57-60.

[4]张继东.基于本体的数字档案馆动态知识与相对知识标注研究[J].情报科学,2011,29(9):1331-1334.

[5]周义刚.基于本体的电子政务领域数字档案知识管理系统的设计与实现[J].图书情报工作,2009(15):129-132.

[6]张继东.语义环境下的数字档案馆知识可视化模型研究[J].图书情报工作,2011,55(2):143-148.

[7]林周佳.基于语义网技术数字化档案馆研究[J].云南档案,2006(2):32-35.

[8]鞠彦辉,牟冬梅.智能化数字档案馆体系结构研究[J].兰台世界,2013(32):15-16.

[9]吴绪成.浅谈大数据背景下的第四代档案馆建设[J].湖北档案,2013(3):9-12.

[10]王兰成,刘晓亮.网上数字档案大数据分析中的知识挖掘技术研究[J].浙江档案,2013(10):14-19.

[11]解玉婧.风起潮涌拨云见数东方飞扬开启大数据之门发布会在京召开[J].城建档案,2013(9):14-15.

[12]陶水龙.大数据时代下数字档案馆面临的机遇与挑战[J].中国档案,2013(10):66-68.

[13]杨冬权.在全国数字档案馆(室)建设推进会上的讲话[J].中国档案,2013(11):16-21.

[14]尹雪梅.从云计算到个人数字档案馆[J].山西档案,2009(2):18-22.

[15]薛四新等.数字档案馆云计算建设模式的思考[J].档案学研究,2012(3):62-64.

[16]陶水龙.基于云计算的区域性数字档案馆建设研究[J].中国档案,2013(2):60-63.

[17]黄新荣等.云环境下我国数字档案馆建设模式研究[J].档案与建设,2013(6):4-7.

[18]郑惠萍.数字档案馆知识服务模式探究[J].兰台内外,2009(2):19-20.

[19]李建忠.试论档案信息资源的知识组织与服务模式[J].档案管理,2013(1):49-50.

[20]杨力,姚乐野.基于知识管理的数字档案馆服务体系构建[J].档案学通讯,2010(1):58-60.

[21]袁红军.数字档案馆知识咨询体系构建[J].兰台世界,2013(35):38-39.

[22]胡凤华,袁继军.数字档案馆知识服务人才素质建设分析[J].兰台世界,2013(35):27-28.

[23]安小米,王淑珍.《城建档案信息化建设研讨会》的启示[J].城建档案,2003(5):1-3.

[24]金更达.基于内容管理的数字档案馆集成模型探讨[J].档案与建设,2004(11):9-13.

[25]金更达,何嘉荪.数字档案馆模式探讨——基于元数据的电子文件集成管理与服务研究之二[J].档案学通讯,2005(5):54-58.

[26]刘剑,王兰成.数字档案馆基于.NET Framework 和XML 的异构数据整合研究[J].中国档案,2008(4):44-46.

[27]王兰成.论实现异构档案信息整合的信息组织与检索技术[J].档案学研究,2011(2):55-59.

[28]易菲,龙朝阳.基于SOA 的联合数字档案馆构建研究[J].档案学通讯,2011(2):56-60.

[29]胡凤华,袁继军.高校数字档案馆信息资源整合交换的策略及应用[J].档案学研究,2011(1):43-46.

[30]周峰林.全国开放档案和政府公开信息资源共享平台建设——专访国家档案局巡视员王良城[J].浙江档案,2013(1):13-14.

[31]严青云.区域数字档案信息资源共享实践与思考[J].浙江档案,2013(9):52-53.

[32]周林兴.论数字档案馆评价指标体系的构建[J].湖北档案,2005(4):8-10.

[33]潘连根.数字档案馆评价体系初探[J].浙江档案,2005(9):24-27.

[34]时月娇.基于用户视角的数字档案馆评价指标体系研究[D].上海:上海交通大学,2011.

[35]肖秋会.基于OAIS 的数字档案馆功能评价研究——以英国UKDA和TNA 数字资源库为例[J].档案学研究,2012(6):75-78.

[36]程妍妍.国际数字档案馆认证:分析与启示[J].档案学通讯,2012(6):63-67.

[37]程妍妍.我国数字档案馆认证及实施策略研究[J].档案学研究,2012(6):56-60.

猜你喜欢

本体档案馆数字
眼睛是“本体”
答数字
全省部分档案馆新馆掠影
基于本体的机械产品工艺知识表示
数字看G20
太仓市数字档案馆成为“全国示范数字档案馆”
when与while档案馆
成双成对
专题
Care about the virtue moral education