APP下载

基于信息融合的档案知识服务研究

2018-09-10常大伟温芳芳

档案与建设 2018年3期
关键词:资源融合用户

常大伟 温芳芳

[摘要]基于信息融合的档案知识服务,是借助信息融合的理念和技术,对档案信息资源、用户需求信息等进行综合处理与协同利用,推动档案信息资源在数据层面的关联和知识层面的重构,实现面向用户需求的档案知识发现和知识服务的过程。论文构建了由一个目标、两种资源、三个模块、四个环节构成的基于信息融合的档案知识服务框架,并从多源信息获取、信息综合处理、信息融合和档案知识服务方面,探讨了基于信息融合的档案知识服务实现流程。

[关键词]档案服务知识服务档案信息资源信息融合用户需求

[分类号]G270

The Research on Archives Knowledge Service Based on Information Fusion

Chang Dawei, Wen Fangfang

(School of Information Management of Wuhan University, Wuhan, Hebei, 430072)

Abstract: Archives knowledge service based on information fusion is a process of realizing useroriented archives knowledge discovery and knowledge service. It relies on information fusion ideas and technologies to synthesize, cooperate archives information resources and user demands, promote association of archives information resources at the data layer and its reconstruction at the knowledge level. This paper constructed a framework of archives knowledge service consisting one goal, two kinds of resources, three modules and four links, discussed flow chart of it from the aspect of multisource information acquiring, information synthesizing, information integration and archives knowledge service.

Keywords: Archive Service;Archives Knowledge Service;Archive Information Resources;Infor? mation Fusion

服务是档案工作的生命线,也是档案工作的出发点和落脚点[1]。2016年,《全国档案事业发展“十三五”规划纲要》出台,要求到2020年“档案利用服务模式创新和档案信息开放取得实质性进展;档案信息整合共享程度明显提升,档案利用服务更加便捷普惠,方便人民群众的档案利用体系更加完善”[2],进一步明确了档案服务工作的目标和要求。在此背景下,如何通过档案服务理念创新、服务手段优化和服务模式变革,推动档案服务内容由实体服务向数字化服务发展,服务职能由行政服务向社会化服务过渡,服务模式由信息服务向知识服务转型[3],就成为档案界需要重点关注的内容之一。鉴于此,本文以档案知识服务为主线,以信息融合为切入点,在明晰基于信息融合的档案知识服务内涵的基础上,构建了基于信息融合的档案知识服务的理论框架,探讨了基于信息融合的档案知识服务的实现流程,以期推动档案知识服务的实践应用。

1基于信息融合的档案知识服务的提出

信息融合是综合利用多种信息处理技术,对多源信息资源进行加工和协同利用,使不同形式的信息相互补充,以获得对同一事物或目标更客观、更本质认识的过程[4]。信息融合借助加权平均法、卡尔曼滤波、贝叶斯估计法和基于神经网络、模糊逻辑、距离熵、随机理论等融合算法,在聚类分析、数据关联、本体构建、语义分析、数据挖掘等技术的支持下,对多源、多模态信息进行综合处理,将大量多源、异构、动态、碎片化、不确定及稀疏的数据源、信息源、知识源相融合,挖掘出隐含的、有价值的、尚未被发现的新知识[5]。信息融合在多源信息处理和深层知识发现方面具有一定的优势,已被广泛应用于农业知识服务、数字参考咨询知识融合、集群知识融合与创新、知识库构建等具体领域。

结合信息融合与档案知识服务的相关理论,笔者认为基于信息融合的档案知识服务,是借助信息融合的理念和技术,对档案信息资源、用户需求信息等进行综合处理与协同利用,推动档案信息资源在数据层面的关联和知识层面的重构,实现面向用户需求的档案知识发现和知识服务的过程。具体来讲,基于信息融合的档案知识服务,首先借助信息整合、信息聚类、关联分析等信息融合技术,对多源异构的档案信息资源进行协同开发,挖掘和发现其蕴含的知识要素,形成档案知识空间,实现档案信息资源的融合;其次,对分散多元的用户需求信息进行获取、组织和分析,构建用户需求模型,揭示用戶档案知识需求的特征、偏好和趋势等,实现用户需求信息的融合;最后,将基于档案信息资源融合的档案知识空间和基于用户需求信息融合的用户需求模型进行匹配,实现档案知识服务的应用融合,推动面向需求的档案知识服务的发展。

2基于信息融合的档案知识服务的框架构建

档案知识服务的实质是通过采集、整合、挖掘档案信息资源,为用户提供知识内容和问题解决方案[6]。可以看出,档案知识服务主要由档案知识发现、用户需求揭示和档案知识服务提供三个核心要素组成。据此,本文构建了由一个目标(档案知识服务)、两种资源(档案信息资源和用户需求信息)、三个模块(档案信息资源融合、用户需求信息融合和档案知识服务应用融合)、四个环节(多源信息获取、信息综合处理、信息融合和档案知识服务)构成的基于信息融合的档案知识服务框架。

其中,档案信息资源是档案知识发现的资源基础,代表着档案知识服务的资源供给;用户需求信息是知识需求揭示的重要依据,代表着档案知识服务的社会需求;档案信息资源融合是对档案信息资源的再组织,是档案知识发现的重要手段,其结果是形成档案知识空间;用户需求信息融合是对用户需求信息进行综合处理,揭示用户的档案知识需求,其结果是形成用户需求模型;档案知识服务应用融合是在档案信息资源融合和用户需求信息融合的基础上,以社会需求为导向、以资源供给为基础、以实际应用为依据进行的二次融合,其结果是形成档案知识内容和问题解决方案;多源信息获取、信息综合处理、信息融合、档案知识服务四个环节,是基于信息融合的档案知识服务实现的具体流程;档案知识服务是整个框架的出发点和落脚点,通过一定的方式将档案知识服务应用融合形成的档案知识内容和问题解决方案提供给档案用户,满足档案用户的知识需求。如图1所示。

3基于信息融合的档案知识服务的实现流程

围绕多源信息获取、信息综合处理、信息融合和档案知识服务四个环节,从档案信息资源获取、用户需求信息获取、档案信息资源综合处理、用户需求信息综合处理、档案信息资源融合、用户需求信息融合、档案知识服务应用融合、档案知识服务八个方面,详细解析基于信息融合的档案知识服务的实现流程。

3.1多源信息获取

(1)档案信息资源获取

在基于信息融合的档案知识服务中,档案信息资源获取就是结合我国档案事业体制条块分割的现状和档案信息资源存在形态的发展趋势,通过机制体制的设计、技术方法的应用等多种方式,对多源异构的档案信息资源进行汇集,形成档案信息资源集合。为增强多源异构档案信息资源的获取能力,首先要加强国家数字档案资源整合与服务机制的顶层设计,建立由“国家数字档案资源调查方案、整合模式、服务机制、保障体系”所组成的、具有普适性的国家数字档案资源整合与服务的框架[7],推动馆际合作视阈下的档案信息资源整合,构建档案信息资源跨机构获取的路径[8];其次,拓展档案信息资源获取的资源范围,加强网站、社交媒体等生成的新媒体文件的归档和整理工作;再次,推动档案信息资源获取和整合的技术研究,探索元数据技术、跨库存取技术、数据库整合技术等在档案信息资源整合中的应用;最后,在档案信息资源的获取过程中,还应该考虑到档案信息资源的知识产权和信息安全保护等内容。

(2)用户需求信息获取

网络环境下档案用户的活动空间、分布特征及利用需求都发生了极大的变化。档案用户的泛在性及需求的多元性[9],增加了档案机构进行用户需求信息获取、用户需求研究和档案知识服务的难度。根据档案知识服务对象性质的不同,档案知识服务可大致划分为面向党政机构和面向社会公众两种类型。从目前档案知识服务的实际来看,面向党政机构的档案知识服务占据主导地位,面向社会公众的档案知识服务处于从属地位,但对于社会公众档案知识服务的潜在需求也需要给予重视。为党政机构提供档案知识服务是档案机构工作的重要内容,在长期的档案知识服务过程中形成了关于党政机构档案知识需求的系统信息记录,可将这一部分需求信息进行收集、整理、开发和存储,构建档案需求信息数据库;而社会公众的档案知识需求,表现得较为零碎和分散,这一部分档案需求信息的获取难度较大,但可通过收集用户在档案服务平台上的检索记录和浏览足迹等信息,开展档案用户需求调查、鼓励用户利用社交媒体进行档案需求表达等方式,获取社会公众的相关需求信息,并将其补充到前述档案需求信息数据库中。需要注意的是,檔案用户知识需求信息的获取是一个动态持续的过程,需要在提供档案知识服务的同时不断收集和整理新的需求信息,为构建用户需求模型提供条件。

3.2信息综合处理

(1)档案信息资源综合处理

档案信息资源综合处理的目的,是为档案信息资源融合以及档案知识管理系统、档案知识库等档案知识空间的构建,提供有序化、综合性的信息资源。档案信息资源综合处理就需要针对档案信息资源多源、多结构、多模态等特点,利用数据归一、数据映射、异构数据加权、数据过滤等方式对档案信息资源进行数据预处理,规范档案信息资源的描述和组织方式;通过关联揭示、领域本体构建和语义标注等,建立档案信息资源底层特征与高层语义之间的映射关系,形成新的具有多重关联的信息集合。通过档案信息资源的综合处理,推动信息资源从浅层次的信息组织向深层次的知识化组织转向,从单维的、孤立的、不成体系的信息资源集合向多维的、内容关联的、系统化的知识空间转变[10],为档案信息资源融合的实现提供支持。

(2)用户需求信息综合处理

用户需求信息综合处理的目的,是对用户需求信息的特征进行抽取、组织和关联,构建用户需求模型。首先,在用户需求信息获取和预处理的基础上,识别和分析能够反映用户需求的信息,如档案用户类型、档案利用频次、利用时段、利用主题、利用内容、利用领域等,抽取具有典型特征的关键词或主题词,构建基于档案用户信息需求的领域词典;其次,将前文构建的档案需求信息数据库或用户检索记录文本等,与基于档案用户信息需求的领域词典进行匹配,提取用户需求特征,构建用户需求特征向量空间;最后,在用户需求特征向量空间构建的基础上,进一步对用户需求特征进行聚类和分析,揭示档案用户知识需求的深层次规律和利用需求的整体发展特点与趋势。

3.3信息融合

(1)档案信息资源融合

经过对档案信息资源的综合处理,已经初步形成档案知识化利用的资源支撑体系。在档案信息融合阶段,更加注重利用多种信息技术对档案信息资源进行多方面、多层次的综合处理,促进档案信息资源的协同利用、知识重构和知识发现。在协同利用方面,围绕特定的档案知识服务内容,通过档案信息资源的聚类和关联,实现多源档案信息资源的相互补充和印证,提高档案知识挖掘和服务的精确性与完整性;在知识重构方面,利用聚类分析、知识关联、知识聚合等方法,对在内容、特征、属性等方面具有关联关系的档案信息资源进行知识化组织,形成围绕服务主题的各类档案知识类型和档案知识网络;在知识发现方面,借助数据挖掘、语义分析等信息技术,挖掘档案信息资源蕴含的深层次的知识因子和价值要素,构建档案知识空间。

(2)用户需求信息融合

用户需求信息融合在信息融合思想和信息处理流程方面,与档案信息资源融合具有很大的一致性,相关技术处理手段就不再累述。相对而言,用户需求信息融合的侧重点主要集中在如何在用户需求特征向量空间的支持下,准确地抽取和揭示用户需求的内容、特点等信息,并通过用户需求信息的组织和建模,构建能够反映用户需求主题、需求层次、需求领域等的用户需求模型。用户需求模型是有效开展档案知识服务的重要依据,可以为档案知识服务方案的制定和策略的实施提供指引,改善当前档案知识服务目标不明确、内容不清晰的状况。

(3)档案知识服务应用融合

在一定的规则支持下,通过档案知识空间与用户需求模型的对接和匹配,建立起档案知识与用户需求的数据关联,并围绕用户需求进行档案知识要素的抽取、聚类、挖掘和知识方案的生成,实现档案知识服务的应用融合,进而实现了用户需求引导下的档案知识开发与服务,推动了档案用户需求与档案信息资源供给之间的良性互动,提升档案知识服务的效能。

3.4档案知识服务

通过信息融合,档案信息资源在数据层面改变了以往相互孤立的状态,在知识层面形成了较为完整的档案知识体系,为档案知识服务的开展提供了更为充分的条件。这就需要进一步创新档案知识服务的模式,优化档案知识服务的内容,完善档案知识服务的策略,以提升档案知识服务能力。在档案知识服务模式创新方面,目前已经形成了基于新兴技术的个性化档案知识服务模式、基于内容管理与开发的档案知识服务模式、基于流程优化的全方位档案知识服务模式和依托管理机制的档案知识服务模式等四种模式[11],为基于信息融合的档案知识服务模式的创新提供了重要借鉴。这就要求在综合分析不同模式优缺点和适用性的基础上,结合具体的需求环境和服务场景,探索基于信息融合的档案知识服务的应用问题;在档案知识服务内容优化方面,可利用基于信息融合的档案知识服务在档案用户需求与档案信息资源融合方面的优势,根据用户需求模型发掘出的常规性需求提供结构化档案知识服务,也可以根据不同用户的个性化需求提供即时性档案知识服务;在檔案知识服务策略完善方面,通过构建档案知识库、档案知识管理系统、档案知识服务平台等,提供档案知识问答、档案知识检索、档案知识导航、档案知识推送等自助式档案知识服务,或档案知识制定、档案知识决策支持等协助式档案知识服务。

4总结

档案知识服务是深化档案服务内涵,提升档案服务价值的重要方式。为推动档案知识服务的发展,本文以信息融合为研究的切入点,在探讨基于信息融合的档案知识服务的内涵和研究的需求与条件的基础上,构建了基于信息融合的档案知识服务框架,并从多源信息获取、信息综合处理、信息融合和档案知识服务方面重点探讨了基于信息融合的档案知识服务的实现流程。整体来讲,目前基于信息融合的档案知识服务在理论研究和技术实现方面尚处于探索阶段,其实践应用还面临着一系列的问题。这就要求,一方面加强基于信息融合的档案知识服务的理论研究,充分借鉴不同学科、不同领域的信息融合理论和方法,探索适合多源异构档案信息资源融合的模式和策略;另一方面,强化信息技术在档案知识服务中的应用创新,加大信息集成、多模态信息融合、本体构建、数据挖掘等技术在档案信息资源融合与档案知识服务中的应用研究。

参考文献

[1]李明华.在全国档案局长馆长会议上的工作报告[J].中国档案,2017(1):16-24.

[2]全国档案事业发展“十三五”规划纲要[EB/OL].[2017-10-14](2016-04-07). http://www.saac.gov.cn/news/2016-04/07/content_136280.htm.

[3]周鑫,倪丽娟,陈媛媛.国内档案服务研究进程探析[J].档案学研究,2017(2):68-73.

[4]化柏林.多源信息融合方法研究[J].情报理论与实践,2013(11):16-19.

[5]祝振媛,李广建.“数据—信息—知识”整体视角下的知识融合初探——数据融合、信息融合、知识融合的关联与比较[J].情报理论与实践,2017(2):12-18.

[6]毕建新,郑建明.用户目标驱动的档案知识服务模型研究[J].浙江档案,2014(8): 16-19.

[7]孙俐丽,吴建华.关于国家数字档案资源整合与服务机制顶层设计的初步思考[J].档案学研究,2016(1):57-61.

[8]张卫东,孙振嘉.馆际合作视阈下我国档案文化资源整合路径研究[J].档案学通讯,2017(4):63-67.

[9]张卫东.基层化与网络化:新环境下档案用户资源整合与培育策略[J].档案学研究,2017(1):42-46.

[10]陈兰杰,侯鹏娟.数字文献资源关联关系揭示方法研究[J].图书馆,2015(2):41-45.

[11]牛力,袁亚月,韩小汀.对档案信息知识化利用的几点思考[J].档案学研究,2017(3):26-33.

猜你喜欢

资源融合用户
“五学”融合:实现学习迁移
基于用户和电路的攻击识别方法
2021少儿出版用户触达能力指数
刚柔并济
我给资源分分类
破次元
挖掘文本资源 有效落实语言实践
融椅
资源回收
信用卡资深用户