APP下载

藏文古籍文献资源库建设及其检索研究

2019-04-03南拉才让完么措

文化创新比较研究 2019年7期
关键词:藏文古籍资源库

南拉才让,完么措

(1.西藏大学图书馆,西藏拉萨 850000;2.西北民族大学社会科学院,甘肃兰州 730000)

藏文距今有着近1 300年的历史,通过藏文记录的古籍文献、古籍著作或译作等也成了重要的历史参考资料。藏文古籍文献作为记录藏族文化、历史、科技以及宗教内容的重要载体,无论是现在还是将来都将成为研究与传承藏族文化的重要资料[1]。因此,为保护藏族文化的更好传承,建立藏文古籍文献资源库显得十分必要。藏文古籍文献资源库的建设,能够有利于充分挖掘藏文古籍文献中丰富的科学文化资源,并对藏族历史上的思想文化与科学成就充分进行体现。利用科学手段对藏文古籍文献进行开发处理, 能够加深人们对藏族文化的理解。同时藏文古籍文献数据库的建立,也是对藏文古籍文献资料现代化管理与开发利用的基础[2]。数据库作为藏文古籍文献信息开发最有效的形式,数据库的建立让藏文古籍文献真正走向数字化与网络化,与现代电子信息技术资源融为一体。在各行各业信息管理开发利用向着数字化发展的今天,藏文古籍文献的信息资源也需要满足这一发展趋势。藏文古籍文献资源库的建立,有利于对珍贵孤本、善本古籍文献资料的抢救。

1 藏文古籍文献资源库建设

1.1 藏文古籍文献资源库属性结构建设

藏文古籍文献资源的属性, 主要以描述该资源的相关属性为主。因此,藏文古籍文献资源属性主要以资料学习对象元数数据规格为中心,同时针对不同类型藏文古籍文献特性建立拓展属性集,其结构如图1所示。

图1 藏文古籍文献资源库属性结构

藏文古籍文献数据库根据数据类型可分为必须数据元素、通用可选数据元素、分类数据元素三大类。必须数据元素在要求中需要与查询对象元素保持数据元素相一致。必须数据元素也是其他类型资源必需的属性标注[3]。其中主要包括:标示、标题、内容描述、关键字、贡献、格式等多类属性;通用可选数据元素主要是针对各类藏文古籍文献资源的属性集合。此类数据元素主要根据使用者与开发者在工作过程中参考属性选择为基础进行选择使用。其中主要包括古籍文献版本状态、古籍文献资源字节数、古籍文献资源使用条件描述、适用对象、位置等属性描述;分类数据元素主要根据藏文古籍文献各类资源特点, 对其中某些资源技术与资源特征密切相关的数据进行制定, 并对其中部分基础特殊资源进行属性分类。在藏文古籍文献对象元数据规范中的最后一个分类中, 为使用者提供任意资源分类结构。由于无法被任何分类法应用,因此这个分类提供了一个简单有效的扩展机制。这可以作为藏文古籍文献资源的主要分类标准,并逐层进行细化。

1.2 藏文古籍文献资源库系统结构

根据藏文古籍文献资源库属性结构, 整体资源库采用多层结构,且每层结构相对独立。每层结构中相互留有标准接口, 这种结构模式不仅可以确保系统的灵活性、开放性以及可扩展性,同时也更加方便系统整体的接入与管理工作。藏文古籍文献资源库系统结构,如图2所示。

图2 藏文古籍文献资源库系统结构

其中, 藏文古籍文献数据库系统中的数据服务层主要负责数据的物理存储、 数据读取以及数据内部维护工作; 系统中存取层主要负责对数字化藏文古籍文献获取、 检索数据库以及资源调度等上层服务进行支持; 应用服务层主要负责对包括信息推送、 使用者认证、网上参考查询等网络环境下的应用服务进行处理;系统结构中最上层的表示层则主要负责使用者检索与交互,使用者可以通过其界面连接数据库系统,同样也可以通过客户端软件进行接入。在系统结构设计中,需要保持系统开放性[4]。在系统对藏文古籍文献进行数字化处理过程中, 根据制订的相关元数标准以及数字化处理规范,对藏文古籍文献资源进行分装与标引,让其成为合格的数字处理对象。通过数据管理工具对藏文古籍文献元数据、数字化对象进行存储与管理。因此,只需要将藏文古籍文献资源在系统某一层上符合规定的结构标准进行处理, 就能够将藏文古籍文献资料与数据库进行整合[5]。

2 藏文古籍文献资源库检索系统

2.1 构建藏文古籍文献资源库信息检索结构模型

以藏文古籍文献资源库建设为基础, 为更加方便使用者使用, 对藏文古籍文献资源库检索系统进行构建。以藏文古籍文献资源库结构为基础,从而建立一个智能化信息检索体系结构模型。模型中主要以使用者界面为基础,从而实现查询转换、文档处理、检索代理以及处理定制等多种功能[6]。

整体查询结构系统中主要分为本体文档预处理与本体文档检索两部分。本体文档处理主要包括数据源、信息库、文档处理器以及本体服务器等项功能;本体文档检索主要包括信息库、定制处理模块、本体服务器、检索代理、查询转换器等多项功能。

2.2 藏文古籍文献资源库信息检索模块实现

藏文古籍文献资源库的建设其主要目的是为今后文献查询提供便利, 因此无论在内容与功能上都应以考虑实际需求为主, 让使用者能够更加精准与方便地进行信息获取,增加其可利用性。在藏文古籍文献数据库信息检索模块中,主要包含输入模块、查询匹配模块以及查询结果输出三个子模块[7]。

查询输入模块主要为根据使用者需求, 为使用者提供精准藏文古籍文献资源定位。其查询系统主要按照关键词、 素材内容以及内容概述三项功能对资源进行综合查询。内容概述功能中,主要提供使用者利用中文自然语言进行需求查询, 避免了藏文古籍文献系统与使用者之间的交流障碍,减轻使用者负担。同时在查询输入模块中, 使用者可对查询结果进行文件格式与素材类型分类, 让使用者能够对所需资源进行更加精准的定位,有效提高查询范围。

查询匹配模块主要提供使用者输入查询要求改进的正向最大匹配法, 从而进行有效信息提取以及自动分词与处理。通过对各项查询条件进行综合后利用加权算法与查询结果之间的相关度进行对比, 按照相关度进行排序[8]。

查询结果输出模块主要功能为按照使用者需求将查询结果按照相关度大小顺序输出给使用者。在查询结果中,系统按照用户素材对资源实现超链接功能,提供使用者在线浏览与下载功能。

3 结语

藏文古籍文献资源库建设及其检索研究, 能够有效实现藏文古籍文献资源数字化,保护藏文文献资源。结合藏文古籍文献资源特点, 建设资源库并对其查询系统进行分析, 实现对藏文古籍文献资源的快速查询与检索,更好地满足使用者需求。

猜你喜欢

藏文古籍资源库
幼儿园课程资源库建设之浅见
中医古籍“疒”部俗字考辨举隅
敦煌本藏文算书九九表再探
健身气功开放课程资源库建设研究
《五女拜寿》
浅谈小学藏文教学的高效化策略
西藏大批珍贵藏文古籍实现“云阅读”
信息技术藏文编码字符集扩充集A
数控加工专业资源库建设中存在问题及对策
我是古籍修复师