APP下载

回族文化信息资源数字化建设研究

2019-08-27丁宁宁

价值工程 2019年20期
关键词:数字化建设回族

丁宁宁

摘要:本文通过对回族文化信息资源“既宽泛又零散”的基本特征的详细阐释,指出在回族文化信息资源数字化建设的前期准备中,传统的文献目录学方法在类似民族特色信息资源的建设中,显得更为重要,它构成了数字化建设的基础链条。最后初步提出回族文化信息资源数字化整合建设的基本框架和实现路径。

Abstract: Through the detailed explanation of the basic characteristics of the Hui cultural information resources, which are "wide and scattered", this paper points out that in the preliminary preparation of the digital construction of Hui cultural information resources, the traditional bibliographic method is more important in the construction of information resources with similar ethnic characteristics and it constitutes the basic chain of digital construction. Finally, the basic framework and implementation path of the digital integration construction of Hui cultural information resources are put forward.

关键词:回族;文化信息资源;数字化建设

Key words: Hui nationality;cultural information resources;digital construction

中图分类号:G250.7                                      文献标识码:A                                  文章编号:1006-4311(2019)20-0218-04

0  引言

中国是一个多民族国家。在中国漫长的历史发展过程中,各个民族共同创造了璀璨的中华文明,也形成了中华文明多元化的格局。回族,是中华民族大家庭中的一员,属于中国55个少数民族之一,自她的先民们开始活跃于古老的丝绸之路开始,到她在广袤的中国大地上形成和发展,至今已有一千多年的历史,积累了丰富的、具有自己民族傳统和民族特色的民族文化信息资源。但迄今为止,倘没有一个内容完整、使用便捷的回族文化信息资源数字化平台。

今天,随着网络数字化、多媒体信息化技术的日趋发展和普及,党和政府高度重视对民族文化遗产的保护和资源共享。在这个背景下,将回族文化信息资源进行整理和开发,挖掘揭示其精华,对促进民族团结,推动经济发展,增强民族自信心和凝聚力,都具有重要现实意义。基于此,本文就回族信息数字化建设的若干问题作出阐述,提出初步构想。

1  对回族文化信息资源基本特征的认知

所谓“回族文化信息资源”,是指与回族有关的所有信息,它们主要是报刊、图书、档案、资料、铭刻、口碑等文字记录,也包括文物、遗址等型物和音像、图片等载体。著名历史学家白寿彝先生曾说:“正像回族居住的分散一样,回族的历史资料也非常分散。过去我们写过一些东西,但写不出充实的内容,资料上的困难是其重要原因之一”①。这段话实际上概括了回族文化信息资源“既宽泛又零散”的基本特征,笔者在此仅以自己的认知,对这一特征做一个初步梳理。

回族文化信息资源宽泛和分散的基本特征,以多样化、碎片化形态呈现,我们重点应把握以下几个方面:

1.1 回族文化信息资源主要蕴藏于汉文典籍  这是因为,一方面回族一直是以汉语、汉字为本族的通用语言和通用文字;另一方面是长期以来回族的“不被认识”。“中国历史上历朝历代,未对回族作跟踪记录”②,所以回族文化信息资源大多数散见于我国浩如烟海的文献典籍之中,获取它犹如大海捞针。白寿彝先生有《回族人物志》多卷,每卷之后均有“附录”,就是从各类文献典籍中辑录、钩沉的回族人物之碑传题跋遗文,笔者粗略统计,涉及古代文献三百余种,有书目、有辑录、有摘编,其所下之功可见一斑。

1.2 地域分布是回族文化信息资源的必然状态  众所周知,回族是“大分散,小集中”的居住格局。在祖国辽阔的疆域上,回族与各兄弟民族杂居且相对聚居,从北域之黑龙江、到南国之海南岛,从宝岛台湾到西域新疆,都有回族居住和繁衍,都留下她们生活的历史和文化记录,都分布着关于她们的信息资源。因此,回族文化信息资源数字化建设,并非一地一隅可以完成。对各地域分布的回族文化信息资源,应重点关注回族的谚语、诗文、歌谣、传说、革命斗争史诗等口碑信息资源,以及仍大量散落于民间的碑碣、墓志,现存的古迹遗址等等,随着时间流逝,这些资源而可能会逐步丧失或损毁,需要我们下大力气去抓紧抢救。

1.3 回族文化信息资源还散见于其他诸多民族的记载之中  长期以来,对回族族源乃至历史在认识上存在错误,有认为回纥为回族的族源,也有认为回族由突厥转化而形成,加之中国信仰伊斯兰教的民族有维吾尔、哈萨克、保安、撒拉等十个民族,历史上人们往往将她们相混淆。另外,在蒙古史料中还有元朝时蒙古王阿难答率众皈依伊斯兰教的记载,而元朝正是回族形成的重要时期。因此,对于其她民族中关于回族文化这些信息资源的收集,同样需要加以关注并耗费大量的精力。

1.4 多文种是回族文化信息资源的又一分布状态  外国对中国回族的关注虽然很少,但却早有记载。晚清学者洪钧撰《元史译文证补》,是最早介绍外国人记载中国的文献,书中引用了大量波斯人拉施特《史集》、法国人多桑《蒙古史》、伊朗人费志尼《世界征服者史》中的史料,这些外国的著述中有大量内容涉及蒙古人对穆斯林的政策、蒙古人皈依穆斯林、回回人在元代的政治地位和生存情况等史料,令国人大开眼界。《世界征服者史》、《史集》、《多桑·蒙古史》后来都有中译本,为我们研究中外关系史及回族文化,提供了极有价值的珍贵信息。20世纪初,中国学者张星烺编注《中西交通史料汇编》多卷,书中多次提及《苏莱曼东游记》一书所记述的阿拉伯穆斯林来华人数日趋增多,当时的中国政府给予来华穆斯林居住区自行管理自内部事务的权力等情况。《苏莱曼东游记》后来被中华书局译出并被列为中外关系史名著之一。

自上一世纪末至本世纪初,随着改革开放的深入和中国在世界的影响日趋扩大,国人也能够更多了解到外国人对中国回族的研究成果。2008年由回族学者丁克家、马雪峰编辑出版的《世界视野中的回族》一书,是我们掌握回族文化信息资源的重要参考文献,为我们提供了大量海外有关回族文化的信息资源。

1.5 民族文化和宗教文化交织,是我们进行回族文化信息资源建设中应特别处理的问题  在回族的形成过程中,伊斯兰教曾经在其民族共同心理状态和风俗习惯等方面产生过重要影响,因此回族与伊斯兰教有着密不可分的关系,这也导致在相当长的时期内人们将回族和伊斯兰教相互混淆,甚至在认识上存在诸多错误,在进行回族文化信息资源建设时,我们必须注重处理好这一问题。笔者以为:第一、民族是有着共同的语言、地域、经济生活和心理素质的人类共同体。宗教则是一种意识形态,就回族而言,伊斯兰教信仰只能说是回族整体共同心理的因素之一,而不是其共同心理的全部,因此民族文化和宗教文化是不应混为一谈的。第二、对于汉文涉及伊斯兰文化、伊斯兰经典的相关文字,我们也不能把其排斥于回族文化信息资源之外,比如回族经学家王岱舆、马注、刘智等人,其著述主要是用儒家学说诠释伊斯兰教义,反映了伊斯兰教通过回族这一载体、在中国特定的文化环境下而中国化的现实。再如,旧时所说“回教”,实际主要是说回族,这些都需要我们予以正确的把握。

2  回族文化信息资源数字化的前期工作

许多人认为,在数字化技术高度发展、通过数字模式实现对信息资源控制已经成为主流的今天,人们长期依赖的传统信息资源控制方法已经过时。在实际工作中,图书馆的信息服务与传统书目参考方式也普遍出现了显而易见的脱节状况。但是,从我们近年所进行的信息资源数字化实践看,传统的文献目录学方法在类似民族特色信息资源的建设中,却显得更为重要,它构成了数字化建设的基础链条。

2.1 调查和遴选工作  调查工作包括对信息资源的分布和类型、数字化的现状、用户的需求等多方面进行调查。这样可以做到数据库建设的科学、合理规划并为合作共建打好基础。遴选的范围,大致应包括以下几个方面:①散见于汉文及相关民族文献中的信息;②相关的学术、专业会议文献及学位论文;③口碑资料和档案性资料;④谱牒、碑刻、图片、文物、遗址等特种信息;⑤外文的、包括国外回族的相关记述和研究成果;⑥其它相关的信息,如:非物质文化遗产。

2.2 资源采集工作  这方面工作的途径和方法,大体有:①自采自建。这需要组织自身的人力、物力和财力,在充分的信息资源调查基础上,通过辑录、征集、采购、制作等途径获得所需的资源。这些资源应该具有自主知识产权、他处难以获得、载体多样等特点。它们可能是从文献中钩沉的只言片语,也可能是针对实物制做的图片记录或音视频记录;②异购。就是购买已有的成果或者知识产权,再按照数字模式的要求进行必须的传统模式梳理、筛选和标注;③网络获取。网络上的信息资源丰富异常,我们往往可以有意外的收获。但就回族文化信息资源来说,网络的资源同样是分而散无序的,需要我们搜索和下载时的耐心,更需要我们对下载来的资源梳理、编排;④实地采集。它包括口碑资源,也包括金石、碑刻、文物、遗存等实物资源,我们在此前已经说过,这是最难但又是最能获取第一手信息资源的途径,需要采集人员与回族文化研究的专业人员沟通和配合,更需要有专心致志、弃而不舍的敬业精神。

2.3 验收和登记工作  对回族文化信息资源的验收和登记工作,主要是为了对已经获取的信息资源实施有效的财产保管,也是为采集工作提供查重依据,还可以为信息资源的数字化工作提供工作依据。验收和登記时应详细注明信息资源的来源、价格、载体形态、单元数量(册、页、幅、条、GB等)以及序号。

2.4 分类、提要、摘录、辑佚等工作  尽管数字化平台可以完全实现信息资源基本特征的自动生成,但在数字化之前,对信息资源进行科学分类仍然十分必要。这是因为,已经数字化的信息资源元数据,作为数据源还需要保存,而且采集来的信息资源也并非全部是全文数字化,还有提要、摘录等多种形式。另外,在对回族文化信息资源进行科学分类的同时,应依据数据平台的组织架构对信息资源做出载体形态类分,并根据已经确定好的资源等级标准标明该资源的等级,为该资源是否数字化以及数字化程度(全文、摘要或题录)提供人工标引。

3  回族文化信息资源数字化的基本框架和实现路径

信息资源的数字化,就是“全面搜集各种载体相关信息,将这些相关信息整合规范到一个系统中,统一在同一检索平台。可以进行目录检索、分类检索、主题检索和全文检索,实现读者网上轻松阅读和下载”③。

由于资源数字化的技术工作主要应与合作商共同研讨展开,这里,笔者仅从甲方(委托方)角度就一些基本问题做初步阐述。

3.1 资源数字化的参考标准和规范

在技术发展和进步日新月异的今天,新的标准和规范层出不穷。但一个成熟的数字化平台应该保持其标准和规范的相对稳定。因此,我们必须从实用性、可持续性以及市场认同度等多方面对数字化的标准和规范进行反复考量,必须遵守W3C、ISO、GB相应的标准和规范,同时应当参考我国《数字图书馆标准和规范建设》、《CALIS建设标准和规范》以及相关的计算机、网络、安全、信息、软件设计等的标准规范。如:在数字化系统表现层,可采用我国字符编码方面的主要国家标准GB2312/GB18030;采用URI统一资源标识符,对所有标识互联网资源的地址和名称的通用集合,采用Z39.84(DOI语法)标识数字环境中的内容对象;采用用于网络资源描述的DC,用于传统出版物描述的CNMARC中文图书机读目录格式,以及用于静止图象的技术元数据Z39.87数据字典等多种元数据规范。

另外,回族文化信息资源数字化平台的检索服务标准对于实现数字资源间的交互非常关键,应采用目前已经被广泛使用的OAI(Open Archives Initiative)用于元数据收割的开放档案主动协议,用于实现资源对象调用获取的Z39.88(OpenURL)对外开放链接协议,用于全国元数据联合编目系统、图书馆自动化系统、馆际图书馆系统之间数据对接、共享的Z39.50信息检索协议等。

3.2 回族文化信息资源数字化平台的架构,包括组织编排架构和技术系统架构

①组织编排架构——回族文化信息资源数字化平台集成多种形态信息资源的数字化格式,即:文本格式和图(影像)格式;全文格式和文摘、提要格式;视频格式和音频格式;动态格式和静态格式等。据此,初步设想将资源组织编排为三大子库:

1)文献分库——包括古籍、图书、报刊文章以及辑录文字。该分库又分全文数据、提要和文摘数据和题录(索引)数据三个子库。

全文数据库应选择具有学术价值、史料价值、使用价值且内容丰富、富有代表性的文献,以满足用户多层次的需求为目的,应包括文献的书名(篇名)、作者、正文、图像、参考文献及摘要、关键词等数据,用户可通过多种途径检索到文献的全文内容。

有相当部分回族文化信息资源内容并不需要做成全文数据,有许多信息资源,仅需辑录一书中的某段文字或对某相关文献的摘要、提要,对此,平台应显示其出处和版本等信息,以便用户需要时能找到原文献。

对于那些即无须录入全文又不便辑录、文摘或提要的资源,则以题录方式反映即可。为便于用户查找获取原始资源,题录式数据须注明具体的出处或收藏。对于音视频以及图片、碑刻、遗存、实物等资源,也需要做出题录来帮助用户从中获知更详细的信息。另外,对于暂时无法获取的文献资源,通过题录加以反映,也不失为好的办法。

2)音视频资源子库——包括各地摄制的回族历史、文化、生活片,回族花儿歌曲,回族著名艺术家的技艺片等。

3)图片子库——包括回族服饰、遗物遗存、回族墓穴图片,也包括各地、各朝代与回族相关的建筑遗址、碑拓图片等。

②技术系统架构——该架构首先应该满足用户浏览、查阅数据的需求;其次要考虑到资源量的扩容;还要对平台的所有资源进行数据注册管理、备份保存、知识产权保护、平台维护、平台安全等多方面的综合考虑,初步设计回族文化信息资源数字化平台以J2EE平台的多层体系结构为依据,采用Spring MVC的开发框架,使系统具有MVC三层结构且每层的功能相对独立,每层之间留有标准接口,能方便进行系统接入与管理。(图1)

1)服务层或终端层:负责前台的内容展现。如接受检索请求,为用户提供检索服务等。在实际实现过程中,采用Microsoft SQL Server 2008,Apache Tomcat做为Web应用服务器,快速搭建高效的B/S(浏览器/服务器)系统进行多层体系结构的系统接入与管理。2)数据层或系统层:负责平台数据库的数据实体存储及增、删、改等基本业务管理。3)应用层:负责实现平台系统各功能并对数据层的业务逻辑封装。(图2)

3.3 数字化平台的系统功能

我们将数字化平台的系统功能按照工作性质划分为:数据加工和编辑、系统服务、资源管理。

①数字资源加工和编辑——包括对前期已经完成技术分析的回族文化信息资源的数字化加工、数据著录(编目)入库以及元数据的生成和标引。还包括对系统外相关数字资源、元数据的收集、生成和标引。

1)回族信息资源的数字化加工:针对不同资源类型,数字化方式也会不同,平台的资源数字化加工功能必须支持纸本文献的扫描OCR文字识别;支持自定义分类体系,自动生成若干导航树;支持规范档及用户自定义词表等。

2)数据著录(编目)与入库:由编辑人员根据不同需求对元数据进行标题、关键词、作者、出版信息等元素进行增删、修改、简繁级别描述等编辑操作。平台系统可支持国内外各种元数据标准,并能满足自定义方案;支持MARC、XML、TRS、关系数据库等多种格式文件导入导出;数据编目入库时,系统支持逐条入库和批量入库等。

3)元数据标准:主要是为保证平台数据的正确性、一致性、完整性、唯一性和有效性,如支持业界国际标准以及CALIS标准;底层数据支持XML格式;同时支持全文检索与元数据查询方式等等。

②系统服务——主要包括多媒体资源的调度、发布、交换(XML格式)、资源检索和浏览等。

1)资源调度:主要是对资源的存储、发布环境进行统一调度,实现资源共享、多级分布式海量存储与无缝检索。

2)资源发布和审核:资源发布和审核:对已经数字化了的信息资源,在经过标准化处理后应及时上传、存储。但对拟发布供读者检索浏览的资源,还应设置一定的权限控制和审核标准,以确保资源在发布之前经过严格的审核,避免发生数据错误、版权问题等等。

3)资源检索功能:资源发布是为了让用户浏览使用,为了方便用户,这一功能应提供标题、作者、内容、关键字、关键词等多种检索途径,支持海量数据的检索,并能灵活定制检索条件及结果展现字段,为用户提供一站式高效、准确、个性化搜索服务。

再者,要根据回族文化信息资源的特点并按照用户的需求或习惯设计必要的浏览和检索界面,包括网页和栏目,每一个网页、栏目下的资源,均通过关键字或关键词有条理地展示在用户面前。

③资源管理——主要是资源数据的安全保护问题。资源数据的安全保护,主要涉及信息数据的安全保护和知识产权保护两个方面。

关于信息数据的安全保护,回族文化信息数字化平台采用SAML安全技术对信息访问进行控制,确保用户统一授权管理,保持用户信息在各系统中的一致性,保障整個系统的安全访问;同时采用完全备份、差分备份、增量备份三种不同的备份和恢复策略,确保数据安全备份;实时监控数据库存储空间使用情况和数据的访问操作情况,设置紧急情况预警。

关于知识产权保护,目前我们收集整理到的回族文化资料还未能全部解决版权问题,且基于对自身已有知识产权的保护,回族文化资料不可能完全开放供用户下载保存,因此需要通过用户认证对资源知识产权保护提供安全控制,形成有效的内、外部用户访问策略。平台设计主要采用对用户IP进行控制的方式实现知识产权保护。其原理是,在著录数据時先对有知识产权限制的文献资料进行标引,当用户想要访问这些信息时,系统会对用户的IP地址进行判断:内网用户即开放信息,外网用户则屏蔽信息,以此达到保护知识产权的目的。另外,对于多媒体资料的传播,由于流媒体具有实时播放和知识产权保护的优点,因此,对这类资料设计采用流媒体技术在线播放,同时要求系统在提供资源的全文阅读和媒体播放等应用的同时,应在浏览器端实现防打印、防拷贝等技术以增强系统安全性。

注释:

①白寿彝:《回族人物志·元代》,银川:宁夏人民出版社,1985年。

②杨怀中:《回族文化散论》,银川:宁夏人民出版社,2012年,第879页。

③杨娅娟:《基于方正DESI系统的回族历史文化特色数据库建设研究》,《大学图书馆情报学刊》,2015年第2期,第39-42页。

参考文献:

[1]白寿彝.回族人物志(1-4册)[M].银川:宁夏人民出版社,1985-1994.

[2]杨怀中.回族史论稿[M].银川:宁夏人民出版社,1991.

[3]杨怀中.余振贵.伊斯兰与中国文化[M].银川:宁夏人民出版社,1995.

[4]杨怀中.回族文献散论(上、中、下)[M].银川:宁夏人民出版社,2012.

[5]丁克家,马雪峰.世界视野中的回族[M].银川:宁夏人民出版社,2008.

[6]杨怀中.回族文化散论[M].银川:宁夏人民出版社,2012.

[7]赵悦,申晓娟,胡洁,李丹.数字图书馆推广工程标准规范体系建设规划与实践[J].国家图书馆学刊,2012(5):46-53.

[8]林琳.全球化语境下的回族认同[J].回族研究,2015(2):40-44.

[9]冯云.民族地区公共图书馆特色数据库建设现状调查分析——以我国民族八省区为例[J].山东图书馆学刊,2017(4):38-43.

[10]宁夏图书馆特色库资源[EB/OL].[2017-5-28].http://www.nxlib.cn/node/403.jspx.

[11]CALIS三期特色库标准规范[EB/OL].[2017-6-29].http://202.114.65.58/portal/portal/media-type/html/group/whuguest/page/area_spec_change5_3.psml.

猜你喜欢

数字化建设回族
中共陕甘宁边区回族干部政策的经验及启示
高职院校文书档案数字化管理研究
外语语言实验室数字化建设中的相关问题
少数民族文献资源的数字化建设
回族汤瓶的设计审美
回族文献目录工作述评
回族族称起源新辨
从《家谱》看吉林回族的源流与走向