基于异构网络的西部少数民族文献联合数据库建设*
2014-11-14王小林
王小林 陈 军
(甘肃省图书馆 甘肃兰州 730000)
少数民族文献资源是中华灿烂文化宝库的重要组成部分,但是由于多方因素,少数民族文献资源利用率并不是很高,而基于信息技术的联合数据库建设无疑是提高文献利用率的重要手段之一,它不仅可以为学术研究提供更为便捷的文献信息检索平台,而且对于继承和弘扬各民族的优秀文化传统,促进各民族的繁荣发展,都具有十分重要的意义。
1 少数民族文献联合数据库建设条件分析
1.1 少数民族文献的整理出版为数据库建设打下了良好的资源基础
当前,少数民族文献的整理出版日益受到重视并已初具规模。在联合目录方面,有《中国蒙古文古籍总目》、《全国满文图书资料联合目录》、《北京满文石刻拓片目录》、《世界满文文献目录》、《维吾尔·乌孜别克·塔塔尔古籍目录》、《彝文古籍目录》、《傣文古籍知见录》、《中国少数民族古籍总目提要·纳西族卷》和《中国少数民族古籍总目提要·白族卷》等编纂出版。国外也有关于中国少数民族古籍的目录整理出版,包括蒙文、藏文、维吾尔文、满文等文献。这些联合目录的编纂,调研了现存少数民族古籍的数量和分布情况,为民族文献的研究和利用提供了信息。在整理出版方面,全国已出版了5000多种少数民族古籍,如《甘珠尔》、《丹珠尔》等,还有西夏文的《中国藏西夏文献》、纳西族的《东巴文全集》、贵州的《水书全集》等。
民族图书馆编辑的馆藏民族文献目录以及用汉文编辑的民族文献目录,数量更多。西南民族学院图书馆编辑了《西南民院馆藏地方目录》、《民族资料目录》、《藏传佛教资料目录》、《西南民院馆藏期刊民族资料目录》、《民族文献提要1949-1989》、《羌族民间文学资料集》。湖北民族学院图书馆编辑了《1980-1998年土家族文献资料索引》、《土家族情报资料通讯》、《中国少数民族史料·傩文化研究索引》、《古傩史料汇编·湖北方志卷》等资料,为土家族研究提供了较为便利的文献资源。中央民族大学图书馆编辑了《馆藏民族学科图书内容提要》、《中国民族研究文献目录》、《中国少数民族作家文学作品目录索引》、《中国少数民族民间文学作品目录索引》等。民族地区文献收藏
*本文系国家社科基金项目“西部少数民族文献资源建设研究”(项目编号:10XTQ014)研究成果之一。
1.2 少数民族文字处理技术的开发应用为数据库建设提供了平台
中国55个少数民族中,除回族、满族已不使用自己民族的文字而直接使用汉字外,有29个民族有与自己的语言相一致的文字,由于有的民族使用一种以上的文字,如傣语使用4种文字,景颇族使用2种文字,所以29个民族共使用54种文字。上世纪90年代初,有关研发机构陆续推出了蒙古、藏、维吾尔、哈萨克、朝鲜、彝、壮以及柯尔克孜、锡伯等少数民族文字的字处理系统,新疆、青海、甘肃、西藏、四川、吉林延边等地的专家学者也在国家资助下,开发了多种民族文字处理技术和应用系统,主要包括国家标准和国际标准的研制与开发、操作系统和电子出版系统的研制和应用、民族文字数据库的研制和应用、少数民族文字其他信息处理系统的开发和研制等5个层面的项目。
我国从上世纪80年代就开始着手民族文字文献管理系统的研制,目前藏文字处理软件、藏汉双语信息处理系统、蒙文信息管理系统等都具有很高的水平。也广泛地应用于文献编目、期刊管理、流通管理、情报检索、文献索引编制文献的管理与服务等方面。比较常用的少数民族编目子系统有三种:一是汉文编目子系统,可以对汉文、日文、朝鲜文、藏文、彝文、壮文、傣文、越南文等进行编目。它与西文系统完全兼容,只要多文种字符集和相应的操作系统支持,数据的输入、显示、打印均可以由左向右横行处理。二是蒙文编目子系统,可以对蒙古文、满文等文献进行编目,支持直行显示(从上向下)和打印。三是维文编目子系统,可以对维吾尔文、哈萨克文、柯尔克孜文文献进行编目,支持从右向左横行显示与打印。
1.3 异构网络技术的发展为数据库建设提供了技术支撑
随着我国经济社会发展,信息化水平也有了长足的发展,四大骨干网络全面建成并完善。中国计算机公用互联网(ChinaNet)已覆盖全国200多个城市的多层网络结构;中国教育和科研计算机网(CERNET)通达各省、市、自治区的160个城市,联网的大学、中小学等教育和科研单位已达895个;中国科技信息网(China STINET)可接入全国各地45个城市、共1000多家科研院所、科技部门和高新技术企业;国家公用经济信息通信网络(金桥网CHINAGBN)截至2013年已有600多家政府部门、企事业单位和 ISP 接入。
随着移动通信和互联网技术的高速发展,涌现出了不同类型的通信网络,使用户置身于一种复杂多样的异构网络环境中,信息获取和传输的手段以及数据存储和共享的方式发生了很大变化。异构网络是由不同制造商生产的计算机、网络设备和系统组成的,大部分情况下运行在不同的协议上支持不同的功能或应用。异构网络融合是未来网络发展的必然趋势,通过异构网络融合,可以充分利用不同类型的网络技术优势,极大地提升单个网络的性能,在支持传统业务的同时也为引入新的服务创造了条件,同时降低成本,向不同用户提供个性化的服务,满足用户多样性的需求。异构网络融合技术的发展,为不同平台民族文献特色数据库的融合奠定了基础。
2 基于异构技术的少数民族文献资源数据库构建思路
2.1 联合数据库前期规划
2.1.1 筹备西部地区少数民族文献联合数据库管理中心
回顾性分析我院在以往2年之内所接诊的肠息肉患者资料50例(2016.1-2018.1),所选患者全部获得明确的诊断,临床表现症状包括血便、腹部疼痛、肠梗阻以及便次增多等,50例患者中为横结肠息肉患者10例,降结肠息肉患者10例,直肠和乙状结肠息肉患者25例,升结肠息肉患者5例;50例患者中男性30例,女性20例,最小年龄30岁,最大年龄66岁,平均40.58±6.97岁。
参照CALIS、NSTL与全国文化信息资源共字工程的共享体系,建立西部少数民族文献特色联合数据库管理中心,对西部地区范围内的少数民族文献资源的类型、范围、重点、数量分布等进行统筹规划、协调建设,使得这些分散无序的资源构成一个有机的整体。作为一个虚拟的机构,其成员由西部地区有实力的图书馆及相关单位参加,管理中心还可以组成课题研究小组,由专家委员会制定文献数据库建设相关的数据标准、资源选题方向、具体实施方案和资源共享细则,同时评估申报联合数据库研究课题。各成员馆则组织人力分头开展数据库的加工制作。一个特定的选题,可由一馆单独完成,也可由一个中心馆负责牵头,多馆联合完成。这样既能使数据库在质量上得到保证,又避免了重复建库,人力浪费,最终实现共建共享。
2.1.2 确定数据库建设的范围和内容
西部少数民族文献资源种类繁多、内容丰富、收藏分散,在选题的确定与资源的选择上,需要研究文献资源所涉及的学科领域、载体类型以及覆盖的语种与时间范围等,在数据收集时要因地制宜,体现地域特色,反映本地区的政治、经济、文化和社会生活,遵循重点性原则、点面结合原则、远近平衡原则和系统性原则。在目前人力、财力有限、信息技术水平不高的情况下,选择重点民族、重点地域、重点时期的重点文献,采用抢救“远期”、开发“近期”的原则,优先数字化具有较高历史文化价值的濒临灭迹的文献,同时开发对现实有指导和借鉴作用的当代文献,尽量做到前后呼应,成为一个体系。对于各成员馆前期建设中涉及的内容相近的特色数据库,可以通过交流、协议、合作、一体化等方式开展互利互惠的合作。2.1.3确定科学管理的方法
西部地区的信息资源配置并不平衡,陕西、四川和重庆等省市大专院校、科研院所云集,信息资源拥有量相当丰富,而西藏、青海、宁夏等地区信息资源基础相对薄弱。为避免各地区低质量、低水平重复建库,联合数据库建库管理中心一定要承担起相应的责任,制定严格科学的管理方法。管理中心的职能主要有3个:制定统一的技术规范;制定与项目相关的规章制度;制定项目开展管理办法。具体工作内容包括:资源共享协议、信息传递工作细则、联机共享数据库条例、数据库建设规范、网络信息服务结算办法等。管理中心同时还承担系统资源的分配与管理、用户信息的管理、具体特色信息的网络分布等,这样各承建少数民族文字文献的单位可以根据自身的文献特色,依照标准,有目的、有方向地将民族文字文献数字化。2.1.4确定开发利用和提供服务的方式
联合建库的各成员单位可以根据自身情况及读者需求,对文献资源进行多级权限控制,选择对数据库资源是完全开放还是部分开放。如:哪些资料可以免费在外网发布全文;哪些资料仅供馆内阅览,外网只是发布目录;哪些资料可以通过用户登录,在外网看到全文。联合数据库建成之后,在管理中心网站上及各成员馆的网站上开辟专栏,广泛链接接,公开发布。由于管理中心不是一个实体机构,一般可不进行数据存储,为避免版权纠纷和降低管理难度,由各单位分散存储,通过异构技术,实现基于不同网络和不同操作系统的数据库之间信息的快速、安全、可靠的交换与传输,实现各类资源的跨库检索,以跨库检索及数据库整合深层次揭示特色数据库内容,在二次文献数据库和全文数据库之间建立链接,方便读者快速实现原文信息源定位查询,实现多数据库同时检索,分数据库展示检索结果。
2.2 联合数据库建设方略
2.2.1 搭建适宜的数据库建设平台
我国的三大文献资源共享体系资源建设方式各有不同:CALIS采取项目管理方式,整个保障体系由若干个子项目组成,各成员馆根据自身特点和情况选择加入。全国文化信息资共享工程的资源加工一般在国家中心和特定分中心进行,特定分中心创建的资源通过互联网等方式将元数据和对象数据传递到中间节点,其他中心主要利用国家中心创建的资源数据。NSTL则实行“统一采购、分布加工、联合上网、资源共享”的原则,由成员单位将所订购收藏的原始文献加工成二次文献,提供给网络服务系统。西部地区图书馆建议使用各单位现有的网络环境和应用软件,通过异构网络技术,实现将视频、语音、信息等各类数据整合在一个网络中进行传输。
2.2.2 遵守统一标准和规范
从目前来看,少数民族文献加工还处于大规模数字化阶段,书目数据库和索引类比较多,对内容的深加工研究比较薄弱,但是只有深层次加工的数据库才能引起用户对信息资源的依赖,提高数据库的利用率,节省读者时间,同时,对于图书馆来讲,文献数据库的深加工可以提高图书馆的服务水平,促使图书馆员自身素质的完善,因此要分层次、分类别地推进特色数据库的建设,设计不同类型的数据库,例如:书目型数据库、全文本数据库、复合式专题数据库等,进行从三次文献、二次文献到一次文献,从文本格式到多媒体格式,从单一语种到多语种于一体的逐次深入和多元化的数字化建设与整合。要有重点地进行全文、数值、事实、多媒体数据库的建设。同时,要以用户需求为导向,优化少数民族特色数据库的服务模式,将个性化服务功能嵌入数据库服务系统,提高数据库的检索效率和利用率,形成有针对性、特色性、高增值的各种数据库产品。
2.2.4 强调高质量标引
在少数民族特色资源库的建设中,可以按照文献内容的学科属性、地域属性、民族属性等做各种专题数据库,多角度、全方位揭示文献。如云南省的西南民族研究文献特色数据库就按学科(民族宗教、民族理论、民族人类学、民族工作、民族政治等二十个分类)、民族(阿昌族、白族、布朗族、布依族、傣族、德昂族等36个民族)、地域(云南、四川、重庆、贵州、广西、西藏六个省区市)以及五个专题(东巴文化研究、民国文献研究、民族调查资料、跨境民族研究、云南独有民族)这四个方面来反映西南少数民族的特色文化。标引的质量,对文献的检索效果有直接的决定性影响。由于计算机化检索系统的建立和文献数据库的应用,高质量的标引工作可以提高文献的查全率和查准率,为用户带来极大的方便。
2.3 联合数据库后期的可持续发展
2.3.1 加强专业人才队伍建设
少数民族文献数据库建设是一项专业性很强、涉及多学科知识的复合型工作,对于从业人员的要求较高。从事数据库建设的工作人员,除了要具备一般图书情报知识外,还必须在科学技术知识、少数民族语言文字方面有一定素养,同时还要掌握现代信息技术方面的知识。人才是保证特色数据库建设的关键因素,只有高素质的人才队伍,才能适应现代化的民族文献数字化工作,才能提供高水准、系统化的服务,多途径、全方位地满足读者对少数民族文献信息的需求。
2.3.2 强化数据质量控制体系
数据库的质量控制包括数据库运行平台的选择、服务平台环境、元数据标准、数据录入的准确性和数据处理的规范性等方面。在数据库建设的初始阶段,由于没有源数据,完全采用原始编目方式会产生很多错误数据,编目速度也会出现参差不齐的现象。由于没有可供参考的模式,各单位在制作数据是或多或少都存在着问题,著录内容不准确,详简级次不一,著录不规范,缺乏统一的标准等。随着少数民族文献事业不断向信息化、网络化发展,资源共享,尤其是通过异构网络进行资源共享将是未来的发展趋势。因此,少数民族文献联合数据库建设应建立健全质量控制体系,尽量采用国家标准或国际标准,进行规范控制,保证数据质量。
2.3.3 构建数据更新长效机制
建库后的数据维护工作是必不可少的,一个数据库能否保持信息的正确性、及时性、很大程度上依赖于数据库的更新。随着文献收集、整理、挖掘的深入,必须经常不断地对数据进行必要的修改、增删、合并、更新和整理,这是数据库质量控制不可缺少的环节,也是数据库具有旺盛生命力的保证。如《巴蜀文化特色数据库》在“十五”期间完成了第一期,建成基础数据量2万多条,“十一五”期间进行数据库第二期建设,数据量达到10万条以上,“十二五”期间进行第三期建设,目标数据量是15万条以上,其中数字对象比例超过30%以上,全文、图像、音视频等一次文献达到20%以上。通过数据更新,不断完善数据库系统,充分体现资源的丰富性、广泛性、完整性和时效性。
3 结语
在异构网络环境下,通过少数民族特色数据库的建设,形成一个少数民族文献保障体系,通过统一的查询界面实现对数据源的灵活访问,将从多数据源取得的数据多途径多角度呈现给用户,有利于少数民族语言文字的抢救与保护,有利于全方位开发利用少数民族文献,有利于增强西部地区整体信息实力,对促进地区和国际间的文化交流具有极为重要的意义。
[1]张次第.少数民族文献资源建设研究[J].中国图书馆学报,2011,(9):115-119.
[2]龚剑.谈我国民族文献资源的共建共享[J].图书与情报,2010,(6):118-121.
[3]我国目前有多少种少数民族语言文字?[N/OL].[2013-09-20].http://www.mzb.com.cn/zgmzb/html/2009-12/18/c ontent_65200.htm.
[4]戴剑威,徐海洋,吴宇潇.民族文字,迎来数字化时代.人民网[EB/OL].[2013-09-26].http://chinese.people.com.cn/GB/10878390.html.
[5]包和平.我国民族文字文献工作的现代化[J].图书与情报,2000,(3):36-37.
[6]全国文化信息资源共享工程管理暂行办法[EB/OL].[2013-09-24].http://baike.soso.com/v6520179.htm#11.
[7]王海涛,付鹰.异构网络融合——研究发展现状及存在的问题[J].数据通信,2012,(2):18-21.
[8]栗华军,宋顺林.异构数据库集成系统的研究与实现[J].计算机工程与设计,2008,(8):4026-4028.
[9]刘泳洁,王月娥.关于西部民族地方文献数字化的几点思考[J].大学图书馆学报,2002,(4):47-48.
[10]谷遇春.论大湘西区域文献信息资源共建共享[J].中国图书馆学报,2006,(1):73-76.