基于蒙古文数字图书馆建设蒙古文文献共享域之探讨
2015-10-08索娅阿拉坦仓
□索娅 阿拉坦仓
基于蒙古文数字图书馆建设蒙古文文献共享域之探讨
□索娅 阿拉坦仓
民族文献共享域建设是网络环境下亟待解决的问题。基于蒙古文文献数字化已有的成果,建立蒙古文文献共享域,在理论和实践上都是一次探索和挑战。该文在充分发挥蒙古文文献共享域建设有利条件的同时,针对蒙古文共享域建设的必要性、成果及其不足提出相应的对策。
民族文献 蒙古文文献 数字化 共享域 对策
CALIS在三期建设中,按地域、学校类型、共享内容建设共享域或共享联盟中心。民族文献共享域是以民族文献及民族文献数字产品为依托,建立民族文献信息资源的整合和服务平台。
民族文献是传承和弘扬民族文化的重要载体,在我国55个少数民族中,就有傣族、蒙古族、藏族、维族、景颇族、彝族等29个民族有与自己的语言相应的文字[1],以这些文字记载的各类型少数民族文献种类繁多、内容丰富,是中华民族的巨大财富。利用现代信息技术手段将珍贵的民族文献数字化,是对民族文化传播和继承方式的创新,可有效解决保存与使用之间的矛盾,对于民族文献的利用、传播、保护以及民族文化的传承和弘扬都具有重要意义。在蒙古文数字图书馆的基础上建立民族文献共享域,是民族文献在网络环境下实现共建共享的理想途径。
1 建设民族文献共享域的必要性和条件
在数字化、网络化快速发展的今天,建立民族文献共享域是刻不容缓的事情,而且具备了一定的基础条件。
1.1 民族文献共享域建设的必要性
首先,民族文献的收藏与分布较为分散,给研究者带来了诸多不便。很多研究者为找到所需民族文献资料,需要跨地区甚至跨国界去查找资料,花费很多精力和时间。第二,民族文献得不到整合和揭示,严重影响了其有效使用,利用率较低。第三,一些珍贵的民族文献精品由于出版年代久远,纸张已经开始变脆,急需保护,不宜经常翻阅。第四,从事民族语言和民族学研究的人员较少,导致相应的出版物印数少,再版、重印的机会不多。因此,民族文献的大规模集成整合、深度加工与增值利用受到广泛关注,民族文献数字产品经过共享域的传播与利用势在必行。
1.2 民族文献共享域的建设条件
第一,民族文献相对集中在少数民族聚居的地区,就拿蒙古文文献的分布来说,据不完全统计,80%的蒙古文古籍集中在内蒙古首府呼和浩特的四所大型图书馆中[2]。对于现代民族文献的收藏,民族地区图书馆更是要求完整和系统,由这些图书馆进行民族文献数字化,条件比较便利。第二,民族文献管理软件的已经广为使用,民族文献的数字化标准也基本趋于成熟。第三,在民族地区的一些高校图书馆中,民族文献数字化有了一定的基础。如新疆大学建立的“新疆大学地方特色数据库”、内蒙古大学图书馆建设的“馆藏蒙古文全文数据库”、“甘珠尔经数据库”、“蒙古文期刊全文数据库”、“全区高校蒙古文联机合作编目平台”。
2 蒙古文数字图书馆的现状
蒙古文数字图书馆是民族地区高校民族文献整合的典范,在民族文献数字图书馆建设中发挥着引领示范作用。
内蒙古大学图书馆建设的蒙古文数字图书馆,是由耶理巴文献管理集成系统、蒙古文图书全文数据库、蒙古文期刊全文数据库、数字甘珠尔经、蒙古学信息网等系列成果构成。并在内蒙古高等教育数字图书馆系统平台之上,搭建了全区高校蒙古文图书联机合作编目平台,初步实现了蒙古文书目数据的共建、共享。该项目已是内蒙古大学“211工程”三期建设的标志性成果之一。
2.1 耶理巴文献管理集成系统
耶理巴文献管理集成系统是能够适应数字图书馆运作机制的文献管理集成系统。该系统在国际上首次全面应用蒙古文编码国际标准的相关技术进行蒙古文文献管理信息系统的开发;首次采用更加适合数字图书馆运行机制的DC元数据实现的文献管理集成系统;实现了基于Webservice技术的联机合作编目系统;国际化的开发方式,实现了对多种少数民族文字的支持;本系统的研究以蒙古文为出发点,蒙古文由于其排版方式独特,系统实现是最困难的,在解决了蒙古文的相关问题后,实现了对藏文、维吾尔文、满文等民族文字的支持,攻克了民族文字书写方向、文字编码、字母变体、同形异音、文献排版装祯形式等复杂性难题。该系统通过在内蒙古地区图书馆蒙古文文献管理中的广泛使用,实现了蒙古文文献的采访、验收、编目、典藏、流通、调拨、自助借还等业务流程和蒙古文信息的存储、检索、交换及共享的功能。
2.2 蒙古文图书全文数据库
该数据库是内蒙古大学图书馆通过自建和参与国际合作项目CADAL的方式实现馆藏近7000种蒙古文现代图书的数字化。在数据库的研发制作过程中,严格遵循CADAL的文献资源数字化规则,通过全文扫描、图像处理、编制检索系统等过程完成。该数据库是国内外第一个民族文字现代图书的大型全文数据库。
2.3 蒙古文期刊全文数据库
“中国蒙古文期刊网”由国家教育部民族学科蒙古学文献信息中心和内蒙古大学图书馆蒙古学及其他学科信息咨询部建立,于2005年4月开通。目前收集了《内蒙古社会科学》和《中国蒙古学研究》等15种国内学术期刊,全文数据附有论文题目、蒙古文题名、汉译题名、汉译内容提要、英译提名和拉丁转写提名等。使用PDF图像处理办法,成功解决了在网络环境下可以查看或浏览蒙古文原文数据的难题,读者不受时间和地点的限制,可以在全球范围内查阅国内正式出版的蒙古文期刊信息资源。蒙古国出版的一些学术刊物也即将收入本数据库。蒙古文期刊全文数据库的建立给蒙古学界的专家学者搭建了一个方便快捷的学习研究平台,为蒙古学界的专家学者提供服务。
2.4 数字甘珠尔经
《甘珠尔经》被誉为中华文化宝库中百科全书式的蒙古文古籍巨著,是蒙古文大藏经的组成部分,全书共7大类108卷,约2000多万字,是佛学和中国古代各门类学科文化研究不可多得的文献资源,其版本极其珍贵。长期以来由于受保护限制,使这一历史文献得不到充分利用。2006年,内蒙古大学图书馆启动《甘珠尔经》的全文数字化工程,经过全文扫描、制作光盘、磁带备份、制作检索系统等多个程序完成。数字化《甘珠尔经》可以在互联网上提供蒙古文、蒙古文拉丁转写和繁体汉文三种检索形式,供不同国家、不同民族的读者使用,使中外学者能够通过互联网研究和阅读这一人类文化遗产[5]。
3 蒙古文文献的数字化模式与共享域的建设
基于蒙古文文献数字化现有成果建设蒙古文文献共享域,在理论和实践上都是一次探索和挑战。
3.1 蒙古文文献的数字化模式分析
蒙古文文献的数字化模式可以分为独立、联盟、虚拟三种模式,也就是蒙古文文献数字化的三个阶段:起步、联合、共建共享。
独立模式是数字化起步阶段的模式,主要是通过自建数据库来不断完成数字资源的原始积累,并通过用户的使用来不断完善数字化资源。如新疆大学建立的“新疆大学地方特色数据库”、内蒙古大学图书馆建成的“馆藏蒙古文全文数据库”、“甘珠尔经数据库”等。目前已有的民族文献数字资源大多属于这种模式。
联盟模式是在完成独立模式阶段的数字化资源积累之后,在互利互惠原则基础上实现的一种模式。如内蒙古自治区高校蒙古文联机合作编目平台就是联盟模式,它是基于CALIS内蒙古自治区文献信息服务中心联合编目的相关标准、依托耶理巴蒙古文文献管理集成系统建立的,达到了数据标准统一,初步实现了蒙古文书目数据共建、共享。
虚拟中心模式是在联盟模式的基础上产生一个中心成员,该成员负责虚拟中心的业务指导,同时负责将各成员的数字化资源元数据收集到中心服务器。目前,民族文献数字化模式仅有独立、联盟两种模式,虚拟模式还属于空白。
蒙古文文献数字化建设在模式的选择上,无论是依据蒙古文文献的实际情况,还是依据数字化发展的规律,终将结合各种模式的优点,建立一个既有虚拟中心成员的指导,又有联盟成员加盟的统筹规划、共同发展的模式[3][4]。
3.2 建立蒙古文文献共享域的对策
蒙古文文献共享域与蒙古文文献的分布和利用相结合,通过服务平台的建设,形成一个参建馆相互协作、对外统一透明服务,并与CALIS等其他资源体系实现共享的新模式。在这种新模式的建设中,要确定管理运行机制,明确科学合理和持续发展的建设内容。
3.2.1 确定管理运行机制
在建立蒙古文文献共享域初期,应该从组织管理、组织机构、数据标准、开放数据、成员权益等方面制定详细的管理运行机制。
组织管理:转变观念,组织有力,配备民族文字信息技术复合型高级人才,同时保障一定的研发经费。这些都是开展民族文献数字化的必要和先决条件。
组织机构:在CALIS管理中心成立一个民族文献共享域管理组织,并以该组织为核心指导民族文献的数字化建设。该组织需要由相关的CALIS省中心联合组成,下辖各联盟成员。
制定并推荐数据标准:根据民族文献的国际国内使用情况推荐并制定数字化标准;根据民族文字书写方向等实际问题制定统一输入和显示标准,并在基于Unicode的基础上,提供相关使用标准。
开放数据:关于开放数据,可通过元数据收割或者开放查询端口API的形式向成员馆内部开放。鉴于目前国内的网络状况,可以使用元数据收割方式定时收割联盟成员的数字化资源。
成员权益:不论在中心担当何种角色,均有共建的义务和共享的权益。成员不论大小,均有相同的共享资源权利;资源不论多少,均需向中心提交数据等[3][4]。
3.2.2 明确科学合理的建设内容
首先要对蒙古文文献进行资源整合,在共享域平台上实现高校乃至各系统图书馆蒙古文文献纸本馆藏、电子馆藏和相关网络资源的数据共享。
其次,提供信息服务。蒙古文文献共享域是服务于蒙古文文献研究和教学,以及对国内外专家学者提供蒙古文文献信息服务的保障体系。共享域中心图书馆提供统一身份认证、公共检索与资源导航、馆际互借、联机编目等服务。
第三,提供良好的技术支持。共享域中心为各成员馆提供涉及系统建设的支持服务。内容包括共享版软件的中心部署、分配使用等。
第四,做好宣传培训服务。蒙古文文献共享域建设以高校图书馆为主要参建单位,并将延伸到各系统图书馆,开展读者服务与共享域应用的推广。共享域中心应面向各成员馆、各服务点的管理、技术与服务人员开展培训工作,建立起支撑共享域的有效运行团队。
1 鲍玉来.蒙古文文献数字化理论与技术研究思路[J].科技成果管理与研究,2009,(1):83—86
2 德力格尔.少数民族文字文献开发利用与数字化管理[M].呼和浩特:内蒙古教育出版社,2007:4—10
3 白海燕.数字资源整合的模式与解决方案[J].图书情报工作,2005,(10):87—90
4 索娅,阿拉坦仓.高校图书馆人事制度改革的探索与实践-内蒙古大学图书馆人事制度改革述评[J].大学图书馆学报,2011,(2):27—30
SuoYa Alatancang
Based on the previous results on the digitization of ethnic documents, the construction of the shared domain of ethnic documents has been proposed as an exploration full of challenges of both related theory and practices. The countermeasures on taking advantages and overcoming weaknesses for development of shared domain of ethnic documents have also been presented.
Ethnic Document; Digitization; Shared Domain; Countermeasure
*国家自然科学基金项目“基于领域本体的蒙古文数字资源整合机制研究”(项目编号:71163029)的成果之一。
索娅,ORCID:0000-0002-0176-5983,suoya_lib@126.com。
内蒙古大学图书馆,呼和浩特,010021
呼和浩特民族学院,呼和浩特,010051
2014年11月4日The Shared Domain of Ethnic Documents Based on Mongolian Digital Library