哈萨克族系谱数字化平台建设研究
2018-01-28新疆医科大学图书馆
刘 飞(新疆医科大学图书馆)
哈萨克族是我国历史悠久的少数民族,主要分布在新疆、甘肃、青海等西北部地区。哈萨克族民对系谱相当重视,经过历代族人的文字编写与口耳相传,现已形成了比较完整而详备的系谱。以文字编写的系谱,较古老的有《成吉思汗》《克普恰克系谱》等,近世有《大玉兹系谱》《江格尔系谱》等,此外还有很多手抄本,已编成的《哈萨克族系谱集》可谓系谱著作中的“集大成者”。哈萨克族系谱对于哈萨克族自身的文化传承、梳理哈萨克族史及建构中华民族全史有着重要意义。目前,我国对哈萨克族系谱的搜集和整理工作还处于纸质编写阶段,未实现数字化,无法满足信息时代获取信息的新需求。因此,依托大数据构建哈萨克族系谱数字化平台,将有利于哈萨克族系谱的开发和保护,有利于哈萨克族历史的弘扬和文化的传承,有利于推进我国与相邻国家的文化交流,为我国“一带一路”建设重大战略的顺利实施作出贡献,同时能为哈萨克族系谱的研究注入新活力。
1 哈萨克族系谱及其研究概况
公元7世纪,哈萨克族系谱开始在民间流传;公元13世纪,开始有了文字记录,主要包括11-13世纪的康里、钦察、乃蛮、乌古斯等部落的系谱;15世纪,伴随着哈萨克汗国的成立,当政者开始收集哈萨克族系谱并藏于汗宫,哈萨克族系谱也逐渐增多,如,巴里斯和伊本哈勒多尼搜集的《克普恰克系谱》和《历史》;18-19世纪,更多的哈萨克族系谱被以文字的形式记录下来。《新疆识略》 (清)中的《哈萨克世次表》是目前可见的最早的哈萨克族系谱,主要记录了哈萨克汗的世系。[1]19世纪,哈萨克学者乔汉·瓦里汉诺夫比较系统且全面地研究了国内外学者关于哈萨克族历史和系谱的相关著作以及流传于民间的哈萨克族系谱故事,并依此撰写了《哈萨克族系谱》一文。20世纪,越来越多的学者参与到哈萨克族系谱的搜集和整理工作中,出版了众多的哈萨克族系谱及相关研究著作,如,《突厥、吉尔吉斯、哈萨克及其诸汗王的系谱》(夏克里木·胡达拜尔迪著,1911年奥伦堡出版)一书,就对于哈萨克族系谱的研究具有重要的参考价值。新中国成立后,哈萨克族系谱的研究取得了长足的进步。1956年,由中国科学院民族研究所组建的新疆少数民族社会历史调查组历时近8年,通过细致全面地调查研究编写出版了《哈萨克族简史简志合编》。20世纪80年代,新疆哈萨克族系谱研究的学者队伍逐渐形成,大量的研究论文和著作被发表和出版。[2]值得注意的是,这一时期一些汉族学者逐渐加入到了哈萨克族历史的研究行列,研究成果主要有《乌孙研究》《哈萨克史稿》《哈萨克族文化史》等。1990年,《哈萨克系谱集》一书在新疆出版,其中,收录了哈萨克族民间流传的20余种哈萨克族系谱的手抄本及哈萨克族系谱著作。
进入21世纪,学者们对哈萨克族系谱的研究更加深化,并有了进一步拓展。① 历史性的源流考释。《哈萨克族流寓西藏考》《清代阿尔泰地区哈萨克源流述论》等文献将哈萨克族系谱放置在宏大的民族史视野之中,在一个发展着的历史网络中揭示哈萨克族的系谱问题。② 民族间的关系梳理。主要涉及了民族关系的两种表现方式:其一,在稳定状态进行,即哈萨克族在未经迁移的情况下与周边民族进行互动,如《乌孙与哈萨克族的源流关系》;其二,在动态状态进行,即哈萨克族在迁移的情况下与当地民族产生诸多互动,如《新疆哈萨克族东迁原因俯视》。③ 专门化的本族探析。专门化的哈萨克族系谱研究不仅是构成哈萨克族系谱研究的最主要的方面,还体现着当前研究的水平。21世纪的哈萨克族系谱的专门化研究,不仅考虑到了哈萨克族系谱内部的诸多问题,还考虑到了哈萨克族系谱研究本身的产生极其历史意义,体现了哈萨克族系谱研究的深入性。如,续西发对哈萨克族的族称、族源、系谱进行的分析;[3]刘明等对哈萨克族亲属关系状况的论述;[4]巴格拉对哈萨克族系谱搜集和整理工作的重要性进行阐述。[5]但是,有关哈萨克族系谱的数字化及相关研究还未开展。
2 哈萨克族系谱数字化平台构建的原则
哈萨克族系谱数字化平台建设的首要原则是遵照数据库的结构规范和数据的著录规则,要便于用户的检索和使用及工作人员的管理和维护。
2.1 规范化原则
哈萨克族系谱数字化平台建设的规范化涉及平台建设的各个环节,包括数据著录标准的规范化、数字化平台结构的规范化和数据库系统开发系统的规范化,这是为了保证机读内容检索和交换格式的统一,实现数据库的跨平台对接,构建统一的信息化检索平台,保证信息的规范化利用。[6]规范对于哈萨克族系谱数字化平台的正常运行和使用以及资源共享、跨平台检索的实现、元数据的利用至关重要。数据著录标准的规范化涉及字符集的规范、描述语言的规范、元数据的规范、对象数据的规范等各个方面,能够保证生成信息条目的一致性和准确性。[7]
2.2 易用性原则
建设哈萨克族系谱数字化平台的目的是将哈萨克族历史悠久的民族文化保存并传承,将丰富多样的文化资源通过互联网环境呈现出来,实现资源共享。因此,数字化平台的构建必须保证用户的易用性,平台界面要简单明了、容易操作,且具有完善的信息检索功能,使用户能够在最短的时间内获取所需要的资源。数字化信息平台不仅要包括每个数据库完备的检索功能,还应提供整个平台的多种检索途径,利用布尔逻辑运算符和位置运算符组配检索的方式,实现用户的二次检索,提高哈萨克族系谱资源的查全率和查准率。用户在获取信息的同时,平台能够对读者的需求进行自动分析,组织、开发并提供信息资源。[8]
2.3 可持续发展原则
为了保持哈萨克族系谱数字化平台的活力,平台的建设必须遵循可持续发展原则,其中,最重要的就是数据的可持续发展。哈萨克族是世世代代生活在丝绸之路沿线的跨国民族,哈萨克族系谱是世世代代哈萨克族人民保存下来的精神文化财富,经过不断的搜集、整理和挖掘,将有源源不断的系谱和历史文化资源被补充到哈萨克族系谱数字化平台中,使平台的资源不断得到丰富和完善。其次,哈萨克族系谱数字化平台的系统也要遵循可持续发展原则,随着技术的不断进步和资源的不断丰富,用户的需求水平将不断提高,这就要求平台进行技术的升级,从而保持数据的实时更新。
3 哈萨克族系谱数字化平台的内容构建
哈萨克族系谱数字化平台的建设应收集博物馆、图书馆、档案馆、研究所等公共机构所收藏的哈萨克族系谱条目,同时也应尽可能地收集和整理散落于民间的系谱、族谱。而且,工作人员要注意历史典籍及对哈萨克族民的采访,以对所收集的系谱资料进行更为准确地整理和分析,确定其族称、族源和系谱,包括哈萨克族的始祖、迁琼始祖及各部落、分支系的迁移情况等基本著录内容。哈萨克族系谱数字化平台中的数据库应设置先祖、始迁祖、世袭分支、迁移情况、书名、责任者、版本、载体形态、附注、内容提要、装订、收藏者、备注等多个字段,对哈萨克族系谱进行完整著录。[9]同时,应建立哈萨克族系谱的世袭图、各支系的动态分布图像及各氏族的迁移动态视频。数字化平台需向用户提供与哈萨克族系谱、历史、文化等相关的文献,并提供题名、责任者、编写年代、姓氏、名人、地区、始祖、部落名称等多种检索途径,使哈萨克族系谱这种特殊的文献通过数字化平台被更多人了解、开发、利用和研究。
4 哈萨克族系谱数字化平台建设
哈萨克族系谱数字化平台建设包括哈萨克族系谱的搜集整理、数字化和应用三个阶段。搜集整理阶段对分布于各处的哈萨克族系谱及相关文献进行搜集并整理;数字化阶段对搜集到的系谱、文献及其他资源进行加工、处理、转化,实现资源的数字化;应用阶段将数字化的资源上传到系统平台中,实现哈萨克族系谱资源的平台搜索和使用及后台维护。
4.1 搜集整理阶段
这一阶段主要是对哈萨克族系谱及相关历史、文化资源进行搜集整理,这些系谱资源是哈萨克族系谱数字化平台中呈现给用户的主要内容。对哈萨克族系谱资源分析并进行分类采集和整理是哈萨克族系谱数字化平台建设的一项重要工作。哈萨克族系谱资源主要可以分为以下3类:① 来自博物馆、档案馆、图书馆等政府文化部门的系谱资源;② 来自研究所、高校等学术机构的系谱资源;③ 民间收藏和民间流传的系谱资源。在哈萨克族系谱资源收集的过程中,需有明确的分工、确定各部门的搜集范围、搜集的目标、搜集的内容,确保搜集到完整、统一、真实、连续、权威的哈萨克族系谱及相关历史和文化资源。
4.2 数字化阶段
这一阶段涉及系谱资源的数字化格式转换、系谱资源的处理、系谱资源的组织等几个方面,可同步开展工作。
(1)系谱资源的数字化格式转换。这部分工作的内容主要是将纸质图书、期刊、图片等传统载体上的各类系谱资源通过扫描、照相、录音录像等方法转化为数字资源。根据纸质文献的特点,将扫描仪的输出格式设置为能够灵活应用的TIFF格式,色彩模式选择灰度模式或彩色模式,精度为300dpi,无压缩扫描;[10]数码相机的输出格式要选择JPG格式,照片的清晰度和质量要符合平台数据库要求。图书、期刊的扫描宜以页为单位,每页输出一张图片。在音频、视频的传输过程中,必须选择合适的技术参数,尽可能地呈现音频、视频的原貌,防止信息失真。
(2)系谱资源的处理。哈萨克族数字化系谱资源的处理是指对数字化加工获取的图像、音频、视频等进行适当地加工处理。首先,要与纸质文献对比,检查获取的数字图像是否漏页、重复、缺失,如有则进行修正;其次,要校对和修正数字图像的清晰度、完整性和准确性。对于数码相机拍摄的图片可用Adobe Photo shop CS5、I See等图片处理软件进行剪裁、降噪、锐化等处理;对于扫描的纸质文献,可利用光学字符识别(OCR)技术处理图片中的文字,利用矢量化技术将光栅图像转化为矢量图形。为了确保哈萨克族系谱文献内容与特征的真实呈现,对于系谱文献中采用多页记录图谱或家谱地图的情况,要采用Adobe Photo shop CS5进行拼接,将哈萨克族系谱相关内容真实、直观、完整地呈现给用户。为了保护数字化系谱资源的知识产权,可以采取添加水印的方式对图像进行处理。
(3)系谱资源的组织。系谱资源的组织是根据数字化的图像、文本、音频、视频等系谱资源进行目录编纂,建设系谱资源的目录和索引,实现数字化系谱资源的有序表达。在信息著录的过程中,必须严格遵守平台建设的规范化原则选择元数据标准和著录规则,确保平台易于检查和维护。
4.3 应用阶段
用户登陆到哈萨克族系谱数字化平台,通过在检索框输入检索词查找相关的资源,并可进行“二次检索”。同时用户也可以通过平台的“高级检索”功能,根据系谱数字化平台中各种资源的题名、责任者、出版年等字段更加精确地查找信息。哈萨克族数字化资源通过系统上传到数字化平台上,在互联网环境实现资源的信息共享,为用户提供在线服务。面向用户的在线服务可以提供免费和付费两种形式。如,一些特色、珍贵的数字化系谱资源可以免费向用户提供在线检索和浏览,但用户如果需要获取原始资料或高分辨率数字影像则需要向平台付费。哈萨克族系谱数字化平台的维护需制定标准的制度规范,由专业技术人员负责,加强资金投入和维护人员的技能培训,以确保系谱资源及其目录信息的长期保存、实时增删和更新,使数字化平台更加有序地运转。
5 结语
哈萨克族系谱体现了哈萨克族的各个氏族、部落的发展过程。一些真实的故事反映了哈萨克族和周围其他民族之间的和睦相处及政治、经济、文化交流,有利于促进各民族团结。哈萨克族系谱数字化是家谱再生性保护的有效措施,避免了自然损耗和人为损坏,同时能够提高哈萨克族系谱与相关资源的利用率。哈萨克族系谱数字化平台建设有利于保护和弘扬哈萨克族系谱的文化遗产,强化民族记忆,增进哈萨克族人民的文化认同,促进我国与相邻国家的哈萨克族人民和政府部门的交流,为我国“一带一路”建设重大战略的顺利实施作出贡献。
[参考文献]
[1]刘飞.哈萨克族系谱研究概况[J].民族论坛,2016(8):62-65.
[2]贾合甫·米尔扎汗,哈米提.哈萨克族系谱搜集和历史研究概述[J].新疆社会科学,1989(6):107-113.
[3]续西发.哈萨克族的族称、族源和系谱[J].伊犁师范学院学报,2005(1):13-15,16.
[4]刘明,古丽皮娅·木合塔尔.哈萨克族亲属关系溯源[J].伊犁师范学院学报(社会科学版),2012(2):25-28.
[5]巴格拉.论哈萨克族系谱的产生及其历史价值[J].黑龙江史志,2013(4):67-69,72.
[6]杨晶石,陈衍峰.长白山非物质文化遗产数字化信息平台构建研究[J].通化师范学院学报,2016,37(4):130-133.
[7]林碧英.浅论公共图书馆运用信息技术收集和整理家谱文献[J].现代情报,2007(9):122-124.
[8]谢琳惠.家谱文献资源数字化开发与利用[J].河南图书馆学刊,2012(6):125-128.
[9]王芹.海南家谱数据库建设的思考[J].图书馆学刊,2009,31(3):26-27.
[10]郭广堃.辽宁省图书馆家谱数字化建设概述[J].图书馆学刊,2010,32 (9):55-57.