金石文献数字化资源述论*
2013-08-29毛建军
毛建军
(河南新乡学院,河南新乡453003)
在中国古典文献学史上,“金石”常常并称,成为一个名词。金指青铜器,石指石刻,因此,以金、石为载体的文献便统称为金石文献。金石文献包括金文文献和石刻文献两大部分。[1]金石兼具文献性、文物性、收藏性于一身,是研究中国古代历史文化不可多得的珍贵史料。对金石文献数据库资源做调查分析,既有利于促进金石文献数字资源的整合,又有利于社会各界充分利用和挖掘金石文献信息。
1 日本金石文献数字化资源
日本收藏有大量的中文古籍。随着古籍数字化进程的开展,日本各大图书馆和科研机构也开始将金石文献数字化,其中在金石文献数据库的开发与建设方面,日本京都大学人文科学研究所和京都大学人文科学研究所最具成就。
京都大学人文科学研究所所藏石刻拓本资料[2]由京都大学人文科学研究所研制并管理。日本京都大学人文科学研究所藏有珍贵中国典籍,其中尤以甲骨文、金石、汉籍拓本的典藏最为突出。自2001年,京都大学人文科学研究所开始“日本所藏中文古籍数据库”(包含石刻拓本资料)建设,计划分两个五年阶段实施。目前数据库已基本建成,数据库可提供35个典藏机构约62万条记录的网络检索和阅读。[3]其中金石文献数据库收录中国石刻拓片1万余条,涵盖时间为西汉到隋朝。数据皆提供选单点选,每笔数据呈现黑白影像并附基本说明。京都大学人文科学研究所另建有“画像石与石刻拓本”网站,画像石资源涵盖中国山东、河南、山西、陜西、四川、江苏等地,石刻拓本检索范围为西汉至隋朝。可提供浏览检索、文字检索和全文影像阅读。
明治大学“唐·五代十国时期墓志、墓碑检索”[4]也很有价值。“唐·五代十国时期墓志、墓碑检索”由明治大学中国石刻文物研究会建置,系统包括《唐代墓志所在总合目录》、《中国五代十国时期墓志、墓碑综合目录稿》以及《西安碑林全集》所载唐代墓志目录。目前,虽不能阅读影像,但中国石刻文物研究会已经计划将不断扩充全文数据库。
2 港台地区金石文献数字化资源
目前,港台地区金石文献全文数据库已开发出许多资源,其开发建设单位主要为港台地区的研究机构和部分数字公司。其中以香港中文大学中国文化研究所古文献数据库中心开发制作的汉达古籍数据库检索系统——金文数据库和台湾中研院历史语言研究所开发制作的殷周金文暨青铜器数据库最具特色。
汉达古籍数据库检索系统——金文数据库[5]由香港中文大学中国文化研究所古文献数据库中心开发制作。系统包括甲骨文数据库、竹简帛书数据库、金文数据库、先秦两汉文献数据库、魏晋南北朝文献数据库以及类书数据库等。汉达金文数据库数据主要来源于中国社会科学院考古所编《殷周金文集成释文》,总计收录12,021件铜器,约1万8千张拓本(包括摹本),约近100万字器物数据说明,另有14万字隶定释文。数据库具有金文铭文和释文对照检索,以及词串统计等功能。该数据库界面清晰,操作简单,很受学界欢迎。不过,由于数据库不断扩充和升级,该网站时常不能登陆,甚为遗憾。
殷周金文暨青铜器数据库[6]由台湾“中央研究院”历史语言研究所开发制作。数据库为“中央研究院”史语所金文工作室建置,并与该院地理信息科学研究专题中心、计算中心共同合作完成,是目前大型金石文献数据库之一。2009年5月数据库已免费开放学界,使用者只需注册,便可申请使用。该数据库可以通过器号、器名、铜器时代等多重字段进行复合检索,查询结果包含铜器数据与铭文数据,并有数字影像可供浏览。殷周金文暨青铜器数据库界面以历史地貌图为背景,直观地展示出青铜器出土的具体地点及其地貌情况,为学者进行金石文献研究提供了极大便利。
金石拓片数据库[7]由台湾“国家图书馆”建置。金石拓片数据库为台湾“国家图书馆”馆藏金石拓片数字化成果网站。台湾“国家图书馆”现藏金石拓片6,462件,12,462幅。金文部分,以钟鼎彝器为大宗,旁及度量衡器、兵器、镜鉴等,时代起自殷商以迄汉世。石刻部分以碑志为多,两汉刻石文字,有篆有隶,碑碣、摩崖、题记、残石。另有唐人碑志超过千种。数据库可选择题名、类型、版本、序跋等多项字段查询,每笔详目结果有书号、主要题名、版本等近20项。[8]不过,由于该馆限制局域网使用浏览数字化影像功能,给读者造成很大不便。
其它港台地区金石文献全文数据库见下表:
名称 建设单位 简要说明简帛金石数据库 台湾“中央研究院”历史语言研究所收录简帛金石研究资料共3,401,684字。系统支持布尔运算、多项目查询、词组查询、排除字符及自然语言查询。先秦金文简牍词汇数据库台湾中央研究院历史语言研究所分为金文和简牍两个子数据库。金文词汇数据库包括:词汇库查询、词汇库索引以及词汇库管理。词汇库查询可以自行输入关键词或以《殷周金文集成》青铜器器号进行检索。青铜器拓片数据库台湾中央研究院历史语言研究所傅斯年图书馆收录傅图馆藏共计1万余件青铜器拓片图像及资料。关键词查询。查询结果依序呈现缩图、登录号、器号、器名、原器时代、原拓书名、铭文释文等信息资料。汉代石刻画像数据库台湾中央研究院历史语言研究所傅斯年图书馆收录傅图馆藏汉代石刻画象拓本图像约1,500余件。提供功能、地名及主题简易查询。提供影像比对查询功能,并可作放大、缩小、平移、旋转等操作。辽金元拓片数据库台湾中央研究院历史语言研究所傅斯年图书馆收录傅图馆藏辽金元拓片约2000幅图像资料。提供登录号、品名、作者、语种、年代、主题、释文、题跋、印记、着录、刻立地点检索途径。故宫所藏西周金文 台湾故宫博物院 普及型展览类数据库,栏目包括文字的故事、存续与应用、铭文话西周、金文逍遥游。关键词检索。
3 大陆地区金石文献数字化资源
中国大陆地区参与金石文献数据库开发建设的单位主要为公共图书馆、科研机构以及数字化出版企业。公共图书馆金石文献数据库的建设以中国国家图书馆开发制作的“碑帖菁华”石刻拓片资源库为代表。科研机构金石文献数据库的建设以华东师范大学中国文字研究与应用中心开发研制的“商周金文检索系统”最有特色。企业研制的以《中国历代石刻史料汇编》全文检索数据库影响力最大。
“碑帖菁华”石刻拓片资源库[9]由中国国家图书馆开发制作,为该馆所藏石刻拓片数字化后建成的公益型数据库。中国国家图书馆收藏的石刻拓片计30,000多种、23万余件。“碑帖菁华”石刻拓片资源库即扫描拓片原件而制成,目前已完成29,000余幅拓片,影像30,000余幅。资源库的著录包括拓片题名、其他题名、责任者、年代、地点、拓片原物状况、附刻、拓片版本、拓片特征、数目与尺寸、题跋印记、文种、拓片内含书目索引、关联关系、馆藏信息、图片信息等项。资源库内容以刻立石年月排序,可以提供单一字段的简单检索、多条件限定组合的高级检索和元数据内容关联检索等查询方式。“碑帖菁华”收录的中国古代石刻拓片虽然占到了总品种的三分之二,其它石刻拓片则分藏在全国各地图书馆,而且很多图书馆所藏的石刻拓片都没有整理编目。中文拓片项目设立之初就因为“编目整理基础较差,合作建库难度很大”。[10]因此,虽然基础较好的国家图书馆与北京大学图书馆密切配合,双方自建的资源库在客观上形成了互补,但能够检索全国各主要图书馆石刻拓片的“中文石刻拓片资源库”还只是处在理想阶段。
华东师范大学中国文字研究与应用中心研制的“商周金文检索系统”[11]最具学术价值和探索意义。为顺应中国文字数字化发展趋势,华东师范大学中国文字研究与应用中心构筑了规模庞大的中国古文字数字资源,主要包括商周金文检索、战国楚文字检索、花园庄东地甲骨检索、《金文文献集成》电子检索等数据库系统。“商周金文检索系统”包含金文字库和金文数据库两部分。金文字库收字完整,对应迄今已发表的青铜器铭文,包括楷体字6,194个、金文原形字14,249个和金文偏旁539个。“金文数据库”收录了迄今已发表的青铜器铭文13,320篇,总字数124,800字,可以按器名、时代、国别、字数、出土,流传、现藏等多种路径进行检索,也可以实现铭文字、词、语段的全文检索。需要指出的是,使用该系统时,需安装该中心研发的金文字库软件,用户颇觉繁琐。另外,此字库搜索类别按“字头”,较为单一,若可以按词搜索似乎更好。
《中国历代石刻史料汇编》全文检索数据库是目前使用面最宽,影响力最大的金石数据库。数据库由北京书同文数字化技术有限公司开发研制,分单机版和网络版两种。数据库可进行全文和分类检索,并提供有字典、年代换算工具软件。《中国历代石刻史料汇编》全文检索版虽然给研究者提供了极大的学术研究价值和检索便利,但仍然存在很多可以改善的空间,如数据库不能直接提供朝代、书名及著者检索,给初学者带来很大不便;书目秩序无标准规律,刊刻于不同时代的石刻零散放在不同位置,夹杂相间、紊乱不整;系统检索结果的碑文名后有年代显示,但是如读者按年代检索,系统得出的结果并不准确,而且命中不高;系统无法全屏显示及放大,给视力不是很好的读者带来阻碍。
陕西省考古研究所和西安大东国际数据有限公司共同合作开发的《金文字库及金文资料全文检索系统》也很有特色。《金文字库及金文资料全文检索系统》是全国文物、博物馆、系统人文社会科学重点研究课题。该系统金文资料收录自宋代以来传世和出土的高周时期青铜器上的金文资料约12,000件,包括:青铜器影像11,000幅,相关的简介文字约120万字;铭文拓文12000幅,释文180万字。令人遗憾的是,《金文字库及金文资料全文检索系统》软件迄今未见正式出版或网络授权使用。
北京爱如生数字化技术研究中心研发的《中国金石库》收录上古至民国初年历代金石文献,其中金石拓片10万件,金石志书1千种。每种(件)各据善本(原件)详加订释,制成数字全文,附以高度清晰的原版影像和可以360度旋转观察的原件影像。总计全文超过3亿字,影像超过100万页,数据总量约100G,同时配备强大的检索系统和完备的功能平台。可从分类检索、条目检索、全文检索、高级检索4条路径进行检索,可运用图文对照、标点批注、分类收集、下载保存、原文打印等10个辅助功能。
其它大陆地区金石文献全文数据库见下表:
名称 建设单位 简要说明金石拓片特藏 北京大学图书馆该馆藏有中国历代金石拓片计2万余种,目前已精选出其中100件,年代从商代到民国,扫描制成影像文件。使用者可检索拓片的题名、年代、出土地点以及全文内容,也可以直接点选各项拓本,观赏拓片之影像。北京记忆——《燕都金石》 首都图书馆“北京记忆”是以近百年馆藏为依托的北京历史文化资源性网站。栏目包括《北京文汇》、《旧京图典》、《燕都金石》、《京城舆图》等。以金石拓片为主的《燕都金石》收录大量北京地区摩崖题字和刻石图像数据。中国汉代画像石砖数据库徐州师范大学图书馆中国汉代画像石砖数据库分别建立了图像资料数据库、期刊论文资料库、图书著作数据库、汉文化资料索引库等子库。图像资料数据库收录中国汉代画像石砖的图像资料,并附简要说明。国学精品图库书法篇北京国学时代文化传播有限公司收录青铜器铭文174幅、碑刻石雕43幅及壁画、书影等18种艺术代表作品千余幅,图片清晰。可全文检索,复制、打印,并附有联机字典、历代帝王纪年表等多种工具。出土文献库 北京时代瀚堂科技公司数据库含甲骨文、金文、简帛、印章、钱币和石刻等分库。金文分库以《殷周金文集成引得释文》为基础建置,涵盖所有青铜器铭文数据,图文对照。
4 结论与思考
金石文献数字化是对已存文献的再现和加工,是21世纪金石文献整理和研究的发展方向。尽管金石文献全文数据库的建设已经取得了相当大的成绩,但还存在一些值得思考的问题。一是资源重复建设问题。由于目前还没有一个统一的组织和机构去管理和协调金石文献数据库的建设,国内外重复开发和建设了大量金石文献数字化资源。这种重复开发不仅造成资金的浪费,而且也增加了读者利用上的困难。二是数据库兼容问题。金石文献全文数据库的建设至今还没有一个统一的数据库着录和运行系统标准。三是资源共享问题。金石文献全文数据库的利用在资源共享上还存在资源封闭和利益保护的弊端,给读者带来了诸多不便。需要指出的是,目前金石文献全文数据库的建设最迫切的任务是做好资源整合工作。
〔1〕 赵子夫,高月起.金石文献小考[J].河南图书馆学刊,2007(2):129-131
〔2〕 京都大学人文科学研究所所藏石刻拓本资料.[EB/OL].http://kanji.zinbun.kyoto-u.ac.jp/db-machine/imgsrv/takuhon/.[2013-01-29]
〔3〕 毛建军.日本中文古籍数字资源的建设[J].图书馆建设,2009(3):33-35
〔4〕 明治大学“唐·五代十国时期墓志、墓碑检索”.[EB/OL].http://www.meiji.ac.jp/sha_ken/.[2013-01-29]
〔5〕 汉达古籍数据库检索系统—金文数据库.[EB/OL].http://www.chant.org/info/default_jinwen.asp.[2013-01-29]
〔6〕 历史语言研究所殷周金文暨青铜器数据库.[EB/OL].http://db1.sinica.edu.tw/~ textdb/rubbing/query.php4.[2013-01-29]
〔7〕 台湾“国家图书馆”金石拓片数据库.[EB/OL].http://rarebook.ncl.edu.tw/gold/.[2013-01-29]
〔8〕 汉学研究中心编.国际汉学研究数字资源选介[M].台北:汉学研究中心出版社,2010:87
〔9〕 中国国家图书馆“碑帖菁华”.[EB/OL].http://mylib.nlc.gov.cn/web/guest/beitiejinghua.[2013-01-29]
〔10〕 张志清,冀亚平.中文石刻拓片资源库建设[J].新世纪图书馆,2005(1):14-17
〔11〕 华东师范大学中国文字研究与应用中心“商周金文检索系统”.[EB/OL].http://www.wenzi.cn/pages/jwyd.asp.[2013-01-29]