APP下载

关于专业化、小型化数据库建设的思考
——以柳宗元数据库建设为例

2017-03-24胡娟肖献军

参花(下) 2017年6期
关键词:柳宗元开发者专业化

◎胡娟 肖献军

关于专业化、小型化数据库建设的思考
——以柳宗元数据库建设为例

◎胡娟 肖献军

随着学者研究的不断深入,大型化数据库越来越满足不了研究者的需要,专业化数据库的建设迫在眉睫。学者要积极参与到专业化数据库建设中来,在专业化数据库建设中起关键性作用;数据库技术开发者要努力设计出智能化更高的数据库,国家、地方也应在专业化数据库的建设上给予更多的政策层面和经济层面上的支持。

专业化 数据库 柳宗元 思考

近年来,各类大型化古典文献数据库越来越多,如《中国基本古籍库》《国学宝典》《汉籍全文检索系统》《中国方志》等,港澳台及国外也有不少,如《瀚典全文检索系统》(台湾)《汉达古籍资料库》(香港)《全国汉籍——日本所藏中文古籍数据库》(日本)等。古典文献的数据化极大提高了研究者的效率,也使得研究结果更准确化、科学化。

然而,随着数据库资料的越来越庞大,学者在享受其提供的方便时,也带来了不少烦恼。主要是学者对相关资料的分析与辨伪越来越困难,在一些特大型的数据库中,输入某个人名或者书名,显示的可能是几千条甚至几万条检索信息。面对如此多的检索信息,对于那些文献基础较弱的学者而言,有这些文献资料还不如没有这些文献资料得好。确实,成千上万条的文献资料,究竟有多少条能为学者利用,有多少条价值确实比较高,真的很难分辨出来。于是学者陷入了浩瀚的文献资料中而难以解脱出来,原本可以提高研究效率的数据库反而影响了学者的研究效率,这一点可能是那些大型数据库开发者始料未及的。要摆脱这种困扰,数据库建设者需要改变传统观念,一方面要继续开发一些大型的数据库,另一方面需要开发一些专业化较强的小型数据库。后一类型的数据库,对于学者的研究无疑更具有现实价值和实际意义。

但专业化数据库的建设不是件容易的事。与大型数据库相比,这种类型数据库的建设者不仅仅只是技术的掌握者,还必须是某领域、某方向上的专家。然而,二者兼有的人才少之又少。这就需要有协作和分工。“人类如何适应并利用其独特的思维方式,将人的创造性思维与计算机的强大功能有机结合起来,把古典文献研究提升到一个更高境界,是广大文学研究者和IT业者共同面对的挑战。”[1]一方面,需要相关技术公司提供新的技术,另一方面,需要相关高校、研究所投入一定的人力、物力、财力,搜集整理建库所需要的资料。这样就把先进的技术和专业的知识结合起来,就能建设出高水平、高效率的专业化数据库。

如要建设一个与柳宗元相关的数据库,虽然大型数据库中会有一些相关的柳宗元的资料,但相对起来比较零碎,而且还不全面。如果把搜集资料的任务交给某些学者,建立起来的数据库可能会完全不同。就以我所在的湖南科技学院而言,我校翟满桂教授就是柳宗元研究方面的专家,在柳宗元方面先后立项了一个国家课题、一个教育部课题、一个省级重点课题。她指出,就版本而言,宋代刊刻柳集有九个不同版本,明代有三种,清代有三种,现当代则多达十多种;柳宗元年谱今存十二种。这些资料的掌握和搜集,不是那些大型数据库的建设者所能做到的,只有专家学者才能做到。如果再联合尹占华、尚永亮等人的研究成果,建立起来的数据库一定是资料最全面、最具权威性而又最专业的柳宗元数据库了。

专家学者除了可以在资料的搜集上起重大作用外,还能够对资料进行整理和归类。今天一些大型的古典文献数据库,资料的分类大多是依据四部进行的,有些数据库虽然在分类上有所改变,但实际上只是细节上的改变。如果建立专业化、小型化的数据库,四部的分类无疑适应不了研究的需要。柳宗元资料搜集起来后,怎样对这些数据进行分类,也不是数据库技术开发者所能解决的。资料的分类必须以怎样方便研究者研究为目的。如要建设柳宗元数据库,再按经史子集的标准去分类,就完全不符合实际了。如果从学者使用方便与否的角度去分类,去请教柳宗元研究方面的专家,就会发现柳宗元数据库可以按以下五个板块进行分类。

1.版本模块。将收录不同时期各种版本的柳宗元文集,同时采用影像和数字化技术加以保存。

2.史料笔记模块。主要收录与柳宗元的生平、交游和创作情况相关的史料笔记。

3.地理方志模块。主要收录与柳宗元相关的地理、方志资料及通过田野调查获得的数据(图片)。

4.诗文评类模块。主要收录历代学人对柳宗元及其作品的评价。

5.海外文献模块。主要收录日本、韩国等保存的与柳宗元相关的文献资料及学者的研究成果。

如这样分类,将比四部分类更准确,更方便学者研究。

专业化数据库的建设,不仅要在资料整理上多下功夫,要把资料搜集整理完整,而且要体现当代学者的最新研究成果。学者做学术研究,文献资料整理相当重要,这是基础性工作,同时,还要对该专业的学术史有所了解。如果不对学术史有所了解,不了解当下研究动态,只是埋着头做学问,说不定等研究成果出来时,才发现自己花了大量时间所做的研究,别人早就已经研究过了,而且研究的结论还比较权威,这种情况相信不少学者遇到过。因此,数据库的建设,要尽量体现现当代学者研究的成果。可以在上述模块的基础上,增设学者研究模块,主要收录国内外现当代学者的代表性研究成果。这一模块的搜集虽然数量比较大,但文字的录入不再是难题,有不少学者的研究成果已经数字化了。但也有新的问题出现,这就是成果的版权问题。我们在收录这部分研究成果时,一定要处理好与作者、出版社及相关网站之间的版权关系,要尊重作者的创作成果。在没有征得个人或者单位的同意时,不要贸然使用别人的劳动成果。但为了资料的全面性,可以采用存目的方法处理上述问题。当使用者手中有了完整的文献资料,同时又掌握了当今学术界在该领域的研究动态后,他们不仅可以大大提高研究效率,同时也可以在有限的时间里,少做重复工作,多做一些开创性工作。

以上都是强调专家在数据库建设中的作用,但这并不意味着数据库的技术开发者就不重要了。事实上,专家们虽然掌握了一定数量的资料,但这些资料利用效率是高还是低,还得依靠技术。当前,随着现代电子技术越来越发达,数据库的作用不仅仅有联合检索功能,而且越来越趋向于智能化了。如北大李铎教授主持的《全唐诗电子检索系统》,就能对《全唐诗》的用韵进行分析,可以分析出在《全唐诗》中哪些属于古体诗,哪些属于近体诗。这一项工作,如果用人工去统计,则不知要花费多少时间,统计结果还不一定准确。深圳大学开发的《红楼梦全文数据库》则更是专业化了,该系统分为若干个专题,直接可以检索出相关资料,为红学研究者提供了极大的方便。还有的数据库系统能根据诗文中出现的词语的频率,分析出作家作品的情感特质。“凭借电子文献的便利而做穷尽式研究,也是过去所不敢想的。”[2]另外,也可以对一些成熟的技术升级换代,如数据库中的联机字典。这一技术目前已相当成熟,但由于缺乏研究人员的指导,技术开发者大多只是选择极为普通的字典作为联机字典。对于普通的读者而言,这样的字典也许能够满足阅读的需要,但对于研究者而言,并无多大益处。如果技术开发者征求了学术研究者的意见,联机功能将对学术研究起巨大的推动作用。我们试想,如果技术开发者在程序中植入《说文解字》《尔雅》《释名》《方言》《康熙字典》等,对于那些给作品作校释、校注的人而言,是否带来极大的方便呢?可见,专业化数据库的建设,离不开技术的研发者和学术研究者共同的努力。

专业化、小型化的数据库所带来研究的方便性,不是那些大型化数据库所能达到的。专业化数据库的建设减少了学者查找文献的麻烦,不必为了某个版本奔波于各大图书馆之间,不必为了解该领域的学术史而钻入到浩瀚的文献之中,同时,还可以通过智能化的分析手段得出准确而科学的结论。如建设柳宗元数据库,不仅能满足于柳宗元资料检索的功能,还要对柳宗元相关资料,特别是《柳宗元集》中的文本进行智能化分析,分析其文本的分类、文本的内容,文本的特质等。研究者可以借助这些智能化手段分析出来的结果,进行更深入研究,也可以用这些分析出来的结果判断自己研究得出的结论是否具有科学性。

但专业化数据库建设遇到了颈瓶,与大型数据库,特别是那些普及型数据库相比,专业化数据库的建设投入的人力、物力虽然少一些,但也存在相当大的难度。比如资料的搜集难度就很大,不少资料还需要去国外搜集,而且这些资料数据化过程中,包括文字的录入,都不是普通人员能够完成的。如果遇到国外文献,数据库建设的难度可能会进一步增加。投入如此多的人力和物力建立起来的数据库,在使用率上远不如大型数据库高,也许只有同行业、同研究方向的人才会使用。使用的人越少,带来的经济效益也就越少,这势必会导致使用者承担的费用更高。这样会形成一个恶性循环,当使用者承担的费用越来越高时,将会进一步限制使用者的数量,这也就是近年来专业化数据库建设与大型数据库建设相比严重滞后的根本性原因。

但这并不意味着开发专业化数据库作用不大,实际上还是很有价值的。一旦专业化数据库建立起来,它不仅会提高学者的研究效率,还会提升研究的准确性。而且它影响的不只是一批学者,而是一代学者,甚至数代学者。它会促进某个专业、某个方向的研究发生根本性变革。但专业化数据库面临的困境是现实存在的,这是专业化数据库技术的开发者和资料的整理者所面临的问题,这个问题也不是学者、数据库技术开发者所能够解决的。要想解决这一问题,首先国家要从政策性层面加以引导,要给予这些专业化数据库建设更多资助,更多立项。二是加强与地方政府合作,特别是文化类的数据库,大多和地方文化结合紧密,地方政府对此类数据库建设要多从经费层面进行支持。

只有把数据库技术的开发者、学者和相关政府部门联合起来,专业化数据库才有可能建立起来,数据库建设也才有可能更加专业化。

[1]郑永晓.古籍数字化与古典文学研究的未来[J].文学遗产,2005(05).

[2]李铎,王毅.关于古代文献信息化工程与古典文学研究之间互动关系的对话[J].文学遗产,2005(01).

(责任编辑 刘冬杨)

本文系国家社科基金“历代柳宗元研究文献整理及数据库建设”(课题编号:16BZW034)的阶段性成果。

胡娟,女,湖南科技学院图书馆,馆员,研究方向:图书管理与现代技术;肖献军,男,博士,湖南科技学院人文与社会科学学院,副教授,研究方向:地域文学)

猜你喜欢

柳宗元开发者专业化
柳宗元
对幼儿园听评课专业化的思考
江雪
建设高素质专业化干部队伍
“85后”高学历男性成为APP开发新生主力军
16%游戏开发者看好VR
引导青年教师走专业化成长之路
论专业化老年媒体的发展之道
栝楼产业开发者谢献忠
淫羊藿治好柳宗元的腿