APP下载

浅议中医古籍数字化

2013-01-24陈素美

中国中医基础医学杂志 2013年9期
关键词:知识库古籍检索

陈素美

(河南中医学院图书馆,郑州 450008)

古籍数字化最早始于20世纪70~80年代。我国中医药院校图书馆对古籍文献的研究开发,不论是基础保护和数字化加工,还是深层次研究和开发利用方面,都还有大量的工作要做。

1 中医古籍数字化现状

中医古籍是我国浩如烟海古籍中重要的组成部分,更是中医理论知识的来源,是中医传承发展的基础。中医古籍以图文形式记录了中医学数千年来积累的理论知识和临床经验,不仅具有珍贵的史学价值,而且具有重要的实用价值[1]。中医古籍数字化是借助现代化的技术与手段,充分保护、研究、揭示与利用这些中华民族丰富的、不可再生的医学资源,使古老传统的中医学焕发出新的活力,在中医学的继承与创新、中医药现代化、中医走向世界等方面发挥重要作用[2]。

2 中医古籍数字化的必要性

数字化是保护和利用古籍的手段之一。在保存条件欠佳、自然损耗无法避免的情况下,古籍数字化能最大程度地减少借阅造成的古籍损坏。信息网络的发展为数字化信息的快速准确传播提供了基础条件,因此高质量的数字化中医古籍资源更能适应读者快速、准确的信息需求。中医古籍数字化是中医古籍数据库建设的第一步,也是建立中医知识库的基础条件。

2.1 保护中医古籍的需要

古籍存放需要良好的环境。当前各个图书馆的保存条件不一,在这种情况下减少人为翻阅对古籍造成的损伤就显得尤为重要。而对于已经破损的孤本、善本,利用数字化尽快保存其原貌是刻不容缓的任务。建设中医古籍数字化资源,引导读者利用数据库来搜索中医古籍,通过扩大数字化古籍的数量满足师生的利用需求,从而达到避免人为利用对古籍造成损伤以及加速古籍老化的目的。

2.2 更广泛传播中医文化和信息的需要

中医药古籍是中华民族几千年来防病治病宝贵经验的结晶,是中华民族优秀文化遗产的重要组成部分,不仅传承了中医药学理论知识,而且大量的经验方直接指导临床,中医药古籍文献中所收载的理法方药、养生保健知识取之不尽、用之不竭,具有极高的实用价值。而中医药古籍的数字化资源建设,为医者提供了知识服务和临床需求,更广泛地传播了中医文化和信息。

2.3 建立中医知识库的基础需要

作为大规模信息集成的数据库,随着存储量的增加必须改进信息组织方式,以满足读者不断增加的需求。此时单纯的数字化信息已经难以满足人们对知识的需求,只有对知识库进行数据挖掘和知识挖掘,发现信息间深层次的联系和新知识,促进中医理论和中医实践的发展,而中医古籍数字化将是中医知识库建设的先决条件和基础。

3 面临的问题

3.1 规范古籍数字化元数据标准[3]

元数据是建设规范性古籍数字化的基础,是共享数据的必要接口。古籍数字化应用范围有限,规模相对固定,因此古籍数字化的元数据标准一旦确立,基本变动不大。在制定规范的古籍数字化元数据标准时,要考虑古籍的特殊性,尽可能包含尽可能完整的信息。一是版本信息。有版本类型、年代、版式特征等;二是收藏信息。该文献所属收藏单位;三是作者信息。作者姓名(包括字、号)、朝代、生卒年、籍贯、著作等;四是作品信息。所属四部分类、所属类别等;五是古籍定级信息。所属朝代、所定级别等。

应用统一、规范的元数据标准,才能使数字化的数据库、知识库在以后的使用过程中更好地检索和知识传递,降低不同标准造成的信息孤岛现象,提高数字化信息的利用率,最大限度地发挥数字化古籍的使用价值。

3.2 统一古籍数字资源的文件格式

目前参与古籍数字化的机构或公司众多,但这些机构或公司采用众多的文件格式,如文本(txt)、超文本(html)、便携式文档(pdf)、电子书(CEB)以及超星图书(PDG)等。在使用不同公司的数字资源时就要求用户使用各种对应的软件,造成使用不便,大大降低了数字资源的通用度和使用率,为以后数据共享设下重重障碍。

统一古籍数字资源的文件格式,开发通用程度更高的软件,不仅方便使用者,也为参与古籍数字化的诸多机构节省时间,为建立通用度更高的数据库打下基础。

3.3 严格选择数字化对象

在借阅古籍过程中若用耗时甚久的传统信息组织和检索方式,那么将乏人问津,无法充分发挥其价值。利用数字化技术对其进行二次开发保护,一方面为使众多版本、品质精良的古籍原貌能保存下去;另一方面为建设古籍数字资源库,利用计算机强大的运算能力,提高古籍数字化资源的检索速度和精度。在数据库的建设过程中,数字化对象的选择是基础,其选取标准如下。

数字化对象选取应着重古籍的学术、文献价值,要有中医文献专家把关。如品种上应优先选择年代久远者、中医学经典名著、各中医流派代表著作或各类中医古籍基本文献;次选具有广泛应用价值,载有独特诊治疾病和养生保健经验,对中医学理论研究和临床诊疗具有指导意义的基本古籍。版本尽量选择珍本、善本古籍,首选年代久远者;版本形式按稿本、刻本、抄本、影印本、石印本顺序选择;同一种古籍版本较多者,一般只选完本,按精校本、祖本、通行本顺序选择;孤本或刻印较少、流传不多的稀见版本选择要求适当放宽[4]。

在古籍流传过程中,同一种古籍往往会出现众多版本,其质量难免参差不齐。在选择数字化对象时,在版本选择的基础上,还要尤其注意内容是否准确,表述是否清晰。要结合文献专家和医学专家的意见,选择公认的高质量本子进行数字化,避免重复工作。

3.4 建立精准的古籍检索系统

只有完善的古籍检索系统才能为古籍数据库的使用提供良好的平台,使读者乐于和便于检索所需信息。(1)较高的检全率和检准率。检索系统的检准率和检全率是保证检索质量的重要指标。中医古籍中各种药名的不同称谓,以及通假字、异体字、避讳字的使用,使得提高中医古籍数字资源的检索检准率和检全率面对重重困难;(2)较快的检索速度。快的检索响应速度是留住读者的关键;(3)符合中医学科特点。要设置针对中医学科的专有名词、著者信息等特有的关键词。

3.5 培养高素质的人才队伍

中医古籍数字化需要中医药、图书情报以及信息技术等多方面人才。古籍数字化中,建设数据库是基础工程,进一步的提供服务以及更深层次的数据挖掘、知识挖掘才是古籍数字化的意义所在。要建设中医古籍数据库、知识库,需要各类人才的通力合作。在数据库建设过程中,标引、著录、知识挖掘需要计算机专业、信息专业和古籍等相关专业各种人才的合作。要把古籍数据库建设成为数据挖掘、知识挖掘的源泉,需要多专业人才实现学科融合。高素质人才队伍的建设关乎古籍数字化的现在和未来。

3.6 避免资源重复建设

古籍数字化是为了减少纸质古籍的使用、保护古籍,并提供高质量的数字资源。目前开展古籍数字化的机构众多,一拥而上的形势下重复建设数量众多,质量良莠不齐,这样不仅浪费宝贵的人力、物力和时间,也使更多适合数字化、需要保护的古籍得不到及时有效的处理。中医古籍更多孤本、抄本等急需数字化,因此古籍数字化进程中,要以建设“准确”、“完整”的古籍资源为前提,联合各个机构的力量,避免资源的重复建设。

3.7 以建设高学术水准古籍数据库为目标

图片数据库或全文数据库是无法完全满足读者对知识的需求,故具备较高学术水准的专题化、知识库类型的数据库是未来古籍数字化的发展方向。因此,在古籍数字化规划之初,就应该考虑到长远的发展趋势和目标,即数据库要为建设更高质量的专题数据库和知识库做准备。

4 展望

作为与国人生活和文化息息相关的中医在医疗、保健等领域有着独特的优势。中医古籍数字化是保护中医古籍的方法之一,也是适应网络化、信息化社会发展趋势。结合技术变化,优化中医知识传播方式和渠道,对传统中医理论知识进行深层次的知识挖掘,加快学科建设,促进中医理论知识新发展的重要方式。各中医院校图书馆应结合当前正在进行的全国古籍普查活动,摸清家底,做好定级、定损,规划古籍数字化的下一步进程,建设具有馆藏特色的中医数字资源。

[1]裴丽,曹霞.中医古籍数字化多功能阅读环境模型构建[J].中医药信息,2010,27(1):118.

[2]杨继红.中医古籍数字化资源建设概述[J].现代情报,2008,28(5):136.

[3]叶莉.对古籍数字化进程中若干问题的思考[J].图书馆界,2010,31(4):10-11.

[4]李兵,刘国正,符永驰,等.中医古籍数字化整理方案探讨[J].中国数字医学,2010,5(5):35.

猜你喜欢

知识库古籍检索
汉语近义词辨析知识库构建研究
中医古籍“疒”部俗字考辨举隅
关于版本学的问答——《古籍善本》修订重版说明
西藏大批珍贵藏文古籍实现“云阅读”
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
浅议专利检索质量的提升
我是古籍修复师
卫星状态智能诊断知识库设计方法