胃癌古文献库的研究
2014-04-18王晓露潘宇张雷强
王晓露,潘宇,张雷强
(1.南京中医药大学附属医院,江苏南京210029;2.南京中医药大学,江苏南京210049)
中医古典文献是古人直接医疗实践经验的记录,是古代众多医药工作者长期努力、不懈探索积累起来的丰富知识宝库。近年来,中医药学出现了数字资源缺乏统一的描述、传承危机等问题[1]。因此,必须做好古典文献的系统整理工作。信息库是对领域信息的系统化管理和规范化呈现,能够实现中医药知识的共享、重用和传承。构建胃癌古典文献信息库,可以进一步理清概念,考镜源流,认识嬗变,构建快速、准确的胃癌知识检索系统,并借此实现知识的创新。国家中医临床研究基地建设之胃癌文献信息库构建目前已取得阶段性成果,现已构建了古典文献事实型数据库,介绍如下。
1 古典文献相关内容提取
由于胃癌古今病名的对应性较差,因此检索词的选择必须准确、全面。通过复习相关文献资料,参考前人研究成果可知,中医对胃癌早有认识。《黄帝内经》中提到的“食痹”,指食后不能消化,闷痛气逆,必吐出乃止。这可能是胃癌相似症状较早的记载[2]。另外,还有“胃脘痛”、“心痛痞满”、“膈中”等,都是对于胃癌相关症状的描述,“伏梁”、“心腹积”也是那个时期对这一类病证的称谓。《难经》提出“脾积”、“痞气”等病名,以后的众医家对于脾积、痞气的描述均源于此[3]。张仲景《金匮要略》中首次出现“胃反”称谓。从此“胃反”一词广为后世医家援引。至晋、隋、唐时期有“癥坚”、“结积’、“腹中积”、“胃反”、“反胃”、“脾积”等称谓[4]。宋代陈无择在《三因极一病证方论》中提到“积心痛”一词,该书又将“反胃”称为“食呕”。金元时期,李东垣《脾胃论》有“下脘不通”这一病名[5];朱丹溪称“翻胃”、“隔噎”;罗天益在《卫生宝鉴·卷十四》中称为“腹中积聚”。明清时期仍沿袭称为“翻胃”、“噎嗝”。至近代张锡纯在《医学衷中参西录·肠胃病门·噎隔》中提到“胃癌”一词。因此选择胃反、反胃、翻胃、食呕、伏梁、食痹、心腹积、癥坚、积聚等关键词进行检索检出率相对较高。考虑信息库所需事实的完整全面以及信息获取途径的便捷准确,本研究中的胃癌信息均从《中华医典》中检索获得。《中华医典》是第一部对中医古籍进行全面系统整理而制成的大型电子丛书。它收录了民国以前中国历代医学古籍1 000部,卷帙过万,近4亿字,汇集了历代主要中医著作,其中不乏罕见的抄本和孤本,大致涵盖了至清末为止的中国医学文化建设的主要成就,是至今为止规模最为宏大的中医类电子丛书。无须讳言,由于古今字形存在一定的差异,而且同一种中医古籍的不同版本在内容上也会有很大差别,因此从《中华医典》中搜集的信息有待进一步地校对和考证。但是考虑到信息库的主要功能是系统的管理及规范化的呈现,从《中华医典》中获取文献无疑是有效且经济的途径。
2 判断文献与胃癌相关性
胃癌古今病名的差异性导致古典文献收录标准难以确定,这是研究者要面对的首要问题。通过学习相关诊断标准,中医诊断标准参照《中药新药临床研究指导原则(试行)》(2002版)及中华中医药学会肿瘤分会《肿瘤中医诊疗指南》(2007版);西医诊断标准参照国家卫生部颁发的《胃癌诊疗规范》(2011版)及《NCCN胃癌临床实践指南》(2011版)。对胃癌主要症状和体征有如下认识:主要症状体征(A):①上腹痛;②恶心、呕吐;③腹部肿块。消化不良表现(B):①纳差;②易饱胀。全身状况(C):①进行性贫血(面色萎黄);②消瘦;③乏力。并发症(D):①呕血;②黑便;③腹泻。从而可进行筛选:①由于胃癌病名演化的特殊性,凡明确记载治疗胃反、反胃、翻胃、食呕者,若有胃部(胃脘、心下)肿块体征的描述者,均予以录入;脾积、痞气、伏梁等有恶病质体征(日渐羸瘦等)描述者予以录入。②记载有治疗食痹、心下痛、胃脘痛、心下痞满、膈中者有胃部(胃脘、心下)肿块体征以及恶病质体征(日渐羸瘦等)描述的予以录入;心腹积、癥坚、结积、腹中积、积心痛、噎膈、腹中积聚者,依据其主治症加以鉴别,属胃中癥坚积聚者予以收录,其它脏腑积聚排除。标准容易拟定,但实际操作颇有难度。因为仅通过文献中一些只言片语的描述往往无从获取足够的判断信息,纳入显得牵强,不收录可能错过有价值的文献。考虑构建信息库的主要目的是为科研工作提供素材,为临床工作开拓思路,因此对于这样一些文献依然予以纳入。
3 完成文献的分类标引
中医药文献在内容上存在关联性及差异性,参照既往信息库构建的一般模式,本研究将胃癌文献信息分为3类,即本草信息、方剂信息、辨治信息。其中本草信息指古代本草文献中记载的与胃癌相关本草,将古今异名本草同条陈列。如现代治疗胃癌常用的中药“石见穿”,在《神农本草经》中记载为“紫参”,此外亦有“牡蒙”等称谓,在标引中表示为:“紫参·石见穿·牡蒙”[6]。方剂信息则从历代方书、综合性著作中收录胃癌相关方剂,对方名进行标引。辨治信息收录胃癌辨治方面的文献,如脉诊、病机、治法等,因为这些信息在某一条记录中紧密关联,所以往往难以用单一字段进行标引;即便标引,检出结果特异性依然很低。只有在全文检索上下功夫,方能让使用者得到需要的文献资料。因此,在辨治文献检索方面必须实现多个关键词共同全文检索,这一目标在后期交互过程的开发中基本实现。
4 建立相关文献数据库
结合数据量、成本等因素考虑,本研究应用MySQL建立文献数据库。MySQL是一个开放源码的小型关联式数据库管理系统[7]。目前MySQL被广泛地应用在Internet上的中小型网站中。它具有体积小、速度快、总体拥有成本低、开放源码等特点,许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。在该数据库中建立三张表,分别存放本草、方剂、辨治信息从而建立了文献数据库。
5 建立交互式检索界面
考虑网络检索的需要及成本制约,本研究的界面设计采用Java程序设计语言编译开发,对应的选择apache tomcat作为服务器。Java技术具有卓越的通用性、高效性、平台移植性和安全性[8]。Apache是世界使用排名第一的Web服务器。它可以运行在几乎所有广泛使用的计算机平台上。Tomcat是一个Servlet容器,按照Sun Microsystems提供的技术规范,实现了对Servlet和Java Server Page(JSP)的支持[9]。通过这一组合开发的界面适用平台广,稳定性强,便于维护且成本较低。
6 数据库更新及系统维护
本信息库未建立交互式的更新系统,因此数据的更改、增加、删减需专业人员在数据库中进行操作。这样的设计虽然导致互动性降低,但提高了维护效率,也更加科学严谨。
中医是中国传统文化的瑰宝,我们应当好好珍惜它,传承它,发扬它。花开花落,岁月更替,时代在前进,社会在变化。任何事物都不是一成不变的,都要与时俱进。中医及其文化也是如此。因此古文献数据库的建立显得尤为重要。本文从古典文献相关内容提取、判断文献与胃癌相关性、完成文献的分类标引、建立相关文献数据库、建立交互式检索界面、数据库更新及系统维护6个方面对古文献库的建立进行系统阐述,使我们的中医药知识的共享、重用和传承得以呈现。
[1] 张五辈.中医药知识库设计与实现[D].沈阳:沈阳航空航天大学,2011.
[2] 王冰.黄帝内经素问[M].沈阳:辽宁科学技术出版社,1997.
[3] 烟建华.难经讲义[M].北京:中国科学文化出版社,2002:53.
[4] 范永升.金匮要略[M].北京:中国中医药出版社,2003:55.
[5] 文魁,丁国华.脾胃论[M].北京:人民卫生出版社,2005.
[6] 孙星衍,孙冯翼辑.神农本草经[M].北京:人民卫生出版社,1982.
[7] 李现艳,赵书俊,初元萍.基于MySQL的数据库服务器性能测试[J].核电子学与探测技术,2011,31(1):48-52.
[8] 张岚.基于JAVA WEB技术旅游服务网站系统设计与实现[D].成都:电子科技大学,2012.
[9] 孙仁鹏.Tomcat与Apache集成的研究[J].电脑编程技巧与维护,2011(14):6-8.