明清浙派中医医家数据集(1368-1912年)
2022-10-08凌天焦阳李露芳钱俊文张永生
凌天,焦阳,李露芳,钱俊文,张永生
1.浙江中医药大学图书馆,杭州 310053
2.浙江中医药大学基础医学院,杭州 310053
引 言
浙江中医药源远流长,中医医林人物众多,这些医家关于中医药基础理论、中医教育思想以及中医科学化的一些见解,对当代浙江中医药事业的发展具有重要参考价值或借鉴意义;在西方医学传入、近代医疗卫生体系确立、对中国传统医学进行反思的历史背景下,浙派医家学术上百家争鸣,所编撰的医籍医著也明显地带上了时代的烙印,具有较高的学术价值、应用价值,值得全面整理、继承,以及精心研究。但明清浙江中医医家数据通常收录于各类中医药文献典籍中,零散且数字化程度较低,难以深入研究。随着计算机技术不断发展,通过数据库可以有效管理各类数字化数据。通过建立明清浙江中医医家数据集,不仅能够深入研究浙江中医药文化与发展史,进而研究如何更好地传承传统中医药文化,增强中医药文化自信。
目前中医医家研究主要分为两类:传统内容和单一对象数据库研究。传统内容以近代浙派中医名家研究为主,如1935年名医曹炳章先生的《浙江名医传略》[1]和周岐隐先生的《浙江历代名医录》[2]问世。1983-1990年,浙江省中医学会医史分会、浙江省中医药管理局先后编撰《浙江历代医林人物》[3]。二十世纪九十年代初,浙江省中医药管理局联合中医药系统各单位以及学者以编撰《浙江省科学技术志》[4],所收史料以1990年底为截止时间,其中“中医药学”篇章收录了大量中医药学有关的资料,概要介绍了部分浙派中医名家和重要医籍。单一对象数据库研究包括:2010年朱树良[5]对浙江省现存中医药古籍中500多种珍贵孤本进行数码扫描录入多媒体数据库。2021年赵泽鹏[6]等构建现代名老中医医案,归纳和总结名医经验。
纵观已有研究,医家作为不同时期学者的研究热点,较早年代中浙江历代名医研究仅能以传统纸质媒介为载体而出版,传播利用率较低;新时代以来信息技术快速发展,部分学者对现存纸质古籍数字化并存入数据库中,使古籍得到有效保护与传承,但数字化成品难以以元数据形式得到有效检索与利用。浙江是近代中医教育的发源地之一,在新旧文明和中西文化交汇与冲突的大背景下,中医传承与发展受到了中西医学的交汇、中医学的存废讨论的冲击,明清与近代医家们主动或被动地顺应时代需求,开创了典型的近现代中医文化。因此,建立明清浙江中医医家数据集不仅可以通古及今,为近代浙江中医药文化的深入研究提供帮助,更能为现代中医药文化发展所借鉴。本文以1368-1912年之间的浙江中医医家为研究对象,查阅整理收集相关文献典籍,将所有资料数字化存入数据库中,并根据医家生平考证医家学术流派与治疗特色,同时提取出Excel与XML两种便于利用的数据集格式,为进行更深层次的医家、医学著作、学术流派和可视化知识图谱研究提供数据基础。
1 数据采集与处理方法
1.1 数据来源
本数据集的数据主要来源于《中医人名大辞典》、《浙江历代名医录》、《浙江名医传略》(未出版手抄孤本)和《浙江医人考》等辞典史料书籍[7-8]。在此,本数据集对于这些著作的作者的学术贡献与辛勤付出予以深切的敬意和谢忱。这些著作记述了晋、南北朝、唐、五代、宋、金、元、明与清代的各个时期的浙江名医生平和独特治疗经验,并附有提要、索引、作者自序和编辑凡例,极具学术研究价值。本数据集摘取1368-1912年间浙江医家本名,以姓氏笔画排列,扼要介绍其生平、著作、师承关系等。
1.2 数据采集与处理方法
因本数据集数据源均为非可直接编辑数字化文本的纸质材料,因此需采用汉王高清文本仪进行数字化加工,按照600DPI以上分辨率扫描转化为符合国家标准GB/T 23286.3-2021、可长期保存的PDF格式电子文档文件,并通过OCR技术识别并校对为RDD弹性分布式集合类型的、可机器识别编辑的文本数据集。此时文本数据集包含历代不同地域的中医医家信息,因此通过python按照年代、所属市县乡等关键词抽取符合条件的中医医家,进行清洗合并处理。最终生成通用标准数据集格式并包含如下字段:姓名、拼音、字、号、籍贯、居住地、年代、学派、治疗特色、医家生平(包含医籍)等。共整理出中医医家807条记录,其中明确浙派中医学术流派的医家136名,可考证生平年月的医家153名。共校对字数77033个,包括中文字符数71660个。
本数据集的数据采集与处理流程图如下:
图1 数据采集与处理流程Figure 1 Data collection and processing flow
1.3 数据特征分析
本数据集主要采集的是特定条件下中医医家所属信息数据。每位医家生活社会环境不同,生平经历亦不同,因此必然具有个人特征属性,如地域属性、文化属性和社会属性等。将这些属性综合一体可以挖掘出人物形象、师承关系、事迹经历等等,为现代学者研究提供宝贵的研究资料基础。因此,本数据集主要特征可以分为地域特征、学术流派特征、医术特色特征等。如表1所示:
表1 医家人物特征与内容Table 1 Characteristics and contents of physicians
1.3.1 地域特征
地域特征不仅是医家特有的基本属性,也是中医药文化特征。中医历史悠久,最早可追溯到汉代班固撰写的《汉书·艺文志》中记载,经过千年发展与文化沉淀,形成了中华民族特色的医药学文化;同时中医也是一种地域文化,其与地域空间内的文化主体——医家的字、号、籍贯、居住地密切相关。其中医家的字是古人对名的补充和解释,部分医家以籍贯作为自己的字,如王一仁以新安为字,取自浙江省杭州市新安村,均具有很强的地域属性。
1.3.2 学术流派特征
浙江中医药历史悠久、流派众多。浙江中医学会第六届理事会将浙江中医药概括为浙派中医十大流派,其学术流派特征与地域特征具备一定关联性。仅以人名、地域而言,就有永嘉学派、钱塘医派、绍派伤寒、丹溪学派[9]等。而基于同一地域内,全国首届名中医范永生教授还定义了浙江区域内的其他六大学派:温补学派、温病学派、本草学派、医经学派、针灸学派、伤寒学派[10]。浙派中医学术流派包含整个浙江地域中医流派,囊括了内科、妇科、伤科、儿科等临床学科分类,对浙江中医药的社会影响力具有极大促进作用。“浙派中医”为现代称谓,并未由古代中医传承而来,因此需从浙江医家生平凝练概括。
1.3.3 医术特色特征
医术特色是古代中医擅长诊治的病证范围和医术水平高低的具体表现,也是现代中医临床专业化分科的重要依据。医术特色特征作为医家特有的重要属性,在古代官方医学的分科中,元代太医院将中医分为十三科并沿用到明隆庆年间,清代在此基础上整顿合并成中医五科,一直沿用到民国时期。古代医学分科主要以具体证名命名,与现代临床分科存在一定区别,同样需从医家生平考证总结出来。为确保数据准确性,将其中不少生平不详的医家其古代医学分科统一归为不详,留给后继学者考证完善。
2 数据样本描述
本数据集主要存储形式为Excel总表和XML系列文件集。其中Excel总表是以电子表格形式将所有医家信息汇总展示,具有浏览检索、分类汇总、编辑加工等功能,满足使用者基本需求。总表中有12个字段,包含序号ID、姓名、汉语拼音、字、号、籍贯、居住地、年代、学派、古代医学分科、现代临床分科、医家生平(包含医籍)。XML文件是数据交流的公共标准语言,具有极强的兼容性,可无缝对接 Windows、Linux、MacOS等常用桌面系统平台的数据仓储。因其数据结构较为简单,可以使用于任意程序之间的信息交换。本数据集将每一位医家信息单独编译成个体XML,再汇总成XML系列文件集,便于专业人士在此基础上信息调用与编程加工。数据样本描述如图2、图3所示。
图2 明清浙派中医医家数据集(Excel格式)Figure 2 Dataset of Zhejiang traditional Chinese medicine physicians in Ming and Qing Dynasties (Excel format)
图3 明清浙派中医医家数据集(XML格式)Figure 3 Dataset of Zhejiang traditional Chinese medicine physicians in Ming and Qing Dynasties (XML format)
3 数据质量控制与评估
为控制数据质量,保证数据的准确性、真实性与科学性,本数据集从权威辞典史料书籍中采集原始材料加工。其中《中医人名大辞典》由北京中医药大学古文献专家收集编写,《浙江名医传略》由近代浙江著名中医学家曹炳章著述,《浙江历代名医录》同为近现代浙江中医家周岐隐著录,《浙江医人考》由温州医科大学、全国名中医刘时觉教授编著,数据权威性得以保障,可信度较高。
4 数据使用方法和建议
本数据集从各类权威学术资料中共采集收录了807名浙派中医医家数据,可为了解明清时期以来浙派中医学术流派传承与西医引进思想碰撞提供一手资料。随着国内数字人文领域研究兴起与发展,用户可以基于此数据集进行统计分析与构建可视化图谱研究。同时本项目组成员基于此数据集构建了浙派中医文献数据库,可以提供用户可视化检索服务。其中部分古代医学分科、学术流派等字段目前因无史料支撑处于不详状态,可以供感兴趣的用户进行考证、补全。同时任何非商业目的的个人用户可以使用此数据集搭建中医知识库等。