APP下载

基于复杂网络的薛伯寿教授临床处方用药规律分析研究*

2017-04-10孔维莲徐丽丽薛燕星刘保延王映辉周雪忠张润顺

世界科学技术-中医药现代化 2017年1期
关键词:处方中医药中药

孔维莲,徐丽丽,薛燕星,刘保延,王映辉,周雪忠*,张润顺

(1.北京交通大学计算机与信息技术学院 北京 100044;2.中国中医科学院中医药信息研究所北京 100700;3.中国中医科学院广安门医院 北京 100053;4.中国中医科学院中医药数据中心 北京 100700)

基于复杂网络的薛伯寿教授临床处方用药规律分析研究*

孔维莲1**,徐丽丽2**,薛燕星3***,刘保延4,王映辉2,周雪忠1***,张润顺3***

(1.北京交通大学计算机与信息技术学院 北京 100044;2.中国中医科学院中医药信息研究所北京 100700;3.中国中医科学院广安门医院 北京 100053;4.中国中医科学院中医药数据中心 北京 100700)

目的:如何从中医药学长期医疗实践中积累的大量处方数据中进行知识发现是中医药现代化研究的重要内容之一。本研究拟从薛伯寿教授多年临床实践的处方数据出发,探索基于复杂网络的中药网络与处方网络相结合发现薛教授常用复方核心药物组合的方法。方法:基于薛教授在中国中医科学院广安门医院门诊系统中的9 584个处方数据,依据处方构成的相似性和药物的同现关系分别构建处方网络和药物网络,利用社团分析等复杂网络方法进行处方及药物配伍分析,由薛老及其传承人评价分析结果。结果:通过复杂网络分析,得到126个处方模块,4个中药模块。其中,1个处方模块的核心药物组合为小柴胡汤、银翘散、升降散复方加减,与前期利用完整回顾性医案挖掘的外感热病处方中药组成一致。结论:针对处方数据,利用社团分析等复杂网络方法具有一定的优势,可以得到薛教授治疗不同疾病的常用复方核心药物组合,可为进一步继承和挖掘名老中医临床经验方提供基础。

快速模块性优化 模块划分 核心药物组合 复杂网络 数据挖掘 薛伯寿

真实世界研究是利用临床实际数据开展的临床研究,从大规模数据中归纳获得临床有用或具有理论意义的知识,是形成创新知识和临床决策的有效技术手段[1],已成为中医领域的热点研究方向[2]。利用数据挖掘技术对名老中医临床数据进行研究,解析用药规律,总结学术思想和临证经验,实现名医经验的有效总结和传承,是当前的中医药传承研究热点之一。

薛伯寿教授从事中医临床及教学50余年,早年师从著名中医蒲辅周先生,深得蒲老心传,以擅治各科疑难杂症及外感热病而著称。本研究部分作者在前期研究中基于薛教授回顾的完整外感发热医案数据,采用中药复杂网络挖掘出利用小柴胡汤、升降散、银翘散复方加减治疗外感热病[3]。但是,由于收集完整医案需要花费大量时间和人力,亟待找到更高效的信息收集技术和方法。随着医院信息化建设的发展,医院信息系统(Hospital Information System,HIS)积累了大量的处方数据,利用这些处方数据,开展名老中医选方用药规律、有效方药发现研究对于传承名老中医经验具有重要价值。目前的处方分类研究中有的是针对小样本处方数据[4],或按照已知方剂组成标准[5]进行分析。本研究拟采用社团分析等复杂网络方法针对大样本处方数据探索发现薛教授常用复方核心药物组合,从而验证与前期研究的一致性。

1 材料与方法

1.1 研究对象

数据来源于中国中医科学院广安门医院HIS系统中薛教授自2008年7月1日至2014年7月29日的全部门诊处方信息。

1.2 研究方法

1.2.1 病例资料内容

在本研究中,处方数据的纳入标准为:患者基本信息、就诊信息和处方信息完整的临床资料。

1.2.2 数据整理与规范

将HIS中的相关数据导入中医临床数据仓库,确认导入后的处方与HIS中原始处方数据一致,保证数据完整、准确。再利用中医临床数据预处理系统(Extract-Transform-Load,ETL)按照《中国药典》与《北京市中药饮片调剂规程》进行中药名称规范化处理[6]。

1.2.3 数据分析方法

基于古方及当代临床复方数据的分析表明,中医药理论指导下的复方配伍过程具有无尺度复杂网络现象[7],表明中医处方中存在核心的组织结构,这些组织结构代表了医生临床处方的思维结构、知识贮备和临床经验。无尺度网络的主要特征是网络中大部分节点只和很少节点连接。

本研究通过处方药物组成发现核心药物配伍的思路是,先从大量数据中找到结构相似的处方,再从某类相似处方中分析核心药物组成(研究方法示意图见图1),分别从处方和中药两方面挖掘核心药物组合。首先,利用杰卡德相似系数来计算处方药物组成的相似性,杰卡德相似系数等于两个样本集交集与并集的比值,是衡量两个集合相似度的一种指标,相似性的值越大说明两个处方之间的药物组成越相似。选择一定阈值以上的处方,利用Gephi[8]软件中的快速模块性优化方法(Fast Unfolding algorithm)[9]构建处方之间的网络,如公式(1)所示,并进行模块划分。快速模块性优化方法是一种基于模块度的迭代算法,其主要目标是不断划分模块使得最终网络的模块度值不断增大,该算法结合局部优化与多层次聚类技术,对于稀疏网络具有线性时间复杂度,同时可获得非常高的聚类质量。

图1 分析方法示意图

依据中药同时出现在同一处方中的频次构建以中药为节点的网络,两个中药同时出现的处方越多,这两个中药所连接的边的权重值就越大,表明两个中药关系越紧密。

在研究过程中还利用多尺度骨干网(Multiscale backbone)[12]筛选重要的边。针对显著的处方模块和中药整体网络,利用分层网络(Hierarchical Networks)挖掘核心处方。主要利用Liquorice(该软件的理论是基于J Pittman 提出的复杂网络分析方法)软件[10-12]和Gephi实现。

2 结果

2.1 数据基本信息

2.1.1 患者基本信息

共有5 551例患者10 110诊次,经审核去除重复及少数错误的处方信息,共有9 584个处方信息。

图2 350种中药在9584个处方中的使用频次分布图

表1 全部处方中药使用频次及剂量分布/g

2.1.2 处方基本信息

9 584个处方中的350种中药共使用频次为139 250次,少数中药使用频次较高(图2)。频次在2 000次以上的中药有15种(表1)。每张处方平均含有15±2种药,平均重量为157.9±30.7 g。

图3 9 584次处方以药为节点的度分布和权重分布

表2 9 584次处方之间运算的相似值分布

2.2 处方特点分析

2.2.1 中药网络特点

以中药为节点的网络包含中药350种,共有24 003条边,其中度分布和边的权重分布均符合幂律分布(图3)。由图3可以看出,薛教授临床用药存在优先选择的核心药物及其药物配伍。利用多尺度骨干网(置信度为0.95)筛选出比较重要的3 525条边进行后续分析。

图4 9 584个处方运算相似值分布

2.2.2 以处方相似性划分的处方群及核心药物组合分析

9 584个处方运算的相似性值分布见表2、图4。处方之间相似度偏低,提示薛教授辨证施治,中药配伍使用灵活。将处方间相似值≥0.5以上的9 063个处方,利用快速模块性优化方法得到126个模块,即处方群。将其中处方数目较大的处方群利用分层网络,取Layer=3,Degree coefficient=1.9得到复方核心药物组合(表3),处方群编号为软件根据运算编排。图5为处方群20的核心药物组合网络图,该方为小柴胡汤、银翘散、升降散加减构成,主治外感发热咽痛等病证。

表3 数目较大处方群信息及其核心药物组合

2.2.3 以中药配伍紧密程度划分的核心药物组合分析

采用快速模块性优化方法,将中药配伍紧密程度将全部处方中的350种中药划分为4个模块,即中药群(表4、图6)。中药群内部的中药配伍程度比中药群外部的中药配伍更加紧密。因处方中包含内外妇儿各类病证,该方法分析出3个具有明显不同治疗作用的中药群,其中的中药群1比例较大。

中药群1中按配伍药味数≥50的中药群为小柴胡汤、银翘散、升降散、黄芪赤风汤加减构成,以药测证分析,主要功效为辛凉解表、清热解毒,主要治疗外感病证。

2.2.4 中药核心配伍

针对全部处方(9 584个),利用点式互信息法挖掘350种药之间的核心配伍关系,其中北柴胡、炙甘草、茯苓、麸炒枳壳、大枣、法半夏等之间的配伍强度均较高,配伍频度在前20对的频度及配伍强度见表5。

利用分层网络对9 584个处方以中药为节点形成的网络中比较重要的3 525条边挖掘的核心药物组合,该组合由北柴胡、茯苓、麸炒枳壳、炒白芍、当归、防风、炙甘草、法半夏、黄芪、麸炒白术组成,可以看出薛老常用处方为小柴胡汤、四逆散、黄芪赤风汤等加减,药物组成及药物配伍药味数分布(图7)。

3 讨论

图5 处方群20的核心药物组合

图6 9 584个处方以中药配伍紧密程度划分的中药群

表4 以中药配伍紧密程度划分的中药数及代表中药(配伍药味数≥50)/个

表5 中药核心配伍及相关系数信息(频度/个)

图7 9 584个处方的核心药物组合及配伍药味数分布

经薛教授本人及其弟子确认,针对9 584个处方,利用快速模块性优化方法和分层网络结合挖掘的复方核心药物组合体现了薛老的处方的总体用药特色。在治疗不同病证时喜用经典名方配合运用,中药群1中药物多为治疗外感热病的常用药。其中,因薛教授治疗外感病时,善调畅气血,喜用黄芪赤风汤,故黄芪也被划分在中药群1中。处方群20的复方核心药物组合以小柴胡汤、银翘散、升降散加减,主要治疗外感发热咽痛等症,与薛教授用药经验相吻合,体现了薛教授外感热病首要方法是以不同透邪之法,逐邪外出,疏透表气郁闭,使邪毒有外出之路的学术思想[13]。

目前,可采用多种不同算法进行处方分析。如李文林等[4]采用模糊聚类方法分析疾病群方特色,该方法简单直观,适用于小样本数据。孙燕等[5]采用支持向量机实现中医方剂按照不同要求标准的机器自动分类,该方法在解决小样本、非线性及高维模式识别问题中具有特有的优势,但其属于有监督学习方法,必须预先明确各类别的信息。针对薛教授多年积累的大量临床处方数据,本研究依据处方构成的相似性和药物的同现关系分别构建处方网络和药物网络,采用基于模块度的快速模块性优化方法和分层网络得到常用复方的核心药物组合。该方法执行速度快、效率高,并且无需预先设定模块的大小和分类数,适用于大样本数据。此外,分层网络[14,15]除了可以得到核心药物组合,还可以得到与核心药物组合相应的加减用药,因篇幅有限,在本研究中未述。

本研究中处方相似性的构建以中药药物组成为主,下一步将结合药物剂量、处方药物的君臣佐使关系来深入研究。同时,针对复方的核心药物组合的适应症等信息将结合临床病历、临床评价等信息,分析获得具有随症加减的个体化临床处方治疗方法,为薛教授临床处方的精准治疗[16]应用提供基础。同时,以人机结合的方式,形成可推广应用的名老中医有效经验方临床分析应用方法。

致谢:感谢中国中医科学院广安门医院薛伯寿教授为本研究提供的珍贵临床资料,并在百忙中给予指导!

1 刘保延. 真实世界的中医临床科研范式. 中医杂志,2013,54(6):451-455.

2 邵明义,刘保延,谢琪,等. 中医药临床科研数据的发展现状和趋势探讨. 世界科学技术—中医药现代化, 2015,17(8):1743-1747.

3 薛燕星. 基于信息挖掘技术的蒲辅周外感热病辨治规律及传承研究. 中国中医科学院硕士学位论文,2012:67.

4 李文林,陈涤平,曾莉,等. 基于模糊聚类方法分析干祖望教授诊治耳鸣耳聋疾病群方特色. 中国实验方剂学杂志,2012,18(23):4-8.

5 孙燕,臧传新,任廷革,等. 支持向量机分类器在中医方剂模式识别中的应用研究. 中医药管理杂志,2006,14(11):25-28.

6 周霞继,张润顺,王映辉,等. 基于多区域处方的中药数据规范化整理的问题及对策. 世界科学技术—中医药现代化, 2015, 17(3):417-421.

7 周雪忠,刘保延,王映辉,等.复方药物配伍的复杂网络方法研究.中国中医药信息杂志, 2008,15(11):98-100.

8 M. Bastian, S. Heymann, M. Jacomy. Gephi: An open source software for exploring and manipulating networks. In Proceedings of 3rd International AAAI Conference on Weblogs and Social Media, 2009.

9 Blondel V D, Guillaume J L, Lambiotte R,et al. Fast unfolding of communities in large networks.J Stat Mech-Theory E, 2008, 2008(10):155-168.

10 Pittman J, Berger J O. Integrated modeling of clinical and gene expressioninformation for personalized prediction of disease outcomes.P Natl Acad Sci USA, 2004,101(22):8431-8436.

11 Zhou X, Chen S, Liu B,et al. Development of traditional Chinese medicine clinical data warehouse for medical knowledge discovery and decision support.ArtifIntell Med,2010,48(2-3):139-152.

12 Zhou X, Liu B. Network Analysis System for Traditional Chinese Medicine Clinical Data. International Conference on Biomedical Engineering and Informatics.IEEE, 2009:1-5.

13 徐丽丽,薛燕星,张润顺,等. 名老中医有效经验方发现研究的探索与实践. 中国实验方剂学杂志, 2015, 21(7):1-4.

14 张润顺,周雪忠,姚乃礼,等. 基于复杂网络分析的肝脾不调证的配伍特点研究. 世界科学技术—中医药现代化, 2010,12(6):882-887.

15 Zhou X, Zhang X. Extraction of Hierarchical Core Structures from Traditional Chinese Medicine Herb Combination Network.2008高等智能国际会议, 中国人工智能学会, 2008.

16 陈健,陈启龙,苏式兵. 中医药精准医疗的思考与探索. 世界科学技术—中医药现代化, 2016, 18(4):557-562.

A Research on the Discovery Methods in Prescription and Medication Based on Professor Xue Boshou's Clinical Prescription Data

Kong Weilian1, Xu Lili2, Xue Yanxing3, Liu Baoyan4, Wang Yinghui2, Zhou Xuezhong1, Zhang Runshun3
(1. College of Computer Science and Information Technology / Beijing Key Lab of Traffic Data Analysis and Mining, Beijing Jiaotong University, Beijing 100044, China; 2. Institute of Information on Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China; 3. Guang'anmen Hospital, China Academy of Chinese Medical Sciences, Beijing 100053, China; 4. National Data Center of Traditional Chinese Medicine, China Academy of Chinese Medical Sciences,Beijing 100700, China)

How to discover the valuable knowledge from the large amount of prescription data accumulated in the long-term medical practice of traditional Chinese medicine (TCM) is one of the important contents of TCM modernization. Based on the prescription data of Xue’s clinical practice of many years, this paper explored the method of combining TCM network and prescription network to find out Xue’s common core drug combination. Based on 9,584 prescriptions in the Hospital Information System of Guang′anmen Hospital of China Academy of Chinese Medical Sciences, prescription network and drug network were constructed according to the similarity of prescription composition and drug co-occurrence relationship. Using the complex network analysis methods, such as community analysis method, to analyze the prescription and drug compatibility, the results were evaluated and analyzed by Xue and his successors. As a result, through complex network analysis, 126 modular prescriptions and 4 TCM modules were obtained. One of the core components of the prescription module included Xiao Chai Hu decoction, Yin Qiao powder, and Sheng Jiang powder compound addition and subtraction. It was in consistent with the drug composition of exogenous febrile prescriptions excavated earlier. In conclusion, using the complex network methods, we can get some core drug combinations prescribed by Prof. Xue, and achieve the common compound core drug combination for treating diseases with certain vantages, laying a foundation for further inheriting and excavating Xue’s effective experience.

Fast unfolding algorithm, module partitioning, core drug combination, complex network, data mining,Xue Boshou

10.11842/wst.2017.01.008

R249

A

(责任编辑:朱黎婷,责任译审:朱黎婷)

2016-12-28

修回日期:2017-01-06

* 科学技术部“十二五”国家科技支撑计划项目(2013BAI13B04):名老中医特色有效方药传承研究,负责人:张润顺;国家中医药管理局“十二五”中医药重点学科:中医临床信息学,主持人:王映辉;国家中医药管理局2014年中医药行业科研专项(201407001): 中医综合调养方案对慢性肾脏病进展高危因素干预的数据分析挖掘方法研究,负责人:王映辉;国家中医药管理局2015年度国家中医临床研究基地业务建设第二批科研专项(JDZX2015170): 慢性肝病病案资料数据审编方案设计、质量控制关键技术研究,负责人:张润顺;国家中医药管理局2015年度国家中医临床研究基地业务建设第二批科研专项(JDZX2015171): 肝病回顾性病例表型信息抽取方法与分析研究,负责人:周雪忠。

** 孔维莲和徐丽丽为共同第一作者。

*** 通讯作者:薛燕星,主任医师,主要研究方向:外感热病防治、名老中医经验传承研究;周雪忠,本刊编委,教授,主要研究方向:复杂网络、数据仓库、数据挖掘;张润顺,主任医师,主要研究方向:中医药防治消化系统疾病研究、名老中医经验传承研究。

猜你喜欢

处方中医药中药
中药久煎不能代替二次煎煮
您知道吗,沉香也是一味中药
中医药在恶性肿瘤防治中的应用
中医药在治疗恶性肿瘤骨转移中的应用
中医,不仅仅有中药
人间处方
中药贴敷治疗足跟痛
从《中医药法》看直销
中医药立法:不是“管”而是“促”
解决因病致贫 大小“处方”共用