基于关联规则的乌发古代方剂用药规律研究*
2019-09-13田雅娟李钦青
田雅娟,李钦青,杜 娟,杨 婕
(山西中医药大学,山西 太原 030024)
1 引 言
染发剂被定义为通过除去现有颜色或增加新颜色来暂时性或永久性地改变头发颜色的一类特殊用途化妆品[1]。据文献记载,我国将具有染色性能的中草药用于染发已经有两千多年的历史,《肘后备急方》中记载“醋浆煮豆,漆之,黑如漆色”,《神农本草经》中记载“铁精,一名铁液,可以染色”,《外台秘要》中记载“胡粉(一分)、白灰(一分),上二味,以鸡子白和,先以泔浆洗令净,后涂之,即急以油帛裹之一宿,以澡豆洗却,黑软不绝甚妙......”
人工化学合成类染发剂始于1883年,法国Monnet公司首创了对苯二胺类氧化染发剂[2]。该类染发剂大多以对苯二胺及其衍生物等原料制得,其作用机制是对苯二胺经过氧化氢等物质氧化成黑色染料而将头发染黑。该类染发剂具有着色牢固、颜色丰富、原料易得、价格便宜等优势[3]。但是,对苯二胺作为一种强过敏原,会引起皮肤过敏、发痒、水肿、气喘、贫血等症状,严重者可能中毒死亡[4]。
在20世纪80年代,各国开始转向研制毒性小、致敏性低、无污染的植物性染发剂。法国、印度等国已相继研制出了以苏木精为原料的植物染发剂,日本推出了以辣椒素、虫胶酸、胭脂红酸等为原料的植物染发剂,我国研发了由儿茶、柯子、五倍子提取物为原料的植物性染发剂。与人工化学合成染发剂相比,目前天然色素的染色性能仍不理想[5~6]。
中草药功效的发挥是通过复方形式达到的,不仅要遵循中医药的药性理论,更要探究其配伍原则。利用数据库技术,数据挖掘技术,收集分析中医古籍中具有染色性能的中药,建立乌发古方数据库,使用关联规则分析其用药规律、性味归经,以期为新产品研发提供有益线索,为促进中医药传承与创新提供数据支撑。
2 乌发中药数据库的设计
2.1 数据来源
从《神农本草经》《外台秘要》《本草纲目》等650部中医古籍中筛选主治或功效中含有关键字的所有方剂。
2.2 处方筛选
选择方剂主治中包含“染”“黑”“乌”“黑发”“黑须”“墨”“黑髭”“白髭”“染鬓”“染须”“治须”“治白发”“发黑”“髭须”“乌髭”等关键词中的一个或数个,筛选其中记载完整,论述可靠的方剂,剔除重复者。经过一次筛选,二次审核,共获得符合标准的中药乌发方剂52首,涉及中药108味。
2.3 规范化处理
古方记载中,药物的名称常出现不同的表达方式,为了保证查全率及查准率,在录入数据之前对52首有效方剂中出现的108味中药的名称按照《中国药典》(2015年版)及《中华本草》进行名词术语规范化处理[7~8],其中将58味中药进行了更名,如“芎穹”“芎藭”“如芎”统一规范为“川芎”,“云茯苓”“白茯苓”“茯苓”“赤茯苓”“云苓”统一规范为“茯苓”等。
2.4 数据库构建
利用SQL Server构建乌发中药关系型数据库,该数据库包括中药单味药数据模块及中药复方药数据模块。中药单味药数据模块6个表(Table),分别用于存储药物的名称、性味、归经、用药部位、方源及用法。中药复方药数据模块4个表(Table),分别用于存储方剂的名称、组成、方源及用法,如表1~2所示。
表1 中药单味药各检索字段示例
表2 中药复方药各检索字段示例
乌发中药数据库体系结构包括内容结构分析、数据预处理(包括方剂数据预处理和中药数据预处理)、药物频次分析、药物性味归经统计。
2.5 数据挖掘
关联规则在中药方剂中的使用范围较为广泛,尤其是频数分析和聚类分析,Apriori算法是由R.Agrawal等提出,是目前较为成熟且常用的挖掘布尔关联规则频繁项集的算法[9]。中药乌发数据库集成了数据挖掘模块,采用Apriori算法关联规则对乌发中药方剂的组成药物进行分析,找出高频药物、核心药对,并分析其配伍规律,找出药物之间的关联。通过迭代方法寻找频繁项目集,先生成较小的频繁项目集,由它产生较大的候选频繁集,扫描数据库判断是否大于最小支持度,得到频繁项目集,重复以上过程,直到没有新的频繁项目集产生为止。
为了预防所得到的规则数量过大,在进行数据挖掘时除了采用支持度-置信度(support-confidence)评价体系外,还利用提升度(life)剔除关联规则中的冗余。即:若有life(AB→C)=life(A→C),则认为关联规则AB→C相对于A→C是一条冗余规则,将其剔除。
2.5.1 用药频次分析
对具有乌发功效的52首方剂中涉及的108味药物进行“频次统计”,结果显示:常用药物有地黄(生、熟)、胡粉、没食子、石灰、大皂角、大青盐等。出现频次≥5的药物如表3所示。
表3 具有乌发功效的方剂中出现频次≥5的药物
2.5.2 性味归经分析
对应分析以两变量的交叉列联表为研究对象,揭示变量不同类别之间的联系[10],128味乌发中药性味归经分析结果如表4所示。
表4 乌发中药性味归经统计表
性:该类中药以温性药为主,占38.05 %,其次为寒性药,占35.40 %,热性药最少,所占比例为1.77 %。
味:该类中药以甘味药为主,占28.48 %,其次为苦味药,占26.58 %,咸味药最少,所占比例为5.06 %。
归经:该类中药主要入肝经,占19.34 %,其次入肾经,占16.87 %,入胆经药最少,所占比例为0.82 %。
2.5.3 基于熵聚类的方剂组方规律分析
基于改进的互信息法的药物间关联度分析,依据方剂数量,结合经验判断和不同参数提取数据的预读,按照相关度8,惩罚系数2进行聚类分析,得到方剂中两两药物之间的关联度,将关联系数0.01以上的药对列表,如表5所示。
3 乌发中药数据库的构建意义
3.1 中医药信息化
计算机科学不断与中医药各个学科相互交融、相互渗透,数据库的构建作为中医药信息化的一个组成部分,有利于推进中医药的发展与传承[11~12]。乌发中药数据库是集信息收集、检索、分析为一体的信息平台,为中医药信息工作提供了一种思路和模式。
3.2 中医药传承
中药染发已经有两千多年的历史,随着药物分析及提取技术、计算机数据库及数据挖掘技术的不断提升,古方的挖掘、分析、利用、创新也将迎来新的发展机遇。
3.3 科研数据平台
目前,染发类产品的有效性及安全性均有待于进一步的提高,建立乌发中药数据库并进行关联规则分析为科研工作提供了数据支持,有益于古方挖掘及新方发现。
表5 基于改进的互信息法的药物间关联度分析
4 结 语
化学合成类染发剂的安全性已成为制约其发展的瓶颈,以天然植物性染料(富含多元醇类活性成分植物)为原料,植物活性物质作为着色剂的染发产品也在不断被开发[13],但目前植物染发产品仍存在诸多问题,如稳定性差、与头发结合不够牢固、易脱色、色调单一、上色时间长等,有待于进一步提升和改善。
乌发中药数据库的建立将中医药数据与现代信息技术有机结合,探讨具有乌发性能中药的药物性味和用药规律,为其数字化表达和科学组方提供研究基础。以650部中医古籍中记载的方剂及药物数据为基础,筛选具有乌发或染色性能的方剂,进行统一的标准化处理,包括名词术语及计量单位的规范与统一。在此基础上,利用数据库搜寻或虚拟筛选发现高频药物,为研发具有自主知识产权的创新药物提供思路。随着中药有效成分研究的日益深入,中药提取技术的不断提高,此类数据库将为中医药研究与创新提供数据支撑。梳理、整合经典名方,建立数据库,从不同角度来认识中药的物质基础和作用机理,可为中草药染发剂的开发有益线索及数据支持,但其有效性及安全性还需进一步验证。