基于人脸检测技术的高血压病肝火亢盛证的色部界定法❋
2022-03-10李佳佳陈仁波曹紫嫣盖国忠
李佳佳, 陈仁波, 曹紫嫣, 盖国忠△
(1.首都医科大学附属安定医院, 北京 100088;2.国家精神心理疾病临床研究中心, 北京 100088;3.精神疾病诊断与治疗北京市重点实验室, 北京 100088;4.中国中医科学院中医临床基础医学研究所, 北京 100700)
色部为中医特有概念,脏腑及肢节在面部的色诊部位叫色部[1]。有关色部的论述首见于《黄帝内经》,后世很多医家对其进行了阐释与补充。色部位置的界定是色部研究的关键点且长期存在争议,究其原因多为忽视了色部的原理和属性。本文将从色部的属性和原理入手,介绍当代医家对肝的色部客观化定位研究方法,结合高血压病肝火亢盛证,利用MTCNN人脸检测算法对其色部位置进行界定。
1 色部的属性
色部理论的目标是诊断和辨证,必然与病证息息相关,其属性为恒动性和多样性。《黄帝内经》对色部的定位均是结合了疾病的部位和性质。不同的病位、色部不同。《灵枢·五色》:“黄帝曰:五色之见也,各出其色部。”《望诊遵经·五色相应提纲》:“五色形于外, 五脏应于内, 犹根本之与树枝也……故有病必有色, 内外相袭, 如影随形, 如鼓应桴。[2]”相同的病位,证型不同,气血变化不同,色部亦不同。《素问·刺热篇》:“肝热病者,左颊先赤”,《素问·风论篇》:“肝风之状…… 诊在目下, 其色青”,《诸病源候论·中风候》:“肝中风者, 其人但踞坐不得低头, 绕两目连额上,色微青。[3]”
《素问·刺热篇》《灵枢·五色》《灵枢·五阅五使》根据不同的病证和观察对象,分别提出了面部色诊法、明堂色诊法、五官色诊法。以肝为例,肝对应的色部可为左颊、下级之下、目、目眦。《素问·刺热篇》:“肝热病者,左颊先赤。”《灵枢·五色》:“庭者,首面也……下极者,心也;直下者,肝也。”《灵枢·五阅五使》:“目者肝之官也”“肝病者,眦青”。因此疾病的性质不同,观察对象不同,其对应的色部位置亦不同,色部具有动态变化性和多样性特点[4-8]。
2 色部理论的原理
色部的理论依据为五行互藏理论,其出发点为气一元论。《河洛原理》:“太极一气产阴阳,阴阳化合生五行,五行既萌,遂含万物。[9]”五行互藏早在《黄帝内经》多个篇章中有所蕴含,如《素问·阴阳别论篇》:“凡阳有五,五五二十五阳。”明·张介宾在《类经图翼·五行统论》中明确提出了五行互藏的理论:“五行者,水火木金土也……第人皆知五之为五,而不知五者之中,五五二十五,而复有互藏之妙焉。[10]”《素问·移精变气论篇》:“夫色之变化,以应四时之脉……以合于神明也。”天、地、人,人体各部分桴鼓相应,阴阳之中复有阴阳,五行之中复有五行,揭示了生命的整体性与复杂性,与现代的生物全息理论相吻合。全息论基本原理为从潜显信息总和看,任一部分都包含着整体的全部信息。“全息”能够根据部分反映整体特征,还原整体影像,各个部分均为整体的缩影,贮存着整个宇宙的全息信息。1973年,张颖清发现了第二掌侧全息穴位群和人体的许多全息元,通过对其分布规律的探讨与研究发现,人体各个部分、各个系统均遵循相同的分布规律,提出了生物体结构的全息胚学说,创立了全息生物学[11-14]。由于人体的每一个部分均包含了完整的生命信息,因此色部存在于不同部位。以肝为例,当观察对象为面部时色部为左颊;当观察对象为明堂时,色部为下极直下;当观察对象为五官时色部为目,当观察对象为目时色部为黑睛。
人体的每一个部分都包含完整的生命信息,但是每个部位反映的生命信息又是有序而不均匀的,正是由于生命信息的完整性和分布的不均匀性,构成了色部的理论基础。图1是现代医学在大脑皮质运动和感觉的反射投射区解剖图,显示生命信息的分布是完整有序而不均匀的,如手的投射区域明显大于其他区域,拇指的投射区又大于其他手指的投射区域。中医学以阴阳标记属性,以阳为例,经脉有太阳、少阳、阳明,阳跷、阳维、督脉,阳的比例明显不同;五脏六腑六腑为阳,五脏为阴,又有阳中之阳,阴中之阳等推之万物。正如《道德经》所言:“道生一,一生二,二生三,三生万物”。如以五脏为例,人体的每一个部位均包含了五脏的生命信息,如abcde分别对应心肝脾肺肾,但是由于生命信息分布的不均匀性,在特定的部位就能观察到不同的生命信息,该部位分布较多的生命信息可由大写表示。《素问·刺热篇》:“肝热病者,左颊先赤;心热病者,颜先赤;脾热病者,鼻先赤;肺热病者,右颊先赤;肾热病,颐先赤。”如果五脏疾病性质为热病,根据《素问·刺热篇》观察对象为人体整个面部,那么心的色部生命信息可能为Abcde,对应颜,肝的色部生命信息可能为aBcde,对应左颊(如图2)以此类推。如果观察对象为明堂,明堂亦包含了五脏的生命信息abcde,那么心的色部生命信息可能为Abcde,对应下极。肝的色部生命信息可能为aBcde,对应下极直下。五行互藏理论说明机体内部的无限可分性、人体组织器官的复杂性和功能属性的多样性。色部的动态变化性和多样性的根本原因是病证气血变化的复杂性和生命信息的完整有序性与分布的不均匀性。
图1 大脑皮质运动和感觉投射区
图2 《素问·刺热篇》面部色部区
3 当代医家对肝的色部客观化定位
后世很多医家根据自己的医疗实践,结合《黄帝内经》对色部进行了阐述和界定,但其位置界限缺乏规范。随着科学技术的发展,色诊走向了客观化,色部的界定方法仍显粗糙、复杂且定位不够精准,其色部位置界定尚未结合病证,未进行深入摸索和验证。对色部的研究方向脱离了病证本身,忽视了色部的属性,只言病不言证,或者只言证不言病,应引起研究者的重视[15-21]。王鸿谟根据《灵枢·五色》绘制了脏腑色部中心坐标图,肝的色部中心(G)在前正中线与两颧骨最高点连线的交点,正当鼻梁骨最高处;根据《素问·刺热篇》,在自然标志物的基础上绘制了五脏色区分布图(如图3),肝区(GQ)上界为左眼及外延线,右界为右眼角口角连线[22]。李江帆结合《说文解字注》和《灵枢·五色》,在自然标志物的基础上,从文字学角度对色部(“明堂”“阙”“庭”“蕃”“蔽”)在头面部的位置进行了界定[1]。陈伏兵提出了用模块二维主成分分析方法(modular two dimensional principal component analysis,M2DPCA)对图像矩阵进行了分块,用于人脸识别的方法[23]。蔡艺芳结合《素问·刺热篇》和M2DPCA建立面部坐标体系(如图4),将面部分为30个矩阵模块,肝区模块为GL1,GL2,GL3,GL4[24]。高也陶根据《灵枢·五色》和前人总结成果结合解剖标志,制定了面部脏腑肢节图(如图5)[14]。唐旖旎等使用望诊仪采集186例胃部疾病的患者和60例正常组人群的面部图片,经统计软件发现,2组人群胃区色部参数明显不同,该研究色部划分出自《灵枢·五色》,以明代蒋示吉和当代高也陶制定[25]。
图3 五脏色区分布图
图4 面部坐标体系图
图5 面部脏腑肢节图
4 MTCNN人脸检测算法
随着计算机视觉领域的深入发展,其研究热点之一的人脸检测技术已经日趋成熟,作为人脸识别的重要阶段,目前已经广泛应用于机场、高铁站、火车站等人口密集场所,并在监控、追踪、自动驾驶等学术研究领域炙手可热。其中,基于深度学习的人脸检测方法已成为现阶段研究人员研究的重点之一。Multi-task Cascaded Convolutional Networks(MTCNN)人脸检测[26-28]算法是目前效果最好的人脸检测和人脸特征点定位算法之一,能够通过深层网络提取人脸特征。该方法不仅具有速度快等特点,且在光照变化、部分遮挡和人脸转动的情况下也能得到较好的人脸检测结果。该人脸检测算法是通过构建级联架构来整合多任务的卷积神经网络来实现的,主要由3个网络结构组成,即P-Net、R-Net、O-Net,其网络结构如图6所示。
第一阶段Proposal Network (P-Net),该网络结构主要由全卷积神经网络构成,通过层数较少的CNN网络结构可以快速获取候选可能包含人脸的窗体,此时的候选人脸窗体数量较多,这一阶段属于粗检。
图6 深度学习-Multi-task Cascaded Convolutional Networks(MTCNN)网络结构
第二阶段Refine Network (R-Net),相比P-Net网络结构增加了一个全连接层,通过加深的CNN网络结构获取候选人脸窗体,可以丢弃大量的重叠窗体和非人脸窗体,这一阶段属于细检,此时图像中大部分人脸的位置可以得到。
第三阶段Output Network (O-Net),该网络结构层比R-Net层又多了一层卷积层,通过进一步使用更深的CNN网络结构,去除不符合条件的候选人脸窗体,保留符合条件的候选人脸窗体,同时对5个人脸面部关键点进行定位。
最终,通过构建级联的P-Net、R-Net、O-Net网络,实现人脸的进一步精确检测与定位,获取人脸在图片中的位置以及关键点的位置。
5 基于高血压病肝火亢盛证的色部位置界定
本文基于高血压病肝火亢盛证利用人脸识别技术对肝的色部进行定位。高血压病是以体循环动脉压增高为特点的临床综合征,最早属于中医学“脉胀”,后多属于“眩晕”“头痛”范畴。本病与血脉直接相关,《黄帝内经》认为“诸风掉眩,皆属于肝”,高血压病与肝关系密切。《素问·刺热篇》:“肝热病者,左颊先赤”。从目前文献资料来看,高血压病肝火亢盛证人群分布较其他证型更为广泛,相较其他证型具有病情较轻、病程较短,血压变异规律与正常生理血压变化较为接近,靶器官损伤与其他证型相比较轻的特点[29-35],这可能与疾病由邪实为主向虚实夹杂再向正虚为主的发展过程相关。面部色诊的改变具有早期诊断的功效,疾病发生的极早期即可先见于色。《灵枢·邪气脏腑病形》:“正邪之中人也,微先见于色,不知于其身,若有若无,若亡若存,有形无形,莫知其情。”《灵枢·邪气脏腑病形》:“十二经脉,三百六十五络,其血气皆上注于面而走空窍”,人体颜面部为十二经脉三百六十五络汇聚的地方,精气、血气外荣的部位,能迅速、直接反映人体精气、血气的变化。疾病在尚轻浅不易发觉的阶段,即可显现于颜面气色。与中医色诊吻合度高且研究意义重大。
《素问·刺热篇》:“肝热病者,左颊先赤”,明确指出了肝发生热病时,观察对象应为人体面部,色部为左颊。如何对左颊部进行定位?人的面部大小宽窄不一,如何设计出适合普遍适用的位置界定?本文在观察了112例高血压病肝火亢盛证、118例高血压病非肝火亢盛证、110例正常人面部特征的基础上,结合人体特点和计算机自动化特点,经过摸索首次利用MTCNN人脸检测算法,在病证结合的基础上提出了高血压病肝火亢盛证的色部界定法,以左侧瞳孔直下与左侧鼻翼水平交界处为原点,提取与面部成比例的皮肤色块,基于该色部定位法进行的高血压病肝火亢盛证的色诊诊断模型准确率为85.24%,具有快速简捷、自动识别、自动定位、精准度高、个体化强等特点(见图7)。
图7 Multi-task Cascaded Convolutional Networks(MTCNN)人脸检测算法皮肤块提取流程
5.1 人脸检测
通过MTCNN人脸检测算法定位出人脸位置,以及眼睛中心点(x1,y1)(x2,y2)、鼻尖中心点的位置(x3,y3)(如图8)。
图8 人脸检测 图9 构建坐标系
5.2 人脸转正
根据双眼中心点定位坐标,构建计算坐标系(如图9)。通过反tan公式如下(1)所示,计算两眼中心点偏转角度,然后旋转图片使得两眼中心点在同一水平位置(如图10),双眼在同一水平线转正后的人脸。
角度
(1)
人脸转正后,双眼、鼻尖的坐标在原图上也会相应改变。通过旋转角度计算旋转矩阵以及仿射变换后,获得旋转后的双眼以及鼻尖坐标(x′1,y′1)(x′2,y′2)(x′3,y′3)(如图11)。图4示,根据新坐标以及公式(2),计算眼睛与鼻尖之间的水平宽度w,以及双眼与鼻尖的垂直高度h(如图12)。
5.3 提取皮肤块
为适应不同人皮肤块的位置提取需求,故选择(图13)反斜线标示皮肤块,该皮肤块既可以避免在计算机自动化提取时提取不必要的鼻子侧,也可以避免提取到上侧眼袋以及左侧脸轮廓之外。该位置具体位于左眼向左平移3/4个W,向下移动1/2个h为开始位置坐标,即(px1,py1),计算公式如下(3),左眼向下移动5/4个h为终点位置坐标,即(px2,py2),计算公式如下(4)。此部分即作为选择的人脸左侧皮肤块,人脸右侧皮肤块同样也是如此计算,与左侧人脸皮肤块相对称。
5.4 单例示范
图14示,为使用深度学习MTCNN网络模型,首先对原始人脸数据检测定位,然后进行人脸转正,最后根据需求进行色部位置的界定。
图14 单例示范
人工智能在计算机图像视觉领域发展迅速,表现突出。本文首次在病证结合的基础上利用MTCNN人脸检测算法提出了高血压病肝火亢盛证的色部界定法,在提取过程中其皮肤块大小因人而异,体现了中医同身寸、自然标志取位法的个体化思想,具有快速简捷、自动识别、自动定位、精准度高、个体化强的特点。随着人工智能的发展,中医特色的望闻问切都将可能实现中医客观化诊断,为建立中医特色动态、灵活的客观化诊疗体系,将是探索解决中医发展科学化问题的重要方法之一。