100例慢性咽炎患者语音信号的证型特征分析※
2015-04-08王忆勤郑荣华陈春凤颜建军
董 伟 王忆勤 郑荣华 陈春凤 颜建军 胡 赣
(上海中医药大学附属龙华医院耳鼻咽喉科,上海 200032)
慢性咽炎是耳鼻咽喉科最常见的疾病之一,属中医学喉痹范畴。喉痹是指因外邪壅遏肺胃或脏腑虚损、咽喉失养所致以咽痛或咽部不适感,咽部红肿,或喉底有颗粒状突起为主要特征的咽部疾病[1]。中医声诊是中医四诊方法中闻诊的一部分。本研究以100例慢性咽炎患者为研究对象,以中医声诊理论为基础,结合现代声学技术,采用华东理工大学与上海中医药大学合作研发的中医闻诊采集系统软件采集分析慢性咽炎患者语音信号,为慢性咽炎辨证分型提供更客观的数据和方法,同时对中医声诊的客观化和标准化研究也具有重要意义,结果如下。
1 资料与方法
1.1 病例选择
1.1.1 诊断标准 慢性咽炎诊断标准参照《中医耳鼻咽喉科学》[2],中医证型诊断标准参照《中药新药临床研究指导原则:第1辑》[3]。
1.1.2 纳入标准 年龄18~60岁;自愿接受本研究者。
1.1.3 排除标准 不符合以上诊断标准及中医证型标准者;有鼻部、咽喉部、颈部手术史者;临床资料缺失严重者。
1.2 一般资料 本研究病例100例均为2013-07—2013-12就诊于上海中医药大学附属龙华医院耳鼻咽喉科门诊患者,男、女各50例;中医证型:肺脾气虚型34例,男21例,女13例;痰热蕴结型38例,男23例,女15例;阴虚肺燥型28例,男15例,女13例。同期采集100例上海中医药大学正常教职员工声音样本,为正常对照组,男、女各50例。2组性别、年龄比较差异无统计学意义(P>0.05),具有可比性。
1.3 研究方法
1.3.1 采集软件 采用华东理工大学与上海中医药大学合作研发的中医闻诊采集系统软件进行语音样本采集。该软件有自动领读元音和保存语音的功能,界面针对中医声诊设计,操作简便。
1.3.2 采集方法 采集环境为安静室内,外界噪声<30 db,受试者采取自然舒适的坐姿,带上耳麦一体式话筒,口距耳麦话筒约10 cm,设定采集软件的采集声道为单声道,采样频率为16 kHz,量化位数16位(16Bit)。由受过专业培训的采样人员指导受试者跟随采集系统朗读元音[a:],持续平稳发音1~3 s。将所采语音样本以WAV文件形式保存。语音采集同时,采用上海中医药大学中医四诊客观化信息研究实验室制订的“中医声诊信息采集量表”,进行受试者基本信息、病史信息及舌脉资料等相关信息的采集。
1.3.3 中医证候分类 由2名具有副高以上职称的中医医师参考以上分类标准对所采集病例的病史信息量表进行判读并辨证分型,依据辨证结果进行病例分组。
1.3.4 数据处理及分析 运用小波包分解方法,将慢性咽炎患者和正常人的语音信号进行分析,提取小波包分解第3层的能量特征和熵值特征。
1.4 统计学方法 采用两独立样本t检验对2组样本的能量特征和熵值特征进行差异性分析;同时采用Kruskal-Wallis H检验进行多类样本组间的差异性分析。
2 结果
2.1 慢性咽炎组与正常对照组语音信号能量特征和熵值特征比较 见表1。
表1 慢性咽炎组与正常对照组语音信号能量特征和熵值特征比较 ±s
表1 慢性咽炎组与正常对照组语音信号能量特征和熵值特征比较 ±s
与正常对照组比较,*P<0.05,**P<0.01
频率段 慢性咽炎组(n=100)能量特征 熵值特征正常对照组(n=100)能量特征 熵值特征0~1 kHz 0.062 7±0.146 32 0.802 7±0.521 75**0.038 2±0.053 36 1.064 5±0.352 88 1~2 kHz 0.077 7±0.252 00* 0.929 6±0.803 98 0.012 0±0.015 70 0.875 6±0.329 10 2~3 kHz 0.007 4±0.023 18* 0.597 4±0.769 37* 0.000 6±0.000 76 0.298 1±0.244 55 3~4 kHz 0.002 3±0.008 45* 0.338 0±0.538 70* 0.000 2±0.000 34 0.137 8±0.179 75 4~5 kHz 0.000 7±0.002 51* 0.177 9±0.356 00** 0.000 0±0.000 11 0.025 4±0.074 93 5~6 kHz 0.000 3±0.001 03** 0.124 1±0.279 38* 0.000 0±0.000 03 0.009 7±0.024 25 6~7 kHz 0.000 1±0.000 71 0.063 0±0.180 13* 0.000 0±0.000 01 0.001 4±0.004 63 7~8 kHz 0.000 0±0.000 15 0.011 0±0.063 99 0.0000±0.000 00 0.000 0±0.000 00
由表1可见,2组能量特征比较,在1~6 kHz频率段慢性咽炎组患者能量特征大于正常对照组(P<0.05,P<0.01);2组熵值特征比较,在0~1 kHz频率段慢性咽炎组患者熵值特征小于正常对照组(P<0.01),在2~7 kHz频率段慢性咽炎组患者熵值特征大于正常对照组(P<0.05,P<0.01)。
2.2 慢性咽炎组各型语音信号能量特征和熵值特征比较 见表2。
表2 慢性咽炎组各型语音信号能量特征和熵值特征比较 ±s
表2 慢性咽炎组各型语音信号能量特征和熵值特征比较 ±s
频率段 痰湿蕴结型(n=38)能量特征 熵值特征肺脾气虚型(n=34)能量特征 熵值特征阴虚肺燥型(n=28)能量特征 熵值特征0~1 kHz 0.067 6±0.122 06 0.894 0±0.522 78 0.049 1±0.173 33 0.582 8±0.498 35 0.048 6±0.098 03 0.784 8±0.503 87 1~2 kHz 0.076 1±0.148 21 1.022 0±0.797 92 0.071 1±0.340 30 0.618 4±0.742 34 0.033 4±0.055 12 0.852 7±0.720 13 2~3 kHz 0.008 7±0.017 27 0.666 5±0.791 10 0.006 5±0.030 03 0.355 9±0.670 05 0.003 1±0.007 06 0.486 0±0.650 79 3~4 kHz 0.003 1±0.006 78 0.411 4±0.578 52 0.002 6±0.013 03 0.197 3±0.504 66 0.000 9±0.002 15 0.275 2±0.452 34 4~5 kHz 0.001 0±0.002 75 0.227 9±0.393 83 0.000 7±0.003 53 0.114 9±0.363 95 0.000 4±0.000 98 0.138 3±0.299 90 5~6 kHz 0.000 4±0.000 99 0.165 4±0.303 13 0.000 2±0.001 06 0.081 7±0.271 97 0.000 1±0.000 33 0.070 7±0.167 39 6~7 kHz 0.000 1±0.000 20 0.076 3±0.133 82 0.000 2±0.001 10 0.054 3±0.243 35 0.000 0±0.000 08 0.032 3±0.064 85 7~8 kHz 0.000 0±0.000 02 0.006 5±0.015 99 0.000 0±0.000 24 0.018 2±0.095 93 0.000 0±0.000 01 0.001 0±0.00 396
由表2可见,除2~3 kHz、6~7 kHz频率段外,3个证型能量特征比较差异均有统计学意义(P<0.05),痰湿蕴结型>肺脾气虚型>阴虚肺燥型;在0~2 kHz频率段,3个证型熵值特征比较差异有统计学意义(P<0.05),痰湿蕴结型>阴虚肺燥型>肺脾气虚型。
3 讨论
慢性咽炎其病名最早见于帛书《五十二病方》。《素问·阴阳别论》指出“一阴一阳结谓之喉痹”,《丹溪心法·卷四》指出“喉痹大概多见痰热”,提出痰热是喉痹的病因。本病虽不是严重的器质性疾病,但其发病率每年都在升高,尤以中青年多见,其咽部的不适症状给人们的日常生活和工作带来了很多影响。因此,慢性咽炎的诊断和治疗非常重要。目前,诊断慢性咽炎的主要依据是咽部不适症状及体征,缺乏一定的客观依据,本研究采用传统声诊理论作为指导,现代声学仪器进行客观检测,寻找慢性咽炎患者的语音特征,为运用声诊进行慢性咽炎的中医辨证分析提供客观数据。
本研究在中医声诊的传统理论指导上,应用中医声诊检测系统,结合小波包分析,对100例慢性咽炎患者的语音信号进行客观化采集与分析,提取了小波包能量和熵值2个特征值,小波包能量特征代表了信号在时域和频域的能量信息,小波包Shannon熵值主要用来度量信息的规律性,反映声音不同频段的信号的有序化程度。结果发现:①慢性咽炎患者和正常人比较,语音信号的能量特征和熵值特征在多个频段均有统计学意义(P<0.05),在1~6 kHz频率段,慢性咽炎组能量特征大于正常对照组;在2~7 kHz频率段,慢性咽炎组熵值特征大于正常对照组。这说明慢性咽炎患者与正常人的语音信号在除了很低和很高的频率段以外的大部分频率段上的能量特征和熵值特征均有显著差别。慢性咽炎为咽喉部炎症病变,咽喉部为人体重要发音器官之一,因此慢性咽炎患者在声音上也有声嘶等改变,而正常人阴平阳秘,语音上同样也表现为发音和谐、气息平稳等特点,所以2组语音的声学参数有差异性表现。这对凭借语音特征信息来辅助慢性咽炎临床诊断具有初步意义。但2组熵值特征在低频段和中高频段的分布有不同趋势,反应了2组在不同频率段其语音信号的规律性有不同的分布特点,其差异表现的具体医学理论解释则有待于进一步扩大研究,今后可增加病例数和改进语音分析方法来进一步深入探索。②慢性咽炎3个证型能量特征比较,除2~3 kHz、6~7 kHz频率段外的所有频率段均有统计学意义(P<0.05);3个证型熵值特征比较,在0~2 kHz频率段有统计学意义(P<0.05),各型能量和熵值特征均呈现出痰湿蕴结型最高,高于阴虚肺燥型、肺脾气虚型。中医理论认为,听辨患者言语气息的高低、强弱、清浊、缓急变化及咳嗽、呕吐等脏腑病理变化所发出的异常声响,可以判断疾病的寒热虚实性质。《景岳全书》指出“声音出于脏气,凡脏实则声弘,脏虚则声怯”,语声高亢、宏亮有力,声音连续者,多属阳证、实证、热证,是阳盛气实、功能亢奋的表现。语声低微细弱,懒言,声音断续,或前重后轻,多属阴证、虚证、寒证,多为禀赋不足、气血虚损所致。痰湿蕴结型为实证,肺脾气虚型和阴虚肺燥型均为虚证,因此语音信号的能量特征表现为痰湿蕴结型较其他2个虚证证型高。痰湿之邪相互交叉蕴结,临床表现多样多变,因而其语音特征的混乱程度相对较高,规律性小。此结果为慢性咽炎的辨证诊断进行了较为客观的初步依据,也为传统中医闻诊中闻声可辨虚实提供了现代声学依据。声音是人体生命活动的外在证候之一,一定程度上反映了脏腑功能活动,气血津液盛衰,以及人的情志思想动态。五声、五音为五脏所主,认为五脏各有正声,以合乎五音。而单凭听觉来诊察患者声音的变异,以辨别邪正虚实与脏腑病变,这对于辨证结果的准确性有着不确定因素,加之个人的听觉差异,临床水平高低,以及听诊所处环境影响等,会给诊断带来一定困难。中医学者在声诊的现代研究方面也取得了一些研究成果,运用传统声诊理论与现代声学技术结合,研究慢性咽炎的辨病和辨证,可以辅助该病的临床诊断,推动中医声诊检测系统或仪器在耳鼻咽喉科的应用。同时,学习国内外声诊研究的方法和思路,有助于我们更加深入地进行中医现代化声诊研究。声诊这种无创简便的诊疗手段将是未来诊断学发展的趋势,也将为耳鼻咽喉科发展现代诊疗仪器和技术带来帮助。
[1] 熊大经,刘篷.中医耳鼻咽喉科学[M].9版.北京:中国中医药出版社,2012:149.
[2] 王士贞.中医耳鼻咽喉科学[M].北京:中国中医药出版社,2003:117.
[3] 中华人民共和国卫生部.中药新药临床研究指导原则:第1辑[S].北京,1993:314-317.