APP下载

基于“辨证元”模型的辨证系统诊断准确率影响因素探讨

2010-10-12孙晓生江启煜

湖南中医药大学学报 2010年1期
关键词:红棉证素区分

孙晓生,江启煜

(广州中医药大学,广东 广州 510405)

“辨证元”模型[1]是一种基于证素辨证体系[2]的新型辨证计量诊断模型,它将若干个辨证因子(症状﹑体征或舌脉)组成一个能够代表证型诊断性质(病位与病性)的辨证单元,并以辨证元为最小的运算单元进行证型的计量诊断。朱文锋等认为,辨证分析的过程是确定其病位和病性等病理本质——证素,并作出证名诊断的思维认识过程[2]。其认为脏腑辨证﹑六经辨证等所有的辨证过程均可以概括为辨病位和病性两大证侯要素,任何一种证型都能通过不同的证侯要素(病位﹑病性等)组合而确定[2]。其中病位证素包括心、神[脑]、肺、脾、肝、肾、胃等 19项,病性证素包括 (外)风、寒、暑、湿、血虚、阴虚、亡阴、阳虚等31项[3]。即任何一种证型都能运用一组证素属性值(病位﹑病性等的值)来确定。由于每一个辨证因子都能体现一定的证素属性值,如果若干个辨证因子组合起来,使得它们的证素属性值互相补充,完全满足某证型的所有证素属性值,它们组合起来能够反映该证型的病理状态,即认为这群辨证因子构成了该证型的一个辨证单元,即辨证元[1]。基于“辨证元”模型现已成功研制出“红棉一号”计算机智能辨证系统,该系统并非“专家系统”,无需依赖临床病案或专家知识构建诊断知识库,它能够直接架构于标准化的中医知识体系(例如《中医诊断学》教材)。本文阐述使用“红棉一号”对教材样本和临床样本的测试效果,并尝试探讨影响“辨证元”模型准确性的因素,以进一步改进和完善该模型和“红棉一号”。

1 资料与方法

1.1 研究对象

测试的临床样本为随机抽取的共850例诊断结果属于脏腑证型的临床病案,它们分别来源于广州中医药大学第一附属医院﹑深圳市中医院﹑深圳市宝安中医院﹑顺德中西医结合医院,样本时间跨度为2006年3月至2009年1月,涵盖疾病中医病种达48种,西医病种达326种,疾病范畴跨度为内科所有系统,证型跨度为所有脏腑证型。临床样本的证型分布如表1所示。

表1 临床样本的证型分布(例,%)

1.2 研究方法

1.2.1 准确性描述指标 准确性描述指标包括:可信系数﹑区分系数﹑证解系数﹑吻合率﹑准确率。“红棉一号”使用“可信系数”与“区分系数”描述辨证结果的准确性,当系统辨证分析完毕时,这两个系数将在系统主界面的底部显示以供用户参考,“可信系数”表示辨证结果的绝对准确性,它体现疾病证侯的“典型性”;“区分系数”表示辨证结果的相对准确性,它体现疾病证型的“单纯性”。当“区分系数”低于一定的阈值时,系统会同时显示主证型﹑次证型,甚至第三证型,以提醒用户当前输入的辨证因子群可同时辨证为多个证型。“可信系数”与辨证因子群的离散程度呈负相关,与辨证元群的最高权值及独立辨证因子群的总权值呈正相关;“区分系数”与结果证型之间的区分程度呈正相关。设辨证因子群构成不同证型的辨证元个数为n,主证型的辨证总权值为sa,次证型(如果存在,并且不是主证型的父证型)的辨证总权值为sb,第三证型(如果存在,并且不是主证型和次证型的父证型)的辨证总权值为sc,则辨证因子群的离散程度为1/(1+e-n)(n≥1),则证型之间的区分程度分别为﹑。当辨证因子群的离散程度低于一定的阈值,并且结果证型之间的区分程度高于一定的阈值时,本系统认为结果具有可信性才继续进行辨证分析。证解系数是系统诊断出的证型数量,取值通常为1~3(主证型﹑次证型﹑第三证型),当各种原因导致系统无法辨证时,证解系数为零。

吻合率是指所有样本中“红棉一号”诊断的主证型与原病案一致的比例;所有病案经过我校中医诊断学和中医内科学专家的二次复核,如果认同“红棉一号”辨证结果中判定的主证型,则认为系统辨证结果准确,否则认为系统辨证结果不准确,准确率是指本系统辨证结果准确的比例。当证解系数大于1且区分系数较低时,系统辨证结果不准确可能是相对的,因为此时病案样本的正确诊断结果可能不在系统诊断的主证型中,而在次证型或第三证型中。

1.2.2 测试与统计 本测试方法统一使用“红棉一号”的直接辨证模式,将病案样本的辨证因子(症状﹑体征﹑舌脉等)直接输入系统使其进行全自动的辨证分析。“首要症状”等加选参数选项均不作选择,即设置为空值;设置辨证阈值等于1(系统默认值);设置证型区分阈值等于0.1(系统默认值);其余用户参数均为系统默认值。系统分析完毕后将其辨证结果保存至数据库,并使用SPSS 13.0进行统计分析。

2 结果

2.1 样本吻合率与准确率总体情况

在4个测试的医疗机构临床样本中,与原病案诊断结果的吻合率均在90%以上,其中最高为顺德中西医结合医院,吻合率达96.0%,最低是深圳市保安中医院,吻合率为91.5%。经过我校中医诊断学和中医内科学专家的二次复核,确认样本总体准确率高达95.1%,其中最高为深圳市中医院,样本准确率高达96.5%。可信系数总体平均值为4.89,在可信系数区间频数比例中,仅有1.3%的样本可信系数小于1,在此情况下表明辨证信息不足,导致系统无法辨证。区分系数总体平均值为9.19,区分系数大于1的频数比例占90%以上,表明系统对非合适证型具有良好的“排除性”。在总体样本中,证解系数等于1的比例在95%以上,表明对于大部分的样本,系统都仅有一个证型解;对于少数的样本,系统出现了两个或三个证型解,即除主证型外,还有次证型甚至第三证型。见表2。

2.2 系统辨证结果与病案样本诊断结果不吻合原因

系统辨证结果与原病案样本诊断结果不吻合的原因分布如表3所示,其中以系统辨证错误为主要原因,占样本总体的4.9%;原病案辨证错误 (误诊)占的比例为0.7%;其它原因主要是指原病案诊断证型术语不规范,但尚不算辨证错误的情况,占样本总体的0.9%。在顺德中西医结合医院组,原病案与系统对某个样本同时辨证错误,并具有相同辨证结果,因此该组样本的系统辨证错误率高于非吻合率。

2.3 系统辨证失误原因

系统辨证不准确原因统计数据如表4所示,总体样本误判率为4.9%。导致系统辨证不准确的原因包括可信系数低于系统阈值﹑区分系数低于系统阈值以及其它原因,它们分别占总体样本的2.2%﹑2.3%﹑0.3%。系统辨证不准确的主要原因是可信系数低于系统阈值与区分系数低于系统阈值,前者由于辨证信息不足使系统无法辨证;后者由于输入的证侯群可同时辨证为多个证型,并且正确的证型不在判定的主证型中所致,但并不代表不可能在次证型或第三证型中,因此此时系统的辨证结果错误具有相对性。

表2 样本吻合率与准确率总体情况

表3 系统辨证结果与病案样本诊断结果不吻合原因 (%,例)

表4 系统辨证失误原因(%,例)

3 讨论

3.1 非吻合性原因分析

3.1.1 系统自身辨证错误 在总体和各组样本中,系统自身辨证错误均为诊断结果与原病案不吻合的主要原因,此情况通常出现于原病案辨证准确而系统辨证错误。系统自身辨证错误主要包括证型多义性导致主证型不准确﹑辨证信息不足导致系统无法辨证﹑以及诊断结果超出系统工作范围等。中医辨证是一个复杂的巨系统[4],其复杂性主要来源于系统的开放性和规模性﹑系统结构的多层次性﹑系统组成关系的多样性和非线性﹑系统的有限理性﹑非理性和不确定性﹑系统的涌现性以及系统的动态变化等[5]。在系统组成关系多样性的情况下,输入的证侯群可能同时辨证为多个证型,使系统判定的主证型难以把握。系统的有限理性决定了系统辨证域的有限性,系统的不确定性导致系统的辨证敏感性与辨证准确率矛盾,为保证系统的准确率,当辨证信息不足时,可信系数低于判定阈值,系统将会中断分析过程。

3.1.2 原病案辨证错误 中医辨证就是辨别疾病的证候,对人体生理、病理及其规律进行认识,对症状和体征进行综合分析、推理、判断,求得对疾病本质的认识[6]。这个认识过程由医疗人员的眼、耳、口、鼻、手等感觉器官,反射到大脑、思维这样一系列的心理活动;是模糊性的也是形象思维的表现形式;模糊性是中医的重要特点,也是正确把握疾病及其发展的重要方法[7]。临床辨证失误的主要原因包括辨病失误﹑四诊不详﹑错辨假象﹑以西医诊断为依据等[8]。在总体样本中,原病案辨证失误的虽然仅占0.7%,但表明在复杂的中医系统中,辨证错误在人工辨证和机器辨证中都是难以避免的。

3.1.3 临床证型术语不规范 临床证型术语不规范是除上述原因外导致系统与原病案诊断不吻合的其它原因。中医作为一门科学,其研究对象“证”的涵义必须是明确和肯定的。只有在明确的规范证候(名)基础上,才可以建立规范的诊断标准和疗效判定标准[9]。中西医学理论的交贯渗透、相互沟通,使当前中医诊断存在混乱,缺乏权威性。病证规范化还存在病、证、症等基本概念未完全统一的问题[10]。例如某病案样本中诊断为水肿病,证型为“脾肾两虚”,但根据《中医诊断学》[11]脏腑辨证部分和《中医内科学》[12]水肿病证型,并没有“脾肾两虚”的证型,只有“脾阳虚”﹑“肾阳虚”或“脾肾阳虚”证型。中医诊断术语丰富多彩,但并不规范,阻碍了中医标准化的发展和统一。

3.2 系统辨证失误原因分析

3.2.1 证型多义性 当区分系数低于一定的区分阈值时,表明输入的证侯群能同时辨证为多个证型,即判定的证型具有多义性。由于此时主证型﹑次证型﹑第三证型之间的区分程度较低,这些证型对输入的证侯群几乎具有相同的代表性和对应性,只要这3个判定的证型中出现一个专家判定的标准证型诊断结果,系统即在相对意义上判定准确。但由于统计时是以主证型是否准确为界定条件,因此仍将此部分样本归类于系统误判。如表4所示,区分系数低于系统阈值的样本占总体的2.3%,其中系统辨证为2个证型和3个证型的频数比率分别占1.6%和0.7%,在4组样本中,次证型与第三证型辨证准确比率之和均等于区分系数低于系统阈值的比率,表明系统在次证型或第三证型给出了正确的诊断结果,在相对意义上判定准确。按此计算,“红棉一号”的总体准确率将高达97.4%。

3.2.2 辨证信息不足 当证侯信息输入不足时,辨证因子无法构成任何一个证型的辨证元,辨证因子群的可信系数将会低于系统阈值,系统无法辨证。例如证侯群为“失眠﹑潮热﹑舌红少苔﹑脉细数”,此辨证因子群可辨证为“心阴虚﹑肝阴虚﹑肝阳上亢﹑肾阴虚﹑心肾不交﹑肝肾阴虚”等证型,仅能判断为阴虚之象,不能确定病位,无法构成辨证元。但若在“红棉一号”中加选“首要症状”这个参数,将其选择为“失眠”,系统即能准确辨证为“心阴虚”。

3.2.3 证型超出辨证域 证型超出系统辨证域是除上述原因外导致系统辨证失误的其它原因。“红棉一号”的辨证知识理论以《中医诊断学》中的脏腑证型为基础,系统辨证域中的证名和辨证范围取决于其标准的脏腑证型。由于《中医内科学》与《中医诊断学》在某些证型的命名和分类上尚存在一定差别,而且《中医内科学》的辨证思维是先辨病然后辨证,先定病名然后再分证型,《中医诊断学》辨证思维以辨证为主,无须辨病。因此在某些特定的情况下,所需判定的证型可能在系统辨证域外,超出系统的辨证范围,导致系统无法给出准确的辨证结果。

3.2.4 辨证元判定错误 辨证因子群是否能构成辨证元,取决于其是否唯一代表了某证型的诊断性质,这根本上与辨证知识域有关。辨证知识域包括标准辨证知识﹑经验辨证知识﹑统计辨证知识﹑发掘辨证知识等,它是经过充分的研究﹑统计﹑分析而确定的,因此发生这种错误的概率很小。在接受测试的所有样本中,尚未发现辨证元判定错误。即使假设存在这种错误,只需升级辨证数据库即可使系统重新准确判定辨证元。

“辨证论治”和“整体观念”是中医学的基本特点,“红棉一号”通过辨证元模型实现了两者的交融,其高度的准确率与稳定性表明该模型具有接近中医临床思维的优势。但由于中医学博大精深,中医辨证是一个复杂的非线性过程,“红棉一号”和辨证元模型在各方面尚存在一定缺陷,准确率和辨证能力仍有待进一步修改和完善。

[1]江启煜,孙晓生.中医辨证计量诊断新方法—辨证元[J].新中医,2009,11(41):4-6.

[2]朱文锋.创立以证素为核心的辨证新体系[J].湖南中医学院学报,2004,14(6):38-39.

[3]黄碧群,朱镇华.“证素”及其与相关概念的关系[J].中医研究,2005,18(6):6-7.

[4]钱学森,于景元,戴汝为.一个科学领域一开放的复杂系统及其方法论[J].自然科学,1990,13(1):3-10.

[5]戴汝为.系统学与中医药创新发展[M].北京:科学出版社,2008:130.

[6]桂宜坤,刘文莉.中医辨证失误与临床思维的关系[J].中医中药,2007,45(10):81-83.

[7]孔凡涵.从临床疑难病看中医辨证施治及思考 [J].光明中医,2007,22(3):37-38.

[8]孙建军.临床辨证失误的几种常见原因[J].国医论坛,1986,3(1):31-32.

[9]吕翠田.谈 “证素”与疾病证候规范化研究[J].中国医学研究与临床,2005,3(9):63-65.

[10]李 晶,赵莉娟.证的规范化研究临证意义及思路[J].中医药学刊,2003,21(6):938-939.

[11]季绍良.中医诊断学[M].北京:人民卫生出版社,2002:155-158.

[12]周仲瑛.中医内科学[M].北京:中国中医药出版社,2003:345-350.

猜你喜欢

红棉证素区分
你能区分平衡力与相互作用力吗
糖尿病前期中医证型及证素特点分析
2型糖尿病合并肥胖患者的相关危险因素和中医证素分析
基于因子分析及聚类分析的241例感染后咳嗽中医证素证型研究
边疆红棉又盛开
几许沧桑风雨过,昂然挺立映红棉。
教你区分功和功率
怎祥区分天空中的“彩虹”(一)
2016红棉中国设计奖召集令
《伤寒论》三阳三阴病证的证素辨证研究