基于神经网络的小细胞肺癌智能辨证研究
2022-04-28臧晓彤张培彤
臧晓彤,张培彤
中国中医科学院广安门医院肿瘤科,北京 100053
小细胞肺癌(small cell lung cancer,SCLC)是一种神经内分泌起源的高度侵袭性癌症,与吸烟密切相关,有60%~65%的患者会伴有转移性疾病[1]。SCLC占所有肺癌发病的15%,且目前治疗方案有限,预后较差,无论在临床试验还是真实世界的研究中各类治疗方案都未能取得显著效果[2]。临床研究显示,中医药的介入能够有效减轻SCLC放化疗的不良反应、改善症状及生存质量、提高治疗效果[3-6]。辨证论治是中医临床实践的核心,而目前传统的中医辨证主观性强,对比性及可重复性差,交流学习及经验推广难度大,因而借助现代信息技术进行准确的辨证对提升SCLC中医辨证效率及精度具有重要意义。
近年来,信息技术尤其是人工智能在中医智能辨证领域中已取得一定成果[7]。人工神经网络是一种模拟大脑神经元细胞功能传递信息的模型,以网络拓扑为理论基础模拟人脑对复杂信息的处理模式,具有高容错性、智能性等特征,已在肺癌的西医基础研究及临床诊治中发挥了重要作用[8]。因此,本研究采用人工神经网络算法构建SCLC患者中医智能辨证模型,以期为提高SCLC中医临床诊断效率及精度提供参考。
1 资料
1.1 一般资料纳入病例为2020年9月1日至2021年2月28日期间中国中医科学院广安门医院肿瘤科的105例病理确诊为SCLC的患者。患者平均年龄61岁,男性占比72%,女性占比28%,局限期占比45%,广泛期占比55%。本研究经中国中医科学院广安门医院伦理委员会审查批准(2020-071-KY-01)。
1.2 诊断标准西医诊断标准:采用中华人民共和国卫健委医政医管局发布的《原发性肺癌诊疗规范(2018年版)》[9]中的SCLC诊断标准。
中医证型诊断标准:参考中医证候分层诊断标准[10-11],将八纲辨证、脏腑辨证、气血津液辨证相结合,借助证素理念,采用单证的研究方法,将证候分层至不能再进一步划分。一级诊断:虚证、实证,是纲领性证候,区分出证候的虚实类别。二级诊断:根据病位的外内浅深区分表里,具体为表虚证、里虚证;表实证、里实证。三级诊断:在二级诊断的基础上加气、血、阴、阳、津、液、精等病性证素区分证候的基本类别,包括气血津液辨证和寒热辨证两部分内容。四级诊断:在三级诊断的基础上加上病位证素。
1.3 纳入标准①符合上述SCLC诊断标准;②就诊时无其他影响症状表现的疾病。
1.4 排除标准①有其他恶性疾病;②既往有其他恶性肿瘤病史;③认知障碍或依从性差,不能配合量表评价者。
2 方法
2.1 调查方法采用横断面调查法,由中医肿瘤专业的硕士研究生对就诊的研究对象进行现场调查,收集各病症信息,根据上述中医证型诊断标准判断单证证型,一个患者可对应多个单证,并经肿瘤科专家导师修正。
2.2 症状术语规范方法病例中的中医症状,采取黎敬波主编的《中医临床常见症状术语规范》[12]的症状描述,采用课题组时美伶[13]研究的相似症状归类法进行整理,将病例涉及症状进行标准化后纳入症状术语库。
2.3 建模方法采用Excel 2016建立数据库,将症状和单证分别整理为二分类变量,“有”赋值为“1”“无”赋值为“0”。利用SPSS 23.0软件,建立基于人工神经网络算法的SCLC患者中医智能辨证模型。软件按照73的比例自动随机拆分数据为训练集和验证集,建立神经网络模型,并计算模型受试者工作特征曲线(receiver operating curve,ROC)下面积(area under curve,AUC)以评估模型优劣。
3 结果
3.1 频率分析对105例患者的1 729条症状表现进行整理,对标准化后的77个中医症状进行频率分析,频率大于20%的26个典型症状见表1。
表1 SCLC患者典型症状分布表
对按照分层诊断辨证方式得出的47个单证进行频数统计,结果见表2。
表2 SCLC患者单证分布表
出现频数最高的前五种单证诊断的关键症状分布,见表3。
表3 SCLC患者高频单证关键症状分布表
3.2 智能辨证模型对47个单证构建神经网络模型(图1),隐藏层有18个神经元节点。
图1 神经网络模型示意图
训练集总准确率达91%,验证集总准确率均达92.6%,模型平均AUC为0.842,见表4。
表4 SCLC患者智能辨证模型结果
4 讨论
SCLC可归于中医学“咳嗽”“胸痛”“咯血”“肺积”等范畴,其病因病机复杂,在进行中医临床辨证之前需要了解其中医证型分布特点。研究表明,SCLC中医证候以虚证为主,兼以虚实夹杂,痰、气、血的异常在SCLC疾病发展过程中有重要意义[14]。证候是疾病发展过程中某一阶段的病理概括,准确的辨证是中医临床诊断的核心。证素[15]是构成中医证候的基本要素,它包含病位证素、病性证素,病位和病性证素组合成单证,临床上患者常表现为多个单证的复杂组合。因此,本研究以单证的组合作为诊断结果,能够全面反映患者病情,且为进一步的量化诊断研究工作奠定了基础。
人工神经网络[16]是在模拟人脑的信息处理机制的基础上建立起来的一种非线性动力系统,具有快速的数据处理能力,且能够通过对样本的学习,自动提取隐藏规律,并根据这些规律,对新样本进行自动归类。中医临床辨证是通过大量症状表现来判断一种或几种证候,临床经验的积累某种程度上等同于在人脑中建立起症状与证候之间的非线性映射关系,因此,人工神经网络的数据处理方式十分适用于复杂的中医辨证逻辑。
本研究收集的SCLC患者病历信息中,出现频次排名前10位的症状依次是脉沉、舌紫暗、咳嗽、面色少华、咳痰、干咳少痰、唇甲紫暗、脉细、痰白、痰黏稠,其中脉沉主里证,是所有SCLC患者的共性特征。舌紫暗、唇甲紫暗说明有瘀血内结,咳嗽、咳痰等症状是痰饮阻滞而肺气上逆的表现,面色少华、脉细则意味着患者气血不足。结合单证的分布特征来看,SCLC患者表现出虚实夹杂以实证为主的临床表现,这同多数患者无法手术而荷瘤生存的状态有关,病灶的存在导致肺部局部症状严重,痰瘀久结无法消除,然而细究其疾病的本质还是正虚,在临床治疗时不可一味祛瘀化痰而忽略了补虚的重要性。从出现频率最高的5个单证中各核心症状的占比统计可以看出,核心症状也有主次差异,如果能对每个单证对应的核心症状赋予权重,并由此计算单证得分,可以为未来量化的智能辨证提供依据。
本研究通过人工神经网络构建出了整体准确率较高的SCLC中医智能辨证模型,但对于具体单证,则有部分准确率不高,这是由于样本量小以及所涉及单证较多但分布不平衡造成的。目前该模型只是根据患者各项症状的有无来推断单证组合,还无法对症状主次、严重程度进行量化,故而也无法衡量各单证所占的比重,尚不能够反映疾病的全貌,笔者将在后续研究中继续探索改进。
综上所述,通过人工神经网络算法,能够形成准确率较高的中医智能辨证模型,为SCLC中医临床诊断提供参考依据。今后可通过大样本、多中心的研究,纳入足够多的样本数据,优化算法,进一步完善模型,为其在临床上的实际应用奠定基础。未来通过规范的症状量表的研究,可对本研究的各单证进一步量化赋予权重,使中医临床辨证更加精准客观,从而实现针对性处方施治及疗效评价,如此,SCLC的精准中医诊疗未来可期。