人工智能自动识别胎儿颜面部超声标准切面的研究
2022-01-07刘中华王小莉吕国荣杜永兆2柳培忠2吴秀明何韶铮
刘中华,王小莉,吕国荣,杜永兆2,,4,柳培忠2,,4,吴秀明,何韶铮
1.福建医科大学附属泉州第一医院超声科,福建泉州362000;2.泉州医学高等专科学校母婴健康服务应用技术协同创新中心,福建泉州362000;3.华侨大学医学院,福建泉州362000;4.华侨大学工学院,福建泉州362000;5.福建医科大学附属第二医院超声科,福建泉州362000
前言
胎儿颜面部超声标准切面(Fetal Facial Ultrasound Standard Plane,FFUSP)在胎儿颜面部结构畸形筛查与诊断中发挥重要作用[1]。近年来利用人工智能(Artificial Intelligence,AI)实现了FFUSP的自动识别[2],但AI在超声图像质量控制及医生培训的应用尚少见报道[3-4]。本研究分析AI自动识别分类FFUSP在超声图像质量控制和医师规范化培训方面的价值。
1 资料与方法
1.1 研究对象
以妊娠20~24周正常FFUSP图像为研究对象,包括鼻唇冠状切面(Nasolabial Coronal Plane,NCP)、正中矢状面(Median Sagittal Plane, MSP)、经眼球横切面(Ocular Axial Plane,OAP)、非标准切面(Non-Standard Plane,N-SP)4个切面图像。图像按照用途分为标准集图像与实验集图像,分别用于AI模型训练、测试及评价不同经验医生与AI识别分类FFUSP能力。所有图像均来自于福建医科大学附属泉州第一医院超声图文工作站,使用仪器为GE Volusen E8超声仪及Philips EPIQ5超声仪。
图像纳入标准:①图像清晰,目标结构位于图像正中占据整个图像1/2以上,背景纯净无伪像;②图像内无叠加彩色血流图像,无测量卡钳、文字标识等人工注释;③产后证实胎儿无颜面部及其它结构畸形。图像排除标准:①由于孕妇肥胖、图像抖动等原因导致图像模糊、拖尾,目标结构显示欠清晰;②超声检查或产后证实胎儿异常。最终纳入标准集图像1 906张,实验集图像4 532张。
1.2 仪器与方法
本研究AI 模型使用局部二值模式(Local Binary Pattern,LBP)和梯度方向直方图(Histogram of Oriented Gradient,HOG)提取训练集图像纹理特征[5-6],通过支持向量机(Support Vector Machine,SVM)学习其纹理特征[7],实现FFUSP的自动分类,最后通过预测分类测试集图像评估模型(图1)。
图1 AI模型识别FFUSP流程Fig.1 Process of identifying FFUSP by AI model
实验集图像由产前超声专家以《中国胎儿产前超声检查规范》[8]为依据分为OAP 组、MSP 组、NCP组、N-SP 组(图2)。AI 模型构建成功后,由3 名仅完成住院医师规范化培训的医生组成的初级医生组、3名经过半年以上产科超声检查专科培训的医生组成的中级医生组及AI分别独立对实验集图像进行识别分类,比较分析初级医生组、中级医生组及AI 对FFUSP 各切面分类的敏感度、特异度、阳性预测值、阴性预测值、准确率,观察AI 与不同经验医生对FFUSP识别分类能力差别。
图2 FFUSP各切面超声图像Fig.2 Ultrasonic images of each kind of FFUSP plane
1.3 统计学方法
采用SPSS22.0软件进行统计学分析。计量资料用均数±标准差表示,符合正态分布,使用t检验或方差分析。计数资料以例(n)或率(%)表示,组间比较采用χ2检验。AI对FFUSP分类与专家分类的一致性分析采用Kappa检验。AI与初级医生、中级医生对FFUSP的识别能力比较采用McNemar检验,并比较相应ROC曲线下面积(AUC)。P<0.05为差异有统计学意义。
2 结果
2.1 一般资料
标准集图像1 906张,按8:2比例分为训练集和测试集;实验集图像4 532张。各图像集各切面分布见表1。
表1 各图像集各切面分布情况Tab.1 Distribution of each kind of plane in each image set
2.2 AI模型构建与测试结果
AI对测试集图像各切面分类的敏感度、特异度、阳性预测值、阴性预测值、准确率均达90%以上,与专家分类一致性强(P<0.001,表2)。
表2 AI对测试集各切面识别水平Tab.2 Recognition level of each kind of plane in test set by AI
2.3 不同级别医生与AI对FFUSP实验集识别能力比较
(1)中级医生对各切面识别能力均优于初级医生(P<0.05)。AI对FFUSP 各切面总体识别能力均优于中级医生与初级医生(P<0.05);AI 对NCP、MSP识别敏感度和特异度均优于中级医生(P<0.05),对OAP 识别敏感度优于中级医生(P<0.05),两者间特异度差异无统计学意义(P=0.125)(表3)。
表3 不同级别医生与AI对实验集各切面识别水平(n=4 532)Tab.3 Recognition level of each kind of plane in experimental set by doctors and AI (n=4 532)
(2)AI 对各切面识别水平与专家分类一致性强(P<0.05),k值分别为NCP:0.886、MSP:0.937、OAP:0.771。
2.4 AI与初级医生、中级医生、专家对FFUSP识别效率比较
AI对FFUSP实验集图像分类效率显著优于各组医生人工识别效率(P<0.001),专家与中级医生识别效率无显著差异(P=0.364),专家识别效率优于初级医生(P=0.012),见表4。
表4 实验集分类时间Tab.4 Time for classification of images in experimental set
3 讨论
医生在超声检查中对FFUSP 的准确识别对胎儿颜面部畸形筛查起到决定性作用,但不同经验的医生对超声切面的识别能力存在差异[9]。本研究中经过产科超声系统培训的中级医生对FFUSP的识别与分类能力明显优于未经系统培训的初级医生体现了这一差异。对超声医生进行规范化的专科培训能够明显提高超声医生对标准切面的识别能力,进而提高超声医生的检查水平[10]。进行超声图像质量控制亦能改善胎儿超声检查质量,整体提高检查的准确性[11],因此在临床工作中需要对超声医生进行高效率培训并对其所获取的超声图像进行质量控制。然而超声医生培训以及超声图像质量控制均是由人工进行,除了受到师资力量不足以及培训时间不足等因素影响[12-13],还极易受主观因素影响,并且耗费大量的人力物力,难以进行大范围的标准化专科培训及图像质量控制。
AI是计算机程序执行与人类智能相关行为如推理、学习、适应、感知和交互的能力。近年来AI技术逐渐应用于医学影像自动识别及疾病辅助诊断[9,14-17],并实现胎儿超声标准切面的识别与分类[18]。本研究利用AI对FFUSP进行识别分类以进行超声图像质量控制评价,采用基于传统手工特征串联加主流分类器的方法构建FFUSP识别分类模型。这一方法克服了卷积神经网络模型训练过程复杂、运算速度慢等问题,节省了时间、空间资源。结果表明AI分辨FFUSP各切面的准确率达90%以上,尤其MSP、NCP达到95%以上,与专家分类相比均有极强的一致性。当AI具有较高水准的分辨超声图像能力时,可辅助超声医生优化超声图像并提高诊断的准确性[14,19]。利用AI辅助教学能够提高超声医生整体素质[4]。本研究中AI对FFUSP的分类能力明显优于初级医生和中级医生,尤其对于结构复杂的MSP,初级医生与中级医生的识别水平均较低,而AI经过标准化训练后对该切面的识别水平明显高于两者。AI在效率上明显高于人工,对实验集的分类用时不到20 min,平均每张图像识别时间为0.21 s;而专家对同一实验集图像分类效率为每张图片2.73 s。实际工作中进行大规模胎儿超声图像采集和质量控制的工作量远远大于本实验集内所包含的图像,这对人工操作人员的体力和脑力劳动均是极大挑战,因此AI辅助具有重要现实意义。
综上所述,AI 对正常FFUSP 识别分类具有较高的准确性,可作为胎儿超声规范化培训和图像质量控制的辅助工具。然而本研究仍然存在一些不足之处,如仅对FFUSP 进行粗略分类,且仅对正常胎儿切面进行识别与分类,尚未涉及精细结构及颜面部畸形识别。未来将训练AI 对重要解剖结构的精准识别,以期利用AI辅助超声诊断胎儿颜面部畸形。