APP下载

利用人工智能图像识别技术对染色体核型的分类研究*

2022-09-09丁晓燕沈梦婕景鹏伟黄国宁

重庆医学 2022年16期
关键词:全自动染色体准确率

丁晓燕,沈梦婕,李 岚,景鹏伟,黄国宁,叶 虹

(人类胚胎工程重庆市重点实验室/重庆市生殖医学临床研究中心/重庆市妇幼保健院 400013)

中国是出生缺陷高发国家,出生缺陷不但严重影响新生儿身心健康,也给家庭和社会带来沉重的负担[1]。染色体异常是导致新生儿出生缺陷的常见原因,染色体结构或数目异常会引起一系列的临床疾病,是造成胎儿流产、新生儿畸形、智力低下、发育迟缓等疾病的根本原因[2-4]。随着国家对出生缺陷的重视以及人们对生育质量要求的提高,产前诊断的需求量及工作量日益增加,羊水细胞培养及染色体核型分析是筛查胎儿先天疾病的首选方法[5]。

随着辅助生殖技术(assisted reproductive technology,ART)的发展,越来越多的不孕患者选择通过ART解决生育问题。而随着“二孩”及“三孩”政策的开放,高龄助孕的患者逐渐增多,助孕前的染色体核型检查及高龄孕妇的产前诊断已成为很多生殖中心的重要工作,需要安排大量的人力物力来完成,且需要等待较长的时间才能出具检测报告[6]。

传统染色体核型分析主要依靠人工分析,经过专业训练的技术人员通过显微镜拍摄的单个细胞图片观察染色体,根据其形态结构判断染色体是否重复、缺失、易位或倒位。这一流程需要经验丰富的专业技术人员操作,虽然现有的专用显微镜可以自动或半自动进行染色体分类,但效果并非特别理想,未能分割的聚簇会导致系统误报,染色体碎片会增加系统的错误率[6]。随着计算能力的飞速发展和大数据的应用,人工智能(artificial intelligence,AI)图像识别技术深度神经网络成为新的图像识别热点。本研究以经过分类标记的染色体图库作为训练集,让神经网络学习人类染色体各个核型特征,实现可针对中期染色体图像自动分类过程,在保证分类准确率的同时降低对人工的依赖性。

1 资料与方法

1.1数据集

采用的所有图像均来自重庆市妇幼保健院生殖医学中心,包括外周血及羊水标本制备的染色体图像。图像库由1 652组不同中期染色体图片组成,每组由两张图片组成,一张为经过专业医师分割的图片,一张为专业医师完成识别并分类排序的图片。见图1。

图1 中期染色体及其分析排版结果

随机将图像库中的1 000组归为训练组,用于神经网络参数的训练和修正。将1 000张已经标记的图片所包含的约46 000条染色体以40条一组重新随机分布到图片上,每条染色体需经过0~360°的随机旋转,且互不重叠,最终生成10 000张图片组成训练组。剩余的652组图像分为测试组(300例)与验证组(352例),分别用于实时观察神经网络的收敛效果和检验神经网络的性能。

1.2方法

1.2.1软硬件平台

所有的网络均采用Python3.6语言编写的TensorFlow1.2框架下搭建,整个试验在Ubuntu 16.04系统下运行。计算机配置:Intel(R) i7-7820X CPU,64G RAM,NVIDIA 2080TI 11GB GPU *2。

1.2.2不同染色体核型分类方法

一名长期进行染色体分类的专业技师利用普通显微镜(Olympus BX51)人工分析染色体图像(A组),利用全自动染色体显微图像扫描分析系统(ZEISS MetaSystems Imager Z2)对染色体图片进行分析(B组),与AI模型(AI组)对染色体图片分析的准确率及分析时间进行对比(n=50)。

1.3统计学处理

2 结 果

2.1AI神经网络建立

采用一个通用图像分割网络Mask-RCNN[7],其是一种基于区域的神经网络架构。采用数据集预训练模型参数初始化对应的网络参数,其余参数进行随机初始化。 验证组测试分类识别的准确率为91.35%~98.61%,中位准确率为94.38%。采用验证组对已收敛的深度网络进行测试,该网络能够较好地划出目标区域并分类,见图2。

图2 经深度神经网络识别的染色体区域并分类

2.2人机分类比较

长期进行染色体分类的专业技师利用普通显微镜进行一个染色体图像的分析时间大约为10 min,而人工利用全自动染色体显微图像扫描分析系统对染色体图片进行分析,每个染色体图片大约需要2~5 min,准确率均为100%。

专业技师利用全自动染色体显微图像扫描分析系统分割粘连、重叠的染色体大约需要1~2 min,然后将图片传递给深度神经网络,其能在几秒内完成染色体分类,正确率为96.0%,因此在人工配合下可在1~2 min左右完成染色体的识别和分类。3组的识别时间比较,差异有统计学意义(P<0.05);而准确率比较,差异无统计学意义,见表1。

表1 不同染色体分类方法耗时与准确率比较

3 讨 论

以往的染色体核型分析工作几乎均由专业人员人工完成,包括培养、制片、镜检,其过程烦琐,虽然准确率有保障,但效率比较低下,导致染色体检查结果等待时间较长。半自动或全自动染色体分析系统的出现使染色体核型分析的效率得到了很大的提高,然而这些系统只是在染色体图像的拍摄和选取方面做到了全自动,而在染色体图像分割和染色体核型分析方面还是需要专业技师的参与[8],即仍然是通过人机交互的模式完成的,并没有真正做到“全自动”。

随着计算机计算能力的飞速发展和大数据的应用,深度神经网络成为新的图像识别热点。AI图像识别技术用于医学影像的辅助诊断已有大量研究,包括胸部、心血管疾病、骨科疾病及神经系统疾病影像等,这些研究成果如果用于临床将大大减少临床医师的工作量及辅助提高诊断的准确率[9-10]。关于染色体核型的AI分析也早有研究,但有很多技术难题没有克服,且准确率一直较低。WU等[11]采用VGG-net-d的网络架构,识别染色体的准确率达到了63.5%。GUPTA等[12]采用孪生双网络互纠正分类法,准确率达到85.6%。LIN等[13]采用基于ResNeXt框架的迁移学习识别法,准确率达到了94.09%。然而这些研究的准确率还远远不足以用于临床。

染色体识别的两个难点在于分割和分类[14]。由于显微镜下的染色体难免粘连或重叠,不成熟的分割算法导致后续的分类准确率降低[15]。然而人工分割重叠的染色体要求的技术不高,时间较短,且后续神经网络识别率还能得到提高。而影响染色体分类的难点主要在于染色体弯曲折叠等不同的形态。有研究发现将弯曲折叠的染色体进行伸直处理,使染色体的识别率达到了很大的提升,然而这种方法并不能完全适用于所有染色体图像中的情况[16]。本研究发现只需将各种形态的染色体随机旋转,反复训练深度神经网络便可以高效识别呈现各种形态的染色体。因此相较于传统的染色体核型分析流程,采用预先人工处理,再采用神经网络进行分类的方法,不但提高了效率,同时降低了对技术人员的要求。

本研究通过现有图像库训练出的神经网络,对染色体的识别率可高达96.0%,所耗费的时间仅为传统人工识别的五分之一,较全自动染色体分析系统的所需时间也显著降低,大大提高了染色体核型分析的效率,从而降低了患者等待检测结果的时间。由于培养一名专业的遗传学医师需要漫长的时间,其经验也需要在工作中不断积累,期间必定耗费大量的人力物力,需要大量的医务工作者为染色体核型分析付出大量的工作。本研究建立的AI深度神经网络可以高效、准确地识别出染色体核型,而且可以集成到现有的核型分析系统中或通过网络集成到云端。并且随着应用的推广,图像库的数据集会得到不断的补充,通过AI神经网络的自主学习及调整功能,识别率会得到进一步的提高,将大大减轻医护人员的工作负担,并减轻患者的经济负担及减少患者的等待时间。

猜你喜欢

全自动染色体准确率
SYSMEX XN-550全自动血液分析仪的校准及性能评价
全自动单剂量分包机应用于中心摆药的效果评价
咔吱兔的全自动生活
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
全自动洗衣机
多一条X染色体,寿命会更长
为什么男性要有一条X染色体?