人工智能技术在临床病理学诊断中的应用
2021-12-02孔艳青汤红平
孔艳青 汤红平 李 晓
(1 南方医科大学附属深圳市妇幼保健院病理科, 518000;2 深圳市第二人民医院功能神经科, 518028)
近年来,随着芯片技术、深度学习及大数据等技术的蓬勃发展,AI 研究在医学领域中的应用得到了快速的发展。人工智能在医学影像领域的研究已广泛涉及放射影像、超声影像、内窥镜影像及病理形态学图像等多个方面[1]。AI 得以实现前提是人工智能的“视觉”,摄像头和传感器性能的提高,汇集更丰富的数字图像,而后计算机通过大数据获取全部经验,利用深度学习的机理分析并学习,既通过多层神经网络和神经元学习,解释数据及进行决策。深度学习作为机器学习研究中的一个新的领域,基本原理是构建出模拟人类神经系统的多层人工神经网络,并在大量的数据集的基础上进行多次反复的训练,使其能够替代或部分替代医师的阅图及判断能力。卷积神经网络在应用于图像模式识别方面研究成果尤为突出,可能得益于数字图片的快速发展及数据信息丰富等因素,在计算机视觉中表现出色[2]。在基于深度学习的自然图像分割的最优解,卷积神经网络技术在病理图像识别方面的AI 方面最为常用。目前AI 在病理图像学领域已经成为热点,特别是细胞病理学方面。机器深度学习通过多模态图像分割与数据合成、自动分类、描述及诊断方面取得了突破性的成果,帮助病理医师提供高质量的诊断。
1 临床病理学AI 技术的研究现状及病理诊断AI 技术的问题和挑战
人工智能在临床病理学中的应用主要包括细胞学初筛(主要为宫颈细胞学)、形态定性分析、临床活检组织病理形态学诊断和免疫组织化学等辅助判断预后等方面[3]。病理图像数据来源于细胞学、HE 染色、特殊染色或免疫组化片等玻片,每个医院的制片技术及染色深浅等差别,造成图像识别系统的差别。
标注图像是数字扫描后的图像,其图像与显微镜下的图像有不同程度的差别,国内的病理图像,绝大部分是二维图像,缺少三维的立体图像感。标注人员由镜下图像转换为扫描后的图像,在不同程度上存在认识差别,同时人工阅片标注也存在一定主观性。图像的差别转换到机器学习时的数据差别,据集的标准化问题,数字图像经不同的扫描仪,进行优化,使部分图像过于美化,同时数据质量参差不齐,标注人员水平标准不一。标注结果在某种程度上可靠性存在问题。同时扫描后的图片失真问题,对标注人员也产生不同程度的影响,在图片数据集质量控制方面,需要多名经过培训的人员医师和算法工程师共同完成。同时对有针对争议图像数据集,需要讨论后再确定,从而能从机制方面有效的降低因标注人员个人原因引起的随机误差和团队认知水平造成的系统性错误。图像数据质量本身也很重要,在图像数据被应用于AI 算法识别或应用于标准化数据集之前,相关人员先要对AI 学习的图像质量进行判断。
病理组织学诊断方面存在着诊断标准的差异,如不典型增生病变与癌的分界点的分歧。如果数据来自不同的医师可能造成判断结果的不同,同时把数据让计算机学习,可能造AI 系统的有效数据差别,AI判断结果的不满意。所以,病理诊断标准数据集对规范化、标准化的至关重要。目前已经有试验版的病理诊断AI 在临床验证,效果有待于进一步评估,AI 前期进行的数据纳入标准是开发性的,非统一的,导致后期算法波动比较大。研发机构逐步转向闭环,自己制度的标准化数据集,高质量的数据标注可能将会最终影响AI 系统的性能。同时一张病理切片图像通常含有较大可以达到数十个G,有时检查一位患者可产生1T 的数据。如此庞大的数据量对于图像数据的存储及传输来说是需要相应的储存空间,增加了应用的困难[4]。AI 在细胞学上主要以3D 扫描成像后,人工标注后进行学习,3D 扫描的片子并非像医生想象的那样清楚,对于拥挤重叠的细胞团,用3 层或5 层扫描,可能要3 个小时的时间才扫描出一张相对来说清晰的图像。这样对于学术研究,产品开发是可以的,但对于后期的市场应用较为困难。一张细胞学的片子在显微镜下几分钟给出诊断结果,3D 扫描要数分钟到半个小时,是市场不乐意接受的结果。病理诊断试验主要集中在宫颈细胞学方面,绝大部分是全数字扫片后进行判读,仅有个别为人工智能显微镜在临床场景验证,是否符合临床病理诊断应用场景,通过灵敏度、特异性为主要观察指标,以尽可能客观地反映AI产品的性能是评判人工智能系统的金标准。
2 病理学AI 诊断结果的判读方面的问题及其产品的形式
病理学AI 深度学习模型是通过数字图像识别和分类为特征进行学习的,区别在于病理医师直接在显微镜下做出诊断的病变特点。同时病理诊断具有独特的特点,一方面具有明确诊断,还有一部分为倾向或考虑性的诊断。在对AI 来说,即要有病理诊断的准确性,还要有一定的解释推理性。神经网络在图片学习中主要为卷积神经网络,具体来说为静止图像的分析表现出色。然而神经网络的算法内部的具体机制及每一卷积层的物理含义并不十分明确,造成病理学AI 在不明确的病理诊断有一定的难度。神经网络的参数设置导致某些AI 算法的病变划分等级可能偏于保守或者激进,在模棱两可的情况下划归为程度较高的病变或无病变。
病理学AI 产品,在细胞学方面主要是集中在妇科液基细胞学上,以3D 扫描的形式出现,以全玻片数字扫描技术(WSI)将计算机网络应用于病理学应用领域,通过显微扫描仪将玻片扫描并转化为高分辨数字图像,在计算机上进行后续的数字化图像进行高精度、多视野的拼接和处理,量化病理图像的形状、大小和颜色等信息综合分析。通过算法,进行学习及判读,但对于应用抗炎药、性激素、老年人及放疗治疗患者的细胞片,算法呈现出的判读结果,无论排阴率,还是假阳性率结果,不太令人满意。同时细胞学方面很难看到腺细胞异常的产品几乎没有,可能与收集数据较为困难有关,另一方面腺体大都是成团出现,扫描的片子,很难判断和标准,造成计算机学习的困难[5]。因此一种较为完美或使病理医师得以满意的产品形式,需要更大规模的数据及高质量的数据进一步迭代。在组织学病理方面,AI 当前几乎处于预演阶段比较多,对于判读癌症的类型及分级,淋巴结转移癌及免疫组织化学结果等,现在未见较好的产品形式出现,仍然是以WSI 的形式出现,这个设备只有少数大医院感兴趣,很难普及。还有谷歌开发的显微镜增强现实技术(ARM),将ARM 加载在普通的显微镜上,对实时成像信息进行增强、筛选和分析[6-9]。产品形式还有待进一步了解。组织病理形态学表现出仅对某一、两种肿瘤的形式,测试结果是较高的特异度和灵敏度,而不能像医生一样进行类比和转换学习。而是每种肿瘤都要一定的数据进行标注学习,对产品的开发增加了难度。
3 病理学AI 技术应用的前景与展望
病理学AI 技术在单一的筛查细胞学诊断中表现出突出的优势,同时在常规组织病理切片中,逐步显示出来便捷性。由于部分县级医疗机构病理医师人员不足,诊疗水平参差不齐,许多患者不能得到及时诊断,因此错失最佳治疗时机[10]。人工智能病理学技术的发展,将对我国公共卫生事业具有重大意义。病理学AI 能够优化医疗资源配置,提高基层病理科疾病的诊断水平,有效推动癌症的筛查诊断工作的开展,使众多老少边穷地区的患者从中获益。