人工智能辅助分析在宫颈液基薄层细胞学检查中的应用价值

2020-06-21石中月杨志明庞文博金木兰

首都医科大学学报 2020年3期

李雪石中月杨志明庞文博金木兰*

(1.首都医科大学附属北京朝阳医院病理科，北京 100020; 2. 深思考人工智能机器人科技(北京)有限公司,北京 100085)

宫颈癌和乳腺癌是全世界妇女中最常见的两大恶性肿瘤，全球每年新发宫颈癌患者约50万例，死亡超过26万例，约80%的患者集中于经济欠发达的发展中国家[1]。据统计，全球每年宫颈癌新发病例约52万，其中我国有近15万，每年有2万～3万妇女死于宫颈癌。近年来，我国宫颈癌发病及病死率呈上升趋势，且发病年龄出现年轻化趋势[2]。

目前宫颈液基薄层细胞检测(thinprep cytologic test，TCT)是宫颈癌筛查的重要手段，但宫颈细胞学阅片人员较为匮乏，难以满足目前宫颈癌筛查的需求。国际上有关宫颈癌筛查的质量保证指南中规定，细胞技术人员每天要对玻片进行最大官方工作量限制，范围在25至80例之间[3]。此外，受阅片人员疲劳，技能水平不足和主观因素的影响，人工判读结果假阴性率高达10%；癌前病变的灵敏度约65%，特异度约90%[4-5]。

随着人工智能(artificial intelligence,AI)技术的发展和该技术在医疗影像领域的广泛应用，人工智能可将图像中的色彩纹理等人眼难以捕捉的信息形成特征数据呈现出来，通过结合细胞分割、细胞分类等算法，并融合病理医师的阅片技巧，实现宫颈癌计算机辅助筛查系统，将其应用于巴氏涂片[6]、液基细胞学中，可显著提高工作效率，减轻阅片人员工作量，对于宫颈癌早期筛查有着重大的意义。本研究比较了人工智能辅助筛查系统和常规细胞学镜下阅片中的宫颈癌前病变检出情况，以探讨人工智能辅助筛查在宫颈液基薄层细胞学检查中的应用价值。

1 资料与方法

1.1 标本来源

选取2019年1 月至2019年8 月首都医科大学附属北京朝阳医院妇科门诊和体检门诊收集到的1 000例有明确诊断结果的TCT涂片进行研究。

1.2 检测方法

宫颈细胞液基薄层涂片均按照美国新柏氏公司TCT检测仪的说明采样，用特制的宫颈刷收集宫颈外口和颈管脱落的细胞，将收集的细胞洗入盛有ThinPrep细胞保存液的小瓶中[7]。专业病理医师采用镜下阅片方式进行细胞学诊断，人工智能宫颈癌辅助筛查系统采用数字化宫颈涂片后智能阅片。

1.3 细胞学诊断标准

为验证人工智能辅助筛查在宫颈液基薄层细胞学检查中的价值，采用目前国际广泛使用的TBS 2014分级系统[8]进行细胞学诊断。诊断结果具体描述为：①未见上皮内病变或恶性细胞(negative for intraepithelial lesion or malignancy， NILM)；②意义不明的非典型鳞状细胞(atypical squamous cells of undetermined significance，ASC-US)；③不典型鳞状细胞，不能排除高度上皮内病变的不典型鳞状细胞(atypical squa-mous cells， cannot exclude HSIL，ASC-H)；④低度鳞状上皮内病变(low grade squamous intra-epithelial lesion，LSIL)；⑤高度鳞状上皮内病变(high grade squamous intraepithelial lesion，HSIL)；⑥鳞状细胞癌(squamous cell carcinoma，SCC)；⑦未明确诊断意义的非典型腺癌(adenocarcinoma glandular carcinoma，AGC)，其中ASC-US及以上认定为阳性涂片。

1.4 实验方法

1 000例涂片分别采用病理医师人工筛查、深思考公司研发的人工智能辅助筛查以及人工智能辅助分析基础上病理医师复查，并对比分析采用三种筛查方式筛查宫颈癌的结果。

人工筛查团队由3名具有10年以上宫颈细胞学阅片经验的病理医师组成。在人工智能辅助筛查的基础上，病理医师复查阅片中判断结果不一致的涂片，以病理医师的复查阅片的结果为准。

医学辅助诊断系统的评价方法一般是比较系统分析结果和医师诊断的患者真实病情，目前通常将诊断结果分为4类: 真阴性(true negative，Tn)，患者的真实情况为没有病变，系统诊断为无病变；假阴性(false negative，Fn)，患者的真实情况为有病变，系统诊断为无病变；真阳性(true positive，Tp)，患者的真实情况为有病变，系统诊断为有病变；假阳性(false positive，Fp)：患者的真实情况为没有病变，系统诊断为有病变。

人工智能辅助筛查系统的性能可以通过准确率(accuracy，ACC)，特异度(specificity, SPE)和灵敏度(sensibility, SEN)等[9-11]指标进行度量。SPE是衡量系统准确诊断为阴性的能力，是真阴性与阴性样本数量的比率；SEN是衡量系统准确诊断为阳性的能力，是真阳性与阳性样本数量的比率。

1.5 统计学方法

采用SPSS 14.0统计软件对数据进行统计学分析，组间比较采用χ2检验，以P<0.05为差异有统计学意义。以原始病理的诊断结果为标准，评估人工智能辅助筛查技术与病理诊断的灵敏度和特异度等指标。

2 结果

2.1 不同筛查方式的结果比较

从表1中可以看出，病理医师筛查结果和人工智能辅助筛查结果均接近于标准样片，但由于病理专家对各分级样本的评判标准不同，在一定程度上存在样本定级的分歧；相比较而言，人工智能辅助筛查虽然对NILM有部分错检，但可以保证各阳性样本的准确定级，经由病理医师对人工智能辅助筛查的结果进行复核阅片，AI+医师共同阅片分析可以保证病例样本的精准分级。

表1 宫颈细胞学检查结果对比

AI: artificial intelligence;NILM: negative for intraepithelial lesion or malignancy；ASC-US: atypical squamous cells of undetermined significance；ASC-H: atypical squamous cells， cannot exclude HSIL；LSIL: low grade squamous intraepithelial lesion；HSIL: high grade squamous intraepithelial lesion；SCC: squamous cell carcinoma；AGC: adenocarcinoma glandular carcinoma.

与病理医师人工筛查相比，使用人工智能辅助筛查之后再由病理医师进行复核的诊断结果差异具有统计学意义(χ2=2.009，P=0.04)。

通过对表1的数据进一步的统计和分类，根据TBS 2014分级系统细胞学诊断标准，ASC-US、ASC-H、LSIL、HSIL、AGC被认为阳性，NILM和微生物感染被认为是阴性。

同时，对假阴性和假阳性进行统计的结果显示，人工智能辅助筛查结果中假阳性为22例，即AI诊断结果会在一定范围内造成部分假阳性病例，详见表2。但从表1中可知，这部分结果多数存在于ASC-US，同时，假阴性0例。

表2 宫颈细胞学诊断结果对比

AI: artificial intelligence.

此外，在病理医师的筛查结果中，有4例涂片被认定为真阴性，但在人工智能辅助筛查的结果中认定为阳性，经复检的病理医生对上述4例涂片进行重新阅片并查阅人类乳头瘤病毒(human papillomavirus，HPV)检验结果，发现其中3例(图1A、B)为阳性漏诊，1例为人工智能辅助阅片系统误诊，将基底层细胞误判为阳性细胞(图1C)。

图1 深思考人工智能辅助筛查与人工阅片结果不一致的涂片

2.2 灵敏度与特异度结果比对

在人工智能辅助下，病理医师对1 000例样本的诊断准确率可以达到99.80%，并且灵敏度高达100%。详见表3 。

表3 宫颈细胞学灵敏度与特异度指标

AI: artificial intelligence.

2.3 宫颈细胞学筛查阅片时间分析

本研究中，人工筛查阅片经由3名病理医师分别阅片300余例，共同完成1 000 例的人工筛查的阅片工作，3名病理医师人工筛查共计耗时3.5 d，人工智能辅助筛查系统仅用20 h 内即可完成1 000例的阅片工作。详见表4。

表4 宫颈细胞学筛查阅片时间对比

#A pathologist works 8 h per day, while AI assistance analysis system can work 24 h continuously;AI: artificial intelligence.

3 讨论

宫颈癌长期以来严重威胁妇女的生命健康，定期进行宫颈病变的筛查，及早发现和治疗早期宫颈癌及癌前病变，是降低宫颈癌发病率和病死率的重要手段。几乎100%的宫颈癌由HPV所引起，传统的巴氏涂片假阴性率较高，这是由于取材时80%以上的细胞流失，且涂片细胞过厚、重叠，过多的黏液、血液或炎性反应细胞的混杂影响了诊断。但采用HPV DNA作为筛查靶标仍然存在特异度较低的缺陷，宫颈细胞学检查是目前宫颈癌筛查的主要方法，降低了传统细胞学涂片的假阴性率，有效提高了宫颈病变诊断的灵敏度。

妇女发展纲要(2011-2020)要求宫颈癌筛查覆盖率需达到80%，基于我国女性人口总数约6.5亿，30%的女性从来没有进行过筛查的事实基础，目前筛查率远低于这一水平。受限于有经验的专业病理医师的人数不足，以及阅片效率太低，使得筛查率短期内难以进一步提升。

本研究结果表明，人工智能辅助筛查可以降低假阳性，而且不会造成假阴性的出现，帮助病理医师减少漏诊，在人工智能辅助下，病理医师诊断准确率可以达到99.80%，并且灵敏度高达100%,说明人工智能辅助筛查是可依赖的。本研究实验数据表明，在人工智能辅助筛查的基础上由专业病理医师复核的方式，宫颈癌筛查效率能够提高4倍以上，同时，由于人工智能筛查能够自动分割和识别液基涂片上细胞的病变区域和类型，真正实现了宫颈细胞学智能化阅片，让诊断医生将精力集中于诊断细胞，而不是寻找细胞，这极大地节省了医生的精力。

本研究中发现的1例病例由人工智能辅助阅片系统误诊为阳性细胞，经病理医生复诊为基底层细胞或修复细胞，这可能是因为基底层细胞核浆比较高，被人工智能误认为是病变细胞，这提示人工智能在正确鉴别基底层细胞和病变细胞方面仍需改进。

综上所述，相比于传统的病理医师筛查方式，人工智能辅助筛查具有高灵敏度与特异度，即对于识别度较低、人眼难以区分的样例，能够有效地规避漏检的风险。在宫颈细胞学辅助筛查中采用TCT、人工智能宫颈癌辅助筛查系统联合筛查，可提高诊断准确率，提高工作效率，为治疗宫颈癌提供诊断依据，值得临床推广。