复合阈值处理法在病理诊断中的应用
2022-10-12王卉欢通讯作者
王卉欢(通讯作者),陈 滨
(哈尔滨医科大学 基础医学院计算机教研室,黑龙江 150081)
国家癌症中心2021年中国最新癌症报告显示,恶性肿瘤是严重威胁我国居民健康的一大类疾病。肺癌、肝癌等依然是我国主要的恶性肿瘤。肝脏病理诊断是肝病患者诊疗过程的重要组成部分,对肿瘤性及非肿瘤性肝病诊断、预后以及治疗起着非常关键的作用。肝病理诊断可以了解肝脏病变的程度和活动性并做出较客观、精确诊断。疾病早期,利用血液生化分析和B超检查方法难以检测出肝脏炎症和纤维化的程度,而肝脏活检的病理检查可以准确诊断肝脏的炎症和纤维化程度,以及肝硬化的分型及病因,如酒精性肝硬化或肝炎后肝硬化等。此外,肝活检病理诊断有助于肝脏疾病治疗的药物选择及疗效判断,通过评判治疗前后肝组织病理变化,为药物治疗提供可靠指标,为临床药物治疗提供客观的评价依据。现今,常用的抗肝炎病毒的药物疗程长、价格贵,这势必会加重“看病难、看病贵”等诸多社会问题。如果在治疗前进行病理诊断,根据肝脏组织炎症活动程度有选择性和针对性地应用抗病毒药物,不仅能提高疗效,还能适当降低治疗费用。肝活检病理诊断也可以为不同类型病毒性肝炎的病原学诊断提供依据,大部分肝炎病毒是嗜肝病毒,多在肝组织中寄生,只有在血清肝病病毒达到一定量时,临床化验才能够检测出来。肝活检病理诊断利用超敏感性的免疫组织化学和原位分子杂交技术,能够及时有效地检测出寄生在肝组织中的肝炎病毒。肝活检病理诊断有利于多种肝病的鉴别诊断,许多临床诊断比较困难的慢性肝病,都需要通过肝活检病理诊断来及时了解病人的肝脏病变,为医疗诊断提供至关重要的医学依据[1]。
肝脏的病理检查被公认为是肝脏疾病诊断的金标准,是一种能够直接了解肝组织的病理变化、给出较精准诊断的检验方法,诊断价值远远高于血液生化、影像学检查,是其他检查无法替代的。病理诊断是对活检或手术切下的病变标本进行固定、染色后,在显微镜下观察组织结构和细胞病变特征后,给出相应诊断。目前为止,病理诊断仍被视为带有宣判性质的、权威性的诊断[2]。癌症的诊断在病理学诊断中最为复杂,很大程度上依赖于诊断医生自身的经验。
随着科技的不断发展,医学影像的处理在诊断中的作用不断加强,对医学图像进行处理和分析非常重要。传统的医学影像处理主要针对的目标有血管摄影(Angiography)、电脑断层扫描(CT,Computerized tomography)、正子发射断层扫描(PET Positron emission tomography)、核磁共振成像(NMRI,Nuclear magnetic resonance imaging)等,但是缺乏对于病理切片(Pathological section)处理的研究。
病理科是大型综合医院不可缺少的科室之一,主要承担病理诊断任务。日常工作包括活体组织检查、脱落和细针穿刺细胞学检查、尸体解剖检查等。通俗地说,就是将从患者体内取下的组织进行固定、取材、脱水、包埋、切片等步骤后,根据疾病情况通过HE染色、特殊染色、免疫组织化学、荧光原位杂交等技术对疾病进行确诊,为临床提供明确的病理诊断,确定疾病的性质,查明死亡原因,并可为临床后续治疗提供指导性信息[2]。在我国,病理医生十分稀缺,而病理切片却又是癌症诊断的金标准,所以需要分析的病理切片较多,病理医生的工作强度很大,而且病理分析还要依靠经验和多种技术手段,有时医生主观情绪波动会造成关键部位的遗漏或疏忽。以上情况导致病理误诊时有发生,从而耽误患者错过最佳治疗时期,或将没有病变的部位切除。病理报告的误诊不仅对群众的身体健康造成了很大威胁,同时也会增加医患矛盾发生的机率。使用医学影像的技术手段来协助医生进行病理分析和诊断是近年来一个重要的研究方向。
为了解决以上问题,国内外一直在研究将病理切片“数字化”。如今国外在数字化病理系统的应用上已达到较高的水平。例如,澳大利亚新南威尔士大学早在2004年就首次成功地将数字化病理应用于病理学教学与考试的累积性评估。国外的数字化病理系统在远程会诊和远程切片分析方面也得到了广泛应用,如德国已经实现利用数字病理系统进行乳腺癌远程诊断。
有了数字化的病理切片,除了可以实现教学和远程会诊等用途,还可以实现利用计算机处理医学影像。传统的医学影像处理经常使用的计算机技术有空域变换、直方图增强、锐化滤波器等[3-4],国内外对此有过很多研究,主要有以下几种:①图像低层特征的提取和描述;②基于区域的图像检索(Region-Based Image Retrieval);③图像语义特征的提取;④高维索引技术;⑤相关反馈(Relevance Feedback)与机器学习相结合。
虽然研究的角度很多,但是在处理病理切片时,如果病变部位较为复杂,或是病变组织杂乱无章、噪音杂质较多,经常无法取得较好的效果。为了解决病理切片诊断的时间过长、误诊、漏诊等问题,提高病理诊断的效率和精准度,避免错过最佳治疗时间、错误切除健康组织等医疗事故,我们重点研究了以下几点:
①肝组织的病理切片的数字化。
②使用计算机图像算法排除噪音杂质以及干扰信息。
③研发复合式分割图像算法,分析病理切片中的有效信息,包括疑似病变细胞、活检组织的全貌、活检部位、可疑癌肿的形状、边缘是否清楚以及活检组织的大小,如直径或长度等,并根据这些数据给出病变(主要指癌变)的概率以及良性和恶性肿瘤的概率。
④将多组切片按机器分析的概率进行排序,标注疑似癌变图像,计算癌变概率,从而协助医生给出客观诊断。
计算机图像处理技术可以将完全依靠个人经验的病理诊断方法转变为量化指标,为病理医生诊断提供参考。以往对病理切片图像处理的研究主要集中在通过对图像兴趣区域的大量学习,实现自动识别病变组织的目的[5]。本研究提出的复合阈值病理切片图像处理方法,能够凸显正常肝组织与病变肝组织在结构上的区别,从而帮助医生做出正确诊断,使诊断更具客观性和科学性。
1 材料与方法
1.1 材料
收集哈尔滨医科大学第二附属医院20例肝脏癌变和20例正常肝脏病理切片。使用日本Nikon ECLIPSE Ci显微镜,在10倍、20倍、40倍下摄影,生成JPEG格式图片。
1.2 方法
①病理切片进行数字化,采集10倍、20倍、40倍等多重影像。
②将图片进行阈值灰度(Grayscalethreshold)处理,提取有效像素点。
③多次修改阈值,将图片有效降噪,记录最佳阈值。
④采用逐点分割图片的方法,将图片切成若干小范围图片,即区域。与传统方式不同的是,区域并不是从图上完整划分,这些区城的大小、范围并不固定,而且这些区域的某一部分和其他区域有较大的重合,重合度越高,划分越精细,越容易找出癌变组织,但是计算速度越慢。所以要找出最佳的切割点,其中必有癌变组织最明显的图片。将这些图片运用直方图(histogram)对比方法进行图像比对,按照图像癌变相似度进行图像排序。本项目主要采用计算机图形学的相关技术,包括图像分割技术(Image Segmentation Technology)、图 像 的 空 域 变 换(Spatial Transform)、直接灰度调整(Direct grayscale adjustment)、直方图增强算法(Histogram enhancement algorithm)等技术,最终实现一种基于区域的图像检索(Region-Based Image Retrieval)[6]。
软件开发使用c#语言,在visual studio 2017中采用.netframework4.5集成环境编写程序,用来实现算法。
1.2.1 编写病理切片图像处理系统
本研究编写的病理切片图像处理系统界面包括图像读取、中位数设置、复合阈值处理法、保存右侧处理完成图像等功能。见图1。
图1 病理切片图像处理系统主界面
1.2.2 理论依据
肝癌是指发生于肝细胞或肝内胆管上皮细胞的恶性肿瘤,根据组织学类型可将肝癌分为肝细胞肝癌、胆管细胞癌以及混合型肝癌。肝细胞肝癌最为常见,约占肝癌的90%,癌细胞来自肝细胞,异形性明显,胞质丰富呈多边形,排列成巢状或索状,血窦丰富,如果有包膜则生长比较缓慢。胆管细胞癌比较少见,癌细胞是由胆管上皮细胞发展而来,呈立方或柱状,排列成腺样,纤维组织较多,血窦较少。混合型肝癌最少见,其具有肝细胞肝癌和胆管细胞癌两种成分。肝癌的影像学检查可能并不会观察到甲胎蛋白的异常,而肝细胞癌的影像学检查甲胎蛋白大多会显著升高。
本研究的理论依据是正常肝脏肝板由单层肝细胞组成,故肝板间的肝窦形态相对规则且分布均匀;而肝细胞癌变时,肝板由多层细胞组成且肿瘤细胞形成团块,故与正常肝组织相比肝窦数量减少、形态不规则、分布紊乱[1-2,7-8]。
1.2.3 实验步骤
选取肝癌切片20张、正常肝组织切片20张,分别在显微镜摄影倍数为4倍、10倍、20倍、40倍时进行摄影,生成病理切片图像。由于病理切片图像普遍超过4M,直接处理的话,时间长、效率低。在进行实验前,将图片按10%缩小处理。在病理切片图像处理系统中读入切片图像,分别将阈值设为-2、0、5、7、9进行比较。为了避免染色剂使用量对图片造成深浅不一的影响,对图片进行了二值化处理。
本研究提出复合阈值处理法,步骤如下:
①首先设置阈值m,默认为123,可根据明暗效果自行设置。
②分别计算中间色的rgb值:
③计算中间色值mc:
④如果mc>255-m则mc不变;否则mc=mc+m。
⑤设原图中的每个像素点色值为p,如果(r+g+b)/3>mc则p=255,否则p=0。
⑥黑白取值后,可将黑白反相处理(颠倒)。
为了加强图片显示效果,可根据明暗效果设定阈值或进行反相处理。
2 结果
2.1 正相处理结果比较
为了找到最佳诊断效果的图片以及与放大倍数、自定义阈值的关系,本文在放大倍数为4、10、20、40下,将阈值分别设为-2、-1、0、1、5、7、9、10,对两例肝癌切片图像和两例正常肝组织切片图像依次进行处理。20倍与40倍的处理结果优于4倍和10倍。阈值≤2或阈值>9时,图像不清晰,省略。首先正相处理结果比较,放大倍数为20,见图2。放大倍数为40,见图3。
图2 20倍 正相处理结果比较
图3 40倍 正相处理结果比较(效果好的图片略大)
2.2 反相处理结果比较
见图4、图5。用于病理诊断效果最好的参数值如图6。
图4 20倍 反相处理结果比较
图5 40倍 反相处理结果比较(效果好的图片略大)
3 结语
本课题不仅采用了传统计算机图像算法,如直方图相似度对比、灰度阈值、二值化、图像的空域变换等方法来实现基于区域的图像检索(Region-Based Image Retrieval),并且创新地提出了一种新的复合式分割法,将图片重复分割,分割区域和大小不确定,每个小图都进行计算和分析,以求找到最佳图片(即最明显的癌变图像)。同时将所有图像按癌变概率进行排序,极大地帮助了医生实现快速、准确地诊断。
通过使用复合阈值图像处理方法,可以看出正常组织切片条纹分明,肝窦成规则条纹状,且分布均匀;而癌组织切片条纹杂乱,肝窦成不规则条纹状,且分布不均匀,相较于正常组织,黑色素成团状大量出现(见图6)。研究结果表明,当显微镜放大倍率为40,阈值为7,在利用本研究提出的复合阈值算法处理后的图像以及进行反相处理后,阈值在7-9之间的图像中,可以很清晰地看到肝窦是否分布均匀,从而给出是否发生病变的诊断结论。该算法以软件的形式提供,并将在实践中不断升级和改进,有助于精确诊断,减少误诊、医疗事故等,同时有助于临床医生的培养。
图6 可用于诊断的参考图像