大数据方向赛题一赛题名称:大数据医疗—肝癌影像AI诊断
2019-07-31
肝癌是病死率最高的恶性肿瘤之一,我国是肝癌病发第一大国,每年约有38.3万人死于肝癌,占全球肝癌死亡病例数的51%,近年来肝癌的发病率还在逐渐增高。世界卫生组织预计,如不采取紧急行动提高诊疗可行性,2015至2030年间中国将有约1000万人因肝硬化和肝癌死亡。
任务描述
本赛题基于肝部腹腔强化CT断层扫描数据以及相应的诊断结果,希望参赛者利用数据建模技术,构建基于医学影像的肝癌辅助诊断模型,利用人工智能手段对腹部CT影像进行诊断,判断患者肿瘤的良恶性,以帮助医生更加高效地对肝癌患者进行筛查。
赛题内容和方向
CT具有较高的分辨率,对肝癌的定位和定性诊断价值肯定,已成为常规检查项目,是一种安全、创伤较小的检查方法,诊断符合率可达到90%以上,对肝癌的诊断及其程度的判断有重要的临床意义。
目前医生通过CT诊断肝癌患者,主要通过人工核查的方式,对患者的CT切片逐张进行核查,诊断效率低,极易发生误诊、漏诊,造成严重的医疗事故。针对这个问题,本赛题基于健康医疗大数据提供的肝部腹腔强化CT断层扫描数据以及相应的诊断结果,希望参赛者利用数据建模技术,构建基于医学影像的肝癌辅助诊断模型,并利用人工智能手段对肝癌进行诊断,以帮助医生更加高效地对肝癌患者进行筛查。
赛题价值
福建是肝病和肝癌的高发区,以福州建设国家健康医疗大数据中心为契机,2017年吴孟超院士发起成立全国肝病和肝癌大数据联盟,目标是将全国肝病和肝癌大数据汇聚到福州,共建共享的肝病和肝癌数据平台。
福建医科大学孟超肝胆医院作为这个项目的具体建设单位,已汇聚来自上海东方肝胆外科医院、孟超肝胆医院及福建肝病医联体等88家联盟单位的数据,包含肝癌病例6.2万例,肝病病例62万例,形成肝病和肝癌大数据平台。
本次参赛数据主要来源于全国肝病和肝癌大数据平台中的肝癌病人CT影像数据,并经模拟转变而成。包含11601例肝癌病例影像,其中7574例作为训练集,4027例作为测试集。影像数据层厚分布为0.6mm-7.5mm。
我们希望通过人工智能技术,学习有经验专家的医学知识,能够一定程度提高CT诊断疾病的效率和保持诊断的同质化,减少因为医生个人经验差异造成的人为漏诊或误诊,是一种提高诊疗水平和效率的重要辅助手段,也有助于改善基层医疗机构人才不足的现状。
赛题难点
虽然在图像識别领域,已经有经过验证的成熟算法,比如深度卷积网络(DNN)和递归网络(RNN)等深度学习算法,都取得了巨大的成功,但由于医学影像有其独有的特性,所以这些技术在肝癌CT影像中的使用还有很多挑战,本赛题中有以下几个难点:
1.因患者年龄、性别、生活习惯、地域等差别,肝的形态、成分等存在差异,会为病灶的判断造成系统误差;
2.肝癌常发生在肝硬化基础上,80%以上的肝癌伴有肝硬化,肝硬化影像改变会对肝癌的诊断造成干扰;
3.肝癌的大体形态有巨块型、结节型、弥散型和小癌型,细胞形态有肝细胞型、胆管细胞癌和混合型,各种肝癌影像特点差异较大;
4.本赛题所提供的训练数据,各种肝癌的数据并不均衡,因此加大了对肝癌的判断难度。