人工智能在皮肤病学中的应用及展望
2023-11-06熊喜喜鲁严
熊喜喜 鲁严
随着人工智能(AI)技术的快速发展,其在医疗领域的应用也越来越广泛。在皮肤病学领域中,AI技术已经被应用于皮肤影像识别、诊断辅助、治疗方案制定、疾病预测、健康管理等方面,为临床医生提供了更为准确、高效的诊断和治疗方案参考。本文将对近年来与皮肤病学相关的AI文献进行综述,总结AI在皮肤病学方面的应用情况。
1 认识AI
1.1 AI的定义 AI是指使机器能够像人类一样执行智能任务的一种技术。这种技术旨在通过模拟人类的思维、学习、推理、自适应和自我修正等能力,使机器能够完成以前只有人类才能完成的任务,例如语言理解、视觉识别、自动驾驶等。它不仅可以让机器执行基本的计算任务,还可以在更高级别的任务中模拟人类的智能水平。
1.2 AI的分类 按照不同的分类方法,AI可以分成不同的类别,以下是常见的几种分类方法。(1)按照智能程度的分类:分为弱AI和强AI。弱AI只能完成特定的任务,而强AI则具有类似于人类的智能,能够进行多种任务。(2)按照学习方式的分类:分为监督学习、非监督学习和强化学习。监督学习是指通过给计算机提供标记好的样本来训练它,使它能够准确地预测未标记的数据。非监督学习是指让计算机在没有标记的情况下自行学习,识别出数据中的模式和关系。强化学习则是让计算机通过试错的方式学习,在不同的状态下采取不同的行动,并根据行动的结果调整策略。(3)按照应用领域的分类:分为自然语言处理、计算机视觉、机器学习等多个领域。(4)按照技术实现方式的分类:分为基于规则的AI、基于神经网络的AI和混合型AI等多个类型。基于规则的AI是通过一系列预定义的规则来实现AI,而基于神经网络的AI则是通过模拟人类神经系统来实现AI。混合型AI则是综合多种技术来实现AI。
2 AI在皮肤病学中的应用
2.1 AI与皮肤影像 广义上,皮肤影像包括各种设备采集的皮肤相关的图片,包括但不限于手机、数码相机或单反相机等拍摄的临床照片、皮肤镜图像、皮肤超声图像、皮肤CT图像、Visia图像、MRI影像、显微镜图像等。AI计算机视觉在该领域通过图像识别发挥作用,以下将列举AI在不同疾病中的应用。
2.1.1 皮肤肿瘤:2017年,Esteva等[1]报道了基于深度学习的算法来识别黑色素瘤图像的一项研究,其准确率达到90%以上。该研究通过129 450张图像训练神经网络,经过训练的神经网络能够对皮肤癌进行分类,且准确率与皮肤科医师相媲美。这种方法具有成为一种有效的皮肤癌诊断工具的潜力,可帮助医生更准确地诊断和治疗皮肤癌。一项前瞻性研究比较了皮肤科医生基于皮损照片及皮肤镜图片、远程评估,Foto Finder®Moleanalyzer Pro非侵入性成像技术评估以及两者联合诊断黑色素瘤的情况,与金标准病理结果相比,三者的敏感度和特异度没有统计学差异[2]。Widaatalla等[3]对皮肤基底细胞癌的AI辅助识别和分类进行了系统评价,共纳入15篇文献,其中13篇基于皮肤镜图像、2篇基于光学相干断层扫描(OCT)图像、1篇基于反射式共聚焦激光扫描(RCM) 图像,最高特异性达100%,曲线下面积为0.99,但仅有2篇文献所用的AI经过外部数据验证。Huang等[4]使用深度学习模型在 KCGMH 和 HAM10000 数据集中以二分类和多分类的方式识别皮肤癌和良性皮肤肿瘤,构建轻量化皮肤癌分类模型。 KCGMH 数据集中二元分类(良性与恶性)的准确率达89.5%;HAM10000 数据集的七级分类准确率为 85.8%,KCGMH 数据集的五级分类准确率为 72.1%。我国学者刘洁教授团队通过深度卷积神经网络(CNN)诊断色素痣和脂溢性角化病(SK)的皮肤镜图像,并与皮肤科医师的诊断相比较,发现CNN自动分类模型在色素痣和SK皮肤镜图像的二分类任务中的表现与有经验的皮肤科医师水平相当[5]。
2.1.2 炎症性皮肤病:以银屑病为例,AI在多个环节助力疾病管理:(1)诊断辅助:Zhao等[6]构建了基于CNN的两阶段深度学习模型,用于银屑病的识别与诊断,且该模型不依赖皮肤镜,仅通过临床图像及电子病历,该模型的误诊率、漏诊率及诊断正确率均优于皮肤科医生。(2)皮损评估:Breslavets等[7]通过训练后的人工神经网络(ANN)对银屑病病人的皮损面积进行评估,平均百分比误差(MPE)为8.71%,优于皮肤科医生的28.16%。人体银屑病面积与严重性指数(PASI)评分智能系统通过采集病人特定姿势的照片,并经过图像后续处理,自动识别形状,测定红斑、鳞屑和浸润程度,给出整体PASI评分[8]。相比于皮肤科医师目测评估,该方法有更好的准确性、一致性和可重复性。
此外,Wu等[9]基于EfficientNet-b4 CNN算法,开发了一种用于银屑病、湿疹、特应性皮炎的AI皮肤病辅助诊断系统,总体诊断准确率为95.80%,敏感度为94.40%,特异度为97.20%。
2.1.3 感染性皮肤病:痤疮可能表现为粉刺、丘疹、结节、脓疱、囊肿、瘢痕等。李承旭等[10]尝试了一种基于CNN的面部寻常痤疮辅助分类方法,目前该模型对于粉刺、丘疹分类的灵敏度高于皮肤科医生分类的灵敏度,但结节和囊肿的分类性能较低,尚需要进一步的完善。Han等[11]通过基于区域的CNN来创建标准化指甲图像的数据集,并训练以区分指甲和背景,获得的模型在4个验证集中诊断甲真菌病的敏感度和特异度分别为82.7%~96.7%和69.3%~96.7%,优于皮肤科医生。
2.1.4 色素性皮肤病:郭丽芳等[12]通过构建面部白癜风AI诊断模型Vit4,在50组白癜风、30组白色糠疹、7组无色素痣、10组正常皮肤的面部皮肤图像中的诊断准确率为88.66%(86/97),低于皮肤科医生的诊断准确率(92.78%,90/97),但差异无统计学意义(χ2=2.323,P>0.05)。
2.1.5 其他:刘洁教授团队研发的基于深度学习的AI框架可以辅助鉴别包括扁平苔藓、酒渣鼻、病毒性疣、寻常痤疮、瘢痕疙瘩和增生性瘢痕、湿疹和皮炎、皮肤纤维瘤、脂溢性皮炎、SK、黑色素细胞痣、血管瘤、银屑病、鲜红斑痣和基底细胞癌在内的14种临床常见病[13],总体准确率为94.8%,敏感度为93.4%,特异度为95.0%,诊断水平与皮肤科专业医师相当。
AI在皮肤病学领域的应用远不止上述所列,随着诊断方法的不断更新,新型的皮肤影像数据就会出现,AI的新用法也将应运而生。
2.2 皮肤病学相关AI产品 2017年5月,“中国人群皮肤影像资源库项目(Chinese Skin Image Database,CSID)”成立,旨在建设成为我国皮肤影像技术研究、教育与应用的共性资源和技术平台。系列AI产品的研发都将基于CSID。目前已有产品逐步应用到临床[14-15],包括:(1)多维度皮肤影像分析管理系统(云MIIS系统):可实现多时空整合的多模态皮肤影像数据采集、传输、存储等功能的分析管理,支持“基层检查、上级诊断”,并可整合AI应用构建科室数据库。(2)黄色人种皮肤肿瘤AI辅助决策系统——优智AI-1.0:该应用于2018年3月在中日友好医院首次公开发布,其通过皮肤镜辅助诊断皮肤肿瘤良恶性分类准确率达到85.2%,对皮肤肿瘤疾病分类准确率达到66.7%;迭代产品优智AI-2.0对皮肤肿瘤良恶性的识别率提升到91.2%,疾病类型的识别率提升到81.4%。(3)老年皮肤肿瘤AI远程诊疗工具:于2018年6月发布,旨在赋能基层医疗机构医生对老年皮肤肿瘤的诊断和筛查,并在复旦大学附属华山医院皮肤科医联体内的200余家基层医疗机构逐步推广使用。(4)黑甲AI-1.0:是针对甲板色素性损害的智能诊断和鉴别诊断工具,对以黑甲为主要表现的疾病平均识别率达到87%。(5)优智皮肤AI系列慢病(银屑病、白癜风)管理AI:银屑病慢病管理AI于2018年10月发布,可辅助银屑病的诊断及鉴别诊断、远程会诊以及相关指数的评分;白癜风慢病管理AI辅助白癜风病人的病情评估。
此外,国内的慧捷肌肤(微信公众号)以及睿肤学苑(微信公众号)目前已上线多个智能应用小程序供用户使用,小程序“睿肤识别”页面提示该应用由华夏皮肤影像AI协作组指导,但目前仅供已认证的医生使用:(1)智能影像可以对手机拍照或者皮肤镜图像进行识别,并给出几种可能的推测结果;(2)脱发识别通过用户上传皮肤镜图片,评估其为雄秃或者斑秃的可能性;(3)基底细胞癌识别发布于2023年3月,是我国首个面向基底细胞癌辅助诊疗的智能化应用系统,医生用户可以通过可疑的皮损照片,获得初步辅助诊断结果;(4)病程管理中开放智能PASI评分、智能特应性皮炎(SCORAD)评分以及智能白癜风面积评分指数(VASI)评分,分别辅助银屑病、特应性皮炎及白癜风病人的病情评估。
研发始于2016年的体素科技的皮肤AI产品”体素肤知汇”,摒弃单病种AI的设计思路,为用户提供智能皮肤全病种检测解决方案。该应用通过深度学习算法,对用户上传的皮损照片进行皮肤病风险评估,并通过多道选择题问询相关信息后给出结果和建议。
荷兰开发的手机软件SkinVision,通过用户手机采集的皮损图片信息,识别并分析是否为皮肤恶性肿瘤,其灵敏度高达95%,但特异度较低(78.3%)[16]。该软件评估结果可以及时提醒用户对可疑的“黑痣”保持密切关注或尽快咨询医生[17]。付费软件Autoderm(https://autoderm.firstderm.com/)可以根据图片给出几种可能的诊断,并引导用户进一步咨询专业医师。
3 展望
尽管AI在皮肤病学中应用的进展很大,甚至常有文献报道其对皮肤病的诊断评估结果优于皮肤科专业医师,但基于它运行的方法和模式,AI仍有一些局限性。目前多数模型的应用结果都是基于特定的或已经加工处理过的数据集,而缺乏推广至真实世界临床数据应用后的反馈统计,尚未看到详细报道AI实际评估的准确性、特异性及灵敏性等数据。AI的应用成功与否很大程度上依赖于前期对机器的人为训练是否完善到位。原始数据集的数量大小、质量情况(包括来源是否多样、是否有代表性等等)都将影响训练的结果,此外,人工设置的规则能否涵盖所有的情况、对特殊情况的预判及处理往往决定着AI适用范围的大小。已经商业化的AI应用通常是“黑盒子”,即,它很难解释为什么做出了某个决策。当它做出错误的决策时,用户很难找出原因并进行修正,甚至无法识别其错误。
2021年新英格兰医学杂志刊文指出,技术变化(如软件供应商改变)、人口和环境变化(如新的人口统计数据)和行为变化等都可能导致数据集位移[18],即开发数据集和部署数据集之间不匹配,从而出现AI表现不佳。2020年密歇根大学医院曾由于数据集位移停用了败血症警报模型,原因是新冠病毒大流行改变了发热和细菌败血症之间的关系(病人特征变化),导致原预警模型不再适用[18]。
AI的相关应用在推广阶段的产品介绍可能会夸大其实际功能,笔者通过皮肤镜图片及临床图片测试了上述列举的几款AI小程序,准确率不一,尚需更多临床数据验证。目前而言,AI在皮肤病学的应用产品尚处在 “婴儿期”,未来还有很长的路要走。
笔者认为,AI是一把双刃剑。合理使用AI,可以提高生产效率,大大减轻工作量,对于已经训练成熟的模型可考虑产品化后投放市场,让市场检验产品并获得各种反馈,同时也需要皮肤科医师的持续监测,不断优化迭代。但AI若使用不当,包括产品力不足(AI提供错误信息)、使用人操作不当(例如使用范围不当、人种差异)、过度依赖AI(用户全盘相信,未对结果加以验证),则可能造成错误信息传播、甚至延误病人的治疗时机。因此,广大医务工作者需理性看待AI,已面向市场的产品需提示用户检测结果仅供参考。
本文第一部分内容——AI的含义及分类来自ChatGPT,笔者稍作修改。