APP下载

人工智能医疗器械监管现状分析

2022-09-26钟代笛

医疗卫生装备 2022年8期
关键词:医疗器械上市原则

唐 娜,王 浩,钟代笛*

(1.重庆大学生物工程学院,重庆 400044;2.中国食品药品检定研究院医疗器械检定所,北京 102629)

0 引言

人工智能(artificial intelligence,AI)在医疗健康领域中的应用越来越广泛,人工智能医疗器械(artificial intelligence medical device,AIMD)常以医疗器械独立软件(software as a medical device,SaMD)或医疗器械软件组件(software in a medical device,SiMD)的形式呈现,其被广泛地应用于影像、病理等领域以及临床辅助诊断、治疗、筛查等场景[1-7]。

AIMD的发展面临2个突出问题。一是如何建立临床用户对产品的信任。AI技术具有黑盒特性,特别是基于深度学习的AI算法,其输出结果往往难以解释,利益相关方对产品安全有效的评价还不够直接和深入[8-9]。在从技术到产品的转化过程中,如何保障AIMD的安全有效性,不仅需要从技术层面采取措施,还需要监管层面的控制。二是AI技术本身处于飞速发展阶段,AIMD产品的迭代更新也在加速,需要在更短的周期内对产品的安全有效性进行评价,对监管和测试提出了新的挑战,也推动着质量管理体系的调整。

为了解决上述问题,各国均在研究针对AIMD的监管政策,加强对AIMD安全性和有效性的评价,保障使用者及相关人员的安全。目前AIMD监管工作处于发展变革阶段,多个国家/地区/组织已陆续发布相关指导性文件和规范[10]。本文以问题为导向,对AIMD的监管现状进行总结,简要分析相关技术指导文件/标准的作用和适用范围,聚焦中国和美国目前的监管动态和监管思路,旨在为AIMD产业提供参考信息,并展望标准规范发展的趋势。

1 AIMD上市产品现状

近年来,AI技术在医疗领域的应用越来越广泛,相关算法模型也逐渐转化为产品并获批上市。从美国食品药品监督管理局(Food and Drug Administration,FDA)[11]以及我国国家药品监督管理局(National Medical Products Administration,NMPA)[12]官方网站查询获批上市的AIMD的相关资料(截至2021年底),整理结果如图1~3所示。

图1 1997—2021年美国和中国获批上市的AIMD产品数量

从图1中可以看出,2015年以前,每年在美国FDA获批上市的AIMD不超过6个,2015年以后,申请上市并获得批准的AIMD数量快速增长,2020年单年获批的AIMD产品数量已达100个,受新型冠状病毒肺炎疫情影响,2021年通过申请的AIMD产品数量有所下降。按照学科分类,70.3%的AIMD产品属于放射影像类产品,其次是心血管类产品和血液学相关产品,占比分别为12.5%和4.1%,可见放射影像类AIMD产品是目前研发的主要方向,如图2所示。

图2 美国AIMD产品临床适用方向分布情况

通过筛选,目前查到我国已取得Ⅲ类注册证的AIMD产品共有26个。我国在2020年批准第一款Ⅲ类AIMD,2021年拿到注册证的Ⅲ类AIMD产品数稳步上升,发展势头良好,其中,肺部影像类和心血管相关的产品占比分别约为42.3%和26.9%,眼底图像和骨骼相关的AIMD产品也各有3个,如图3所示。在加速审评的同时,药品监管部门对产品的分类界定也做了大量工作,依据《医疗器械分类目录》[13]和新制定的《人工智能医用软件产品分类界定指导原则》[14]对新产品进行分类界定,再依据管理类别对产品进行监管。

图3 中国AIMD产品临床适用方向分布情况

2 相关技术指导文件

有许多国家、组织正在研讨制定适用于AIMD监管的指导原则、指南和标准,从不同角度、不同层面为提高AIMD产品质量和保障其安全有效性提供规范要求和指导意见。表1总结了部分国家和标准组织正在制定/已颁布的标准/技术指导文件及其关注问题。

表1中所涉及医疗领域的标准/技术指导文件分别从术语、数据集、测试方法、可信赖性等方面对产品及其说明文档进行规范。AI医疗领域中有关术语定义的规范[17,24,26-27]既统一了行业内人员的表述,又为未来AIMD标准的制定建立了通用的词汇表。在AIMD研发过程中使用的数据集在很大程度上影响着AIMD的性能,因此建立高质量的数据集有利于开发性能良好的AIMD。相关标准[18-19,25]旨在规范数据集的建立流程、加强数据集质量的管理控制和评价,以提高数据集的质量。针对上市数量较多、预期用途相近的AIMD产品,相关标准[20]关注对其性能的客观量化评价,对性能指标、测试方法、测试流程、测试环境、测试集等内容进行规范。此外,国外的标准组织[28]还比较关注AI在医疗领域的可信赖性问题,从人类信任(human trust)、技术信任(technical trust)、监管信任(regulatory trust)3个方面讨论如何建立和维护最终用户对AI的信任。由于AI技术本身的黑盒特性降低了人们对AI技术应用的信任度,提高AIMD的可信赖性在一定程度上可以让更多人相信AIMD的输出结果。

表1 部分国家/标准组织的技术指导文件/标准

3 上市前与上市后监管

监管活动可按照医疗器械的全生命周期进行划分,对前期研发、上市审批、上市后监测(例如不良事件监测和再评价)等方面直到最后产品退役各个环节的合规性进行考量,具体的监管要素包括数据集质控、数据标注规范、算法评估验证、临床评估、上市前审批、软件更新、风险管理等。注册审批是决定技术能否产品化、获得市场准入并进行规模化临床应用的前提条件[29-30],同时,鉴于AIMD的更新频率加快,对已通过上市前审批的AIMD,如何控制产品的变更,使其在一定范围变更后保持性能不变且不需要再次审批,从而节约监管资源,这也是亟待解决的问题。本章将重点介绍美国和中国在审批和变更控制方面的监管方式,并介绍美国FDA联合其他监管机构提出的良好的机器学习实践(good machine learning practice,GMLP)概念。

3.1 上市审批

依据产品风险程度将医疗器械分为Ⅰ、Ⅱ、Ⅲ类[31],不同管理类别的医疗器械上市途径也不同,包括上市前批准(pre-market approval,PMA)、上市前通告(pre-market notification,PMN)即510(k)以及美国FDA针对高风险以外的医疗器械新品种提供的审批通道De Novo[32-33]。表2总结了2018—2021年美国AIMD产品的上市途径。

表2 2018—2021年美国AIMD产品的上市途径统计单位:个

从表2可以看出,2018—2021年,美国上市的AIMD绝大多数是进行510(k)审批的,少数新产品经过De Novo审批通道获批上市。目前美国已上市的AIMD大多数属于Ⅱ类医疗器械。

在我国,依据新颁布的《人工智能医用软件产品分类界定指导原则》[14],需要结合产品的预期用途、算法成熟度等来界定产品的管理类别,不同的管理类别在审评上市等环节会有差异。我国绝大部分AIMD属于Ⅲ类医疗器械,需要在上市前进行临床试验。在注册审批方面,我国也在加紧研究适合我国医疗器械行情的指导原则和技术指导文件。2019年,国家药品监督管理局医疗器械技术审评中心(以下简称“审评中心”)发布了《深度学习辅助决策医疗器械软件审评要点》[15],该审评要点适用于深度学习辅助决策医疗器械软件(含独立软件、软件组件)的注册申报,采用基于风险的全生命周期管理方法,考虑软件技术审评要求,审评要点重点关注软件的数据质量控制、算法泛化能力、临床使用风险。基于该审评要点,结合产品审评积累的经验和监管科学研究成果,2020年3月,为应对新型冠状病毒肺炎疫情,按照科学审评的原则和确保产品安全、有效、质量可控的要求,审评中心制定了《肺炎CT影像辅助分诊与评估软件审评要点(试行)》[21]。2022年3月,审评中心发布了《人工智能医疗器械注册审查指导原则》[16],该指导原则是AIMD的通用指导原则,囊括的内容更全面,仍然基于AIMD生存周期过程,涉及对数据、算法、验证与确认、更新控制等方面的考察,还有一些其他技术考量,适用于AIMD的注册申报,旨在指导注册人准备AIMD注册申报资料,同时规范AIMD技术审评要求。我国针对AIMD的审核重在梳理清楚审评要点以指导注册人准备注册申报资料。为了加速AI医疗产品的审核速度,国家药品监督管理局开辟绿色通道,重大创新产品可以通过此绿色通道更快地进行审批。

3.2 变更控制

AI算法更新迭代快,为了保障算法迭代后产品仍然能保持安全性和有效性,从监管的角度要加强对AIMD产品的变更控制。

2019年4月,美国FDA发布了《人工智能/机器学习独立软件更新监管框架—讨论稿及征求意见》(“Proposed Regulatory Framework for Modifications to Artificial Intelligence/Machine Learning(AI/ML)-Based Software as a Medical Device(SaMD)-Discussion Paper and Request for Feedback”)[34](以下简称《更新监管框架》),该讨论稿依赖国际医疗器械监管者论坛(International Medical Device Regulators Forum,IMDRF)风险分类原则、FDA的利益-风险框架、风险管理原则以及预认证计划中设想的基于组织的产品全生命周期管理(total product life cycle,TPLC)方法,引入了一个“预先确定的变更控制计划”。这个拟议的独立软件更新监管框架构想把变更控制提前,预想可能的变更类型以及用于完成这些变更用到的相关方法学,提早对可能的产品变更做审查[35-36]。2021年1月,FDA发布《基于人工智能/机器学习的医疗器械软件行动计划》(“Artificial Intelligence/Machine Learning(AI/ML)-Based Software as a Medical Device(SaMD)Action Plan”)[22](以下简称《行动计划》),该《行动计划》回应了2019年《更新监管框架》发布后收到的反馈,并从监管框架、GMLP、透明度、算法偏见和鲁棒性、真实世界性能等方面概述了FDA打算采取的5项行动[37]。

我国对AIMD产品的更新控制也有相应要求,在《深度学习辅助决策医疗器械软件审评要点》[15]和《人工智能医疗器械注册审查指导原则》[16]中规定,产品更新属于重大软件更新,为保证产品的安全有效性以及变更后算法泛化能力还能满足需求,在发生变更时,应当开展算法性能评估、临床评价等验证与确认活动。相比之下,我国比较看重变更后产品的重新评估。

3.3 GMLP

美国、加拿大和英国的相关机构共同确定了10项指导原则,为GMLP的发展提供信息,进而促进使用人工智能/机器学习(artificial intelligence/machine learning,AI/ML)的医疗器械的安全性和有效性[23]。这10项指导原则从模型设计、数据集、临床测试、性能监控以及人员(研发人员、用户)等方面给出架构性的指导,涉及医疗器械的全生命周期,指出了IMDRF、国际标准组织以及其他合作机构可以努力推进GMLP的领域。

与2019年FDA发布的《更新监管框架》相比,10项指导原则更多地从全生命周期的角度进行考量,更加注重产品研发设计过程中涉及的相关要素以及性能测试等阶段的监管,关注点会更加多元化。尽管现在10项指导原则还是架构性的描述,相信通过不断地探索和实践,未来会有对10项原则更细化的具体介绍和描述。

4 讨论

AI技术在医疗行业不同疾病中的应用研究越来越多,随着各种疾病数据集的建立和算法模型的持续迭代研发,预计会有更多的AIMD申请上市。国内外的标准组织以及监管机构都在积极探索适用于AIMD的监管思路和标准规范。根据已发布的技术指导文件,国内监管机构对AIMD的分类界定、审评审批进行了梳理,起草了相关的行业标准。在落地过程中,还需要继续深化细节,例如在进行同类产品比对时,明确不同的性能测试方法是否会影响对比结果以及何种性能测试方法能更加准确地反映产品性能。

目前,AIMD的算法都是锁定的,不允许在临床使用阶段从数据中自适应地进行自我更新。但随着AI技术的发展和国外GMLP思想的演化,基于自适应算法的AIMD可能会走进现实,这需要我国监管机构提前关注对此类产品的性能评价和监管模式,在未来的监管框架中进行布局。

除了关注厂商声称的功能和性能,国外相关组织也十分关注伦理、可信赖性、可解释性等方面,这在一定程度上是为了让最终用户能放心地使用AIMD产品。目前,我国在这方面的考量还不够具体,建议从医生等最终用户的角度,关注其与AIMD之间的人机交互,一方面提高最终用户对AIMD的信任度,让更多的人愿意采用AIMD,另一方面厂商也可以根据用户反馈的意见优化产品设计,从而提高产品质量。

综上所述,AIMD的监管政策处于发展演化阶段,强调科学化、体系化,一方面围绕产品的安全有效,不断形成新方法、新工具、新标准,提升质量评价能力;另一方面也在转变理念,从管理体系的角度应对产业的变化,覆盖全生命周期。

猜你喜欢

医疗器械上市原则
10.59万元起售,一汽奔腾2022款B70及T55诚意上市
14.18万元起售,2022款C-HR上市
12.99万元起售,UNI-V 2.0T正式上市,UNI-V iDD全球首秀
医疗器械检验数据修约问题的探讨
外来医疗器械管理存在的问题与对策
医院医疗器械维修中存在的问题及维修管理策略
十二星座的做事原则
家用医疗器械监管现状与发展趋势
党支部的工作原则是什么?
5月上市