人工智能医学软件产品研发工艺及监管政策研究
2022-03-14许嘉驿陈卓江映珠陆兆丹李卓琦
许嘉驿 陈卓 江映珠 陆兆丹 李卓琦
1 广东省药品监督管理局审评认证中心 (广东 广州 510080)
2 腾讯医疗健康(深圳)有限公司 (广东 深圳 518057)
内容提要: 研究分析人工智能医学软件产品研发工艺及国内外监管政策、相关文献,为人工智能医学软件的注册申报、技术审评及现场检查相关工作提供借鉴。
近年来,随着算法技术与大数据的兴起,人工智能的热浪席卷全球,人工智能目前已成为全球互联网经济市场最为关注的一项新技术。第十二届CIMDR会议提出实现医疗器械创新需注重发展“十四五”科技攻关七大重点领域。人工智能作为我国创新发展重点领域技术之一,为医疗器械行业创新注入了新的动力。我国应用于医疗器械的AI软件快速发展,申请相关产品注册审查的企业正逐年增加。本文将针对人工智能医学软件(以下简称“AI医学软件”)研发生产工艺及国内外监管政策进行研究分析,为AI医学软件的注册申报、技术审评及现场检查相关工作提供借鉴。
1.AI医学软件概要
1.1 AI医学软件
AI医学软件是基于医疗器械数据,采用人工智能技术实现其医疗用途的独立软件及软件组件[1]。AI医学软件通过机器学习等算法技术主要运用在医疗器械领域中的医学造影、辅助决策、药物研究、卫生系统管理、病情预警等方面。随着AI医学软件逐渐应用在临床机构,一方面可以加快医疗数据的统计与分析速度,为诊断工作提供参考,提高医生的工作效率;另一方面可以帮助医院更全面地实现医疗信息全覆盖,提升医疗服务质量。
1.2 AI医学软件的研发生产工艺
从医疗器械生产工艺上来思考,AI医学软件与普通医疗软件没有太大的区别,关键在于软件产品的研发生产工艺的差异。在AI医学软件的研发工艺中,数据收集是区别于其他软件产品的一个重要环节。AI医学软件产品的数据可类比为普通医疗器械产品的物料,数据收集的三个环节数据采集、数据整理、数据标注可分别对应于物料采购、来料检验、物料加工。
同时,考虑到软件版本控制的重要性,生产环节也需加以管控,因此,生产过程中可根据生产链路各环节出错的风险,评估是否增加相应的控制手段,例如:MD5码核验、试安装检验等步骤,用来进一步确认生产用软件包的正确性。
1.3 AI医学软件研发管理的特点
AI医学软件与其他医疗软件最大的区别是增加了数据收集和算法设计两个环节。其中,数据收集又包含数据采集、数据整理、数据标注、数据集构建四个子任务;算法设计则包含算法选择、算法训练、算法性能评估三个子任务[2]。
1.3.1 数据收集
数据收集阶段是决定AI产品是否安全有效的重要环节之一,数据规模、数据质量和泛化能力等因素会影响算法的训练效果。该阶段涉及企业、医院、医生、采集设备、采集环境等诸多外界条件,因此,控制难度和沟通成本较高;若数据脱敏,数据转移等环节管控不到位,会带来医疗数据泄露的风险;采集出院和标注使用的数据量较大,容易出现标注追溯困难、数据管理混乱等问题,导致数据统计产生偏差甚至无法统计的情况发生。因此,数据收集阶段需在以下几个方面进行重点管理:①根据泛化要求,选择合适的数据来源医院。选择符合质量要求的数据,明确数据出院的方式,明确出院前的处理规则和处理工具,做好出院前的数据信息记录与验收工作,同时,采集的数据应方便随时回溯,以备后续的统计分析工作。②数据出院过程中,保证数据安全。减少接触数据的人员数量,接触数据的人员应留下记录且可被追溯,避免数据丢失和被污染。③根据临床应用场景,应配置满足资质要求的标注人员按照既定规则分配数据标注任务,在预期环节进行既定数据的标注工作,标注人员只需关注自己名下的标注任务即可,保证数据标注工作能够被追溯。例如:交叉标注时,应由既定数量医生进行标注且不出现同一标注人员重复标注的情况、标注医生应早于仲裁医生进行标注、多名标注医生均完成标注和一致性对比后方可进行仲裁等;标注时,每例数据对应的标注人员,标注时间、标注结果,均应方便回溯。
1.3.2 算法设计
算法设计阶段是通过选择合适的算法,使用收集后数据构建训练集,调优集进行训练和调优,并通过测试集对算法进行评估。算法模块是整个AI医学软件产品的核心,也是软件安全等级最高的模块之一。一款产品中可能包含多个算法,不同算法之间的输入输出关系会直接影响最终的辅助决策结果。算法设计应结合实际数据情况对数据进行预处理,为接下来的数据训练做好充足准备。因此,算法设计阶段需在以下几个方面进行重点管理:①应选择合适的算法,并在过程中清晰管控与记录所使用的算法。如:结合产品预期用途,明确算法选用依据,包括选用的理由和基本原则,明确算法的特性。②算法需输出详细设计方案,详细记录不同算法之间的输入输出,工作流等,以清楚的呈现算法的设计思路。③应提前规划预处理的方案,明确处理方法,并确认好预处理所用到的软件工具,降低预处理所用工具不规范带来的风险。
目前,信息化管理是AI医学软件发展的必经之路,也是行业亟需补齐的短板之一。
数据采集信息化工具应满足数据全生命周期管理的需求,将数据统一在系统中进行管控,各环节以直观简单的方式进行数据调度,减少人为操作的空间,从而轻松实现数据的可追溯性;其次,系统需内置多样化数据管理工具,例如:脱敏工具、标注工具等,降低数据收集所用工具不规范带来的风险;系统应具备数据统计功能,实现可动态关注数据泛化情况、数据标注进度等;最后,系统应具备可扩展的存储能力,以满足不同阶段的数据存储需求。
算法设计管理工作可通过信息化管理工具来协助完成。例如:信息化管理工具自带一些影像组学、深度学习算法,可帮助研发人员直接选择和使用,产品研制过程中,企业也可接入自研算法,方便对所使用的算法进行统一管理和记录;通过信息化管理直观表达算法之间的串联关系,从而厘清设计思路,减少算法调整环节出现错误;在管理工具中内置不同种类的预处理、模型和验证等算子,提升算法训练过程的标准化能力,降低人为错误的出现概率。
因此,在产品研制过程中,企业应规范化数据收集和算法设计流程,具备严谨的数据管理,内置算法及工具等,从而准确把握医疗AI产品的研发诉求和满足全周期开发需求的环境。
2.国内外监管政策研究
2.1 AI医学软件国际监管政策
2.1.1 国际医疗器械监管者论坛(IMDRF)
2013年12月,国际医疗器械监管者论坛(International Medical Device Regulators Forum,IMDRF)发布了《作为医疗设备的软件(SADM):关键定义》(Software as a Medical Device(SAMD): Key Definitions)[3]。该文件首次明确了独立软件的定义。2014年9月,IMDRF发布了《SAMD:风险分类框架》(Software as a Medical Device(SAMD): Possible Framework for Risk Categorization and Corre-sponding Considerations)[4]。该框架对SAMD的预期用途、背景、定性的重要因素、框架与现有分类和设计开发等方面进行论述和分析,为各国监管机构、用户等建立对SAMD的理解提供参考。2015年10月,IMDRF发布《关于使用IEC 62304:2006“SAMD-软件生命周期过程”》(Statement regarding Use of IEC 62304:2006“Medical device software—Software life cycle processes”)的声明[5]。该声明对中国、欧盟、日本、俄罗斯、美国等司法管辖区对IEC62304:2006标准的认可与使用作了详细的解读。其中,中国原食品药品监督管理局(以下简称总局)将IEC62304:2006翻译后相等于中国行业标准YY/T 0664-2008,该标准不作为强制性标准,作为推荐性标准。2017年9月,IMDRF发布了《SAMD:临床评估》(Software as a Medical Device(SAMD): Clinical Evaluation)[6]。该文件为全球监管机构对相关术语、风险框架、质量管理体系原则以及临床评估等提供框架。
2.1.2 美国FDA
2020年1月,美国FDA发布了《有关AI/ML医疗器械软件的产品变更监管框架》(Proposed Regulatory Framework for Modifications to Artificial Intelligence/Machine Learning(AI/ML)-Based Software as a Medical Device(SAMD))[7]。该框架确定了上市前需补充申请或提交的软件修改类别,保证AI/ML的SAMD的安全性和有效性。基于此框架,美国FDA于2021年1月发布了《AI/ML独立软件行动计划》(Artificial Intelligence and Machine Learning (AI/ML) Software as a Medical Device Action Plan)[8]。该计划旨在明确AI/ML独立软件监管的框架、机器学习实践、算法监管科学研究、产品真实性能、以及以患者为中心和信息透明相结合的五项工作和目标。
2.1.3 欧盟
欧盟2018年4月制定了人工智能发展方向,主要以机器人技术作为战略计划,同时设立了人工智能高级专家组(High-Level Expert Group on Artificial Intelligence,AI HLEG)。AI HLEG致力于四个主要交付品:可信人工智能的道德准则、可信人工智能的政策和投资建议、最终可信人工智能评估列表和关于政策和投资建议的部门考虑。12月欧洲委员会经AI HLEG倡议发布了第一个《人工智能协调计划》(Coordinated Plan on Artificial Intelligence)[9]。2020年2月,欧洲委员会发布了关于《人工智能白皮书—欧洲对卓越和信任的态度》(White Paper on Artificial Intelligence: a European approach to excellence and trust)[10]。白皮书提出了各种政策选择,建立基于风险的五级监管体系,促进对人工智能的吸收和处理与此类技术的某些使用有关的风险通过提出可信赖的人工智能的法律框架,实现建立可信任AI生态系统的。2021年制定了《关于人工智能的统一规则(人工智能法)》(Regulation of the European parliament and of the council laying down Harmonised Rules on Artificial Intelligence(ARTIFICIAL INTELLIGENCEACT))[11]。该提案明确了人工智能相关的风险和问题的最低要求,包括人工智能系统应该遵守的基于原则的要求,为欧盟体系内国家人工智能系统的开发、投放市场和使用制定了统一的规则,对个人健康和安全或基本权利构成重大风险的“高风险”人工智能系统提供了坚实的风险方法,保障人工智能系统全生命周期内的安全保护的基本权利。
以上可知,国际医疗器械监管机构均对AI医学软件的发展高度重视,目前国际上虽未有国家建立起完整的AI医学软件监督管理体系,但均对AI软件监管工作制定了计划与目标。
2.2 AI医学软件国内监管政策
2015年8月,原食药监总局发布了《医疗器械软件注册技术审查指导原则(2015年第50号)》[12]。该原则明确了独立软件与软件组件的定义和特征,将医学软件按YY/T 0664《医疗器械软件 软件生存周期过程》[13]分成了A、B、C(低、中、高)三个风险水平等级,制定了软件及软件更新和部分现成软件描述文档框架,为医学软件监管工作明确了方向。我国人工智能医疗的概念提出较晚于其他国家。2016年开始,我国开始关注人工智能创新领域并出台了一些相关政策,政策的发布和推广推动了医疗器械监管部门对于AI医疗的监管工作。2017年我国首次明确以人工智能为核心的发展规划,明确这一新兴行业的战略目标。2017年国家药监局陆续发布了《医疗器械网络安全注册技术审查指导原则(2017年第13号)》[14]《移动医疗器械注册技术审查指导原则(2017年第222号)》[15]。
AI医学软件主要以机器学习作为核心算法,其中包含了深度学习算法技术。深度学习是具备特征学习和数据提速获取的一种算法。随着深度学习技术蓬勃发展,其广泛应用于我国AI医学软件。2019年7月,国家药监局器审中心发布了《深度学习辅助决策医疗器械软件审评要点》[16]。该要点对深度学习辅助医学软件的基础知识做了详细的解读,从审评需要重点关注的方面明确审评内容,为相关产品的审评工作提供了可靠的建议。2020年5月,国家药监局发布了《医疗器械生产质量管理规范附录独立软件(2019年第43号)》的通告[17]。次月,《医疗器械生产质量管理规范独立软件现场检查指导原则》[18]发布(于2020年7月1日施行)。这两部法规的发布,弥补了我国独立软件现场检查工作的不足,提高了检查员对于软件检查工作的效率和准确性,同时,为后续AI医学软件现场检查附录的编写工作提供了基本框架和思路。
2021年7月,国家药监局发布《人工智能医用软件产品分类界定指导原则(2021年第47号)》[1]。该指导原则首次明确了AI医学软件及医疗器械数据的定义,对相关产品属性、类别进行了界定,加快了AI医学软件产品监督法规的完善进程,规范产品类别,推动AI产业在医疗器械领域的高质量发展。2022年3月,国家药监局发布《人工智能医疗器械注册审查指导原则(2022年第8号)》[2],该原则的发布,统一AI医疗器械注册审评信息,指导注册申请人建立AI医疗器械生存周期过程和准备AI医疗器械注册申报资料,同时规范AI医疗器械的技术审评要求。
3.小结
本文从AI医学软件概要、研发生产工艺、研发管理特点研究入手,分析AI医学软件与常规软件生产工艺(包括研发过程)的差异,梳理出AI医学软件在研发管理上的特点,为企业申报AI医学软件产品注册以及质量体系核查工作提供参考。
在监管政策方面,则分别从国际医疗器械监管机构(IMDRF,美国FDA,欧盟)以及国内监管政策进行研究分析,厘清国内外监管机构针对AI医学软件所指定的法规以及规范性文件的思路,特别梳理出国内相关法规文件制订及完善的过程,能更全面地了解国内监管机构对AI医学软件在技术审评以及现场检查方面的关注点,同时也能为将来AI医学软件相关法规的编写及修订提供借鉴。