专家评估在杂质遗传毒性(定量)构效关系评价中的应用
2023-06-11祝清芬苏昕宇钱利民
耿 雪,祝清芬,魏 霞,苏昕宇,刘 娜,钱利民
(1. 山东省食品药品检定研究院·国家药监局仿制药研究与评价重点实验室·山东省仿制药一致性评价工程技术中心,山东 济南 250101; 2. 山东中医药大学,山东 济南 250355; 3. 山东第一医科大学第一附属医院·山东省千佛山医院,山东 济南 250014)
药物遗传毒性杂质的控制是药品质量和风险管理的重要方面。(定量)构效关系[(Q)SAR]评价是目前药物杂质遗传毒性评价的有效手段[1],评价结果可作为杂质遗传毒性确定的依据及药品注册资料。人用药品技术要求国际协调理事会(ICH)M7(R1)指导原则基于风险评估的原则,按照物质的致癌性和突变性风险,将药物杂质分为1~5 类,规定评价程序为检索文献中杂质的致突变性、致癌性数据,并分为1 类、2 类、5 类[2]。(Q)SAR 方法是根据警示结构和对细菌回复突变试验的预测进行分类,要求采用2 个互补的(Q)SAR 预测方法,分别基于专家规则和统计学[3]。目前,常用的商业化软件包括Nexus 软件、CASE Ultra 软件、Model Applier 软件等[4-5]。经预测,若杂质含有与原料药或与原料药相关的物质相同的警示结构如工艺中间体,且该原料药或与原料药相关的物质经测试为无致突变性,则可归为4 类;若含有警示结构,但有充分数据认为该警示结构无致突变性或致癌性,或不含有警示结构,则可归为5 类;若含有与原料药结构无关的警示结构,但无致突变性数据,则可归为3 类[6]。但(Q)SAR 预测结果并不能保证完全准确,且在实际预测过程中,除出现阴性(4 类、5 类)、阳性(1 类、2 类、3 类)结果外,有时还会得到未分类结果。对此,ICH M7(R1)指导原则中提到,对计算机系统得到的任何阳性、阴性、相互矛盾或超出域的预测结果,如有必要申请人可根据专家知识进行综合评估,提供进一步支持性证据,合理论证,并得出最终结论。应用专家知识进行评估可获得明确的分类结果,提高(Q)SAR 的预测性能及准确性。Ames 试验是化合物(Q)SAR 建立的遗传毒性筛选数据库的重要基础[7]。专家评估可通过比较具有细菌回复突变试验分析数据的结构类似的化合物(跨读法),确定该化合物是否有可能与DNA 发生反应,采用第三方软件进行补充预测的方式[8-10]。ICH M7(R1)并未提供指定的专家评估程序,故利用专家知识评价挑战性很强[11-13],我国尚未见相关研究报道。为此,本研究中依据ICH M7(R1)指导原则相关要求,采用Derek Nexus(基于专家知识规则)和Sarah Nexus(基于统计学)软件对实例化合物进行遗传毒性杂质评价,并进一步利用专家知识评估,提供合理论证,获得最终分类结果,为药品审评过程中专家评估的应用提供参考。现报道如下。
1 软件版本与方法
1.1 软件版本
Nexus:2.5.0,英国Lhasa 公司(http:// www. lhasalimited. org/)旗下Derek,Sarah,Vitic,Meteor,Zeneth 等软件的整合平台。Derek Nexus 版本:6.1.1;数据库:Derek KB 2020;数据库版本:1.0。Derek用于杂质遗传毒性预测,基本设置为,物种(species)设置为细菌(bacterium),预测终点(endpoints)设置为遗传毒性(genotoxicity)项下的致突变性(mutagenicity)。Sarah Nexus 版本:3.2.0;模型:Sarah Model-2022.1;模型版本:1.9。
1.2 方法
绘制实例1、实例2、实例3 的化学结构图,输入Nexus 软件,采用ICH M7(R1)分类模式对杂质进行遗传毒性预测。
2 结果
2.1 实例1
杂质实例1:预测结果Derek为阴性(Incative),Sarah为阳性(Positive),软件分类为3 类。Sarah 阳性可信度为23%,基于软件标注,提供了4 个结构阳性假说,hypotheses ID分别为H-32,H-248,H-285,H-254(表1)。根据软件内置的专家评价机制,按Lhasa 公司的警示结构- 预测假设关联规则,依据与杂质化学结构的相似度排序,采用Derek分析相似度最大的17个遗传毒性阳性化合物,发现其造成杂质遗传毒性阳性的警戒结构包括代号分别为329,344,326,664,027,007 的芳香硝基化合物、1,2-二羰基化合物或前体、偕二卤、α,β不饱和化合物、烷化剂、N-硝基或N-亚硝基化合物,均不存在于杂质实例1(表2)。人为添加软件中的讨论意见18 内容见图1。最终经软件评价和专家评估,将杂质实例1预测为遗传毒性阴性,分类为5类(表3)。
图1 讨论意见18内容Fig.1 Content of arguments opinion 18
表1 杂质实例1 Sarah预测假说Tab.1 Sarah prediction hypothesis of impurity case 1
表2 杂质实例1相似遗传毒性化合物信息Tab.2 Information of genotoxic compounds similar to impurity case 1
表3 杂质实例1遗传毒性预测结果Tab.3 Genotoxicity prediction results of impurity case 1
2.2 实例2
化合物实例2 预测结果Derek 为阴性(Inactive),Sarah为模棱两可(Equivocal),软件未得到分类结果。基于软件标注,Sarah提供了1个结构阴性假说(hypotheses ID 为H - 243)和1 个结构阳性假说(hypotheses ID 为H-275),详见图2。根据软件内置的专家评价机制,按照Lhasa 公司的警示结构-预测假设关联规则,依据与杂质化学结构的相似度排序,阳性假说H-275 中相似度最大50 个化合物中有25 个化合物遗传毒性为阳性(表4),对这25 个化合物分别利用Derek 分析后,发现其造成化合物遗传毒性阳性的警戒结构代号分别为820,842,074,073,318,070,304,072,794,638,318,617,repidprototype 154,317 的芳香硝基化合物、1,2 -二羰基化合物或前体、偕二卤、烷化剂、N-硝基或N-亚硝基化合物、异氰酸酯或异硫氰酸盐、环氧化物、卤代硫醇衍生物、羟基脲/胍/氨基甲酸酯、叠氮化物、卤代烯烃、苯胺或前体、苄基二甲基三氮烯,均不存在于杂质实例2。人为添加软件中的讨论意见33内容见图3。最终经软件评价和专家评估,将杂质实例2判定为遗传毒性为阴性,分类为5类(表5)。
图2 杂质实例2 Sarah预测假说Fig.2 Sarah prediction hypothesis of impurity case 2
图3 讨论意见33内容Fig.3 Content of arguments opinion 33
表4 杂质实例2相似遗传毒性化合物信息Tab.4 Information of genotoxic compounds similar to impurity case 2
表5 杂质实例2遗传毒性预测结果Tab.5 Genotoxicity prediction results of impurity case 2
2.3 实例3
化合物实例3 预测结果Derek 为阴性(Incative),Sarah 为阴性(Negative),软件预测结果为阴性。Sarah 可信度为33%,基于软件标注,提供了1 个结构阴性假说(hypotheses ID为H-235),数据集中有11个结构类似化合物,详见图4。根据软件内置数据库,发现该化合物有致癌性和致突变性试验数据,致癌性为阳性,Ames试验中TA98菌株既有阳性结果也有阴性结果(图5)。基于其致癌性风险,人为添加软件中的讨论意见39内容见图6。最终经软件评价和专家评估,将杂质实例3预测为遗传毒性为阳性,分类为1类(表6)。
图4 杂质实例3 Sarah预测假说Fig.4 Sarah prediction hypothesis of impurity case 3
图5 Ames试验菌株结果示意图Fig.5 Schematic diagram of the Ames test result
图6 讨论意见39内容Fig.6 Content of arguments opinion 39
表6 杂质实例3遗传毒性预测结果Tab.6 Genotoxicity prediction results of impurity case 3
3 讨论
ICH M7(R1)指导原则建议使用互补(Q)SAR 模型作为Ames 试验的高通量替代检验方法来评估药物杂质的致突变潜力,还指出在必要时应使用专家知识回顾来为任何阳性、阴性的未分类或有冲突的预测结果提供明确的理论依据,并得到最终结论。一项美国食品和药物管理局(FDA)对2017 年4 月至2019 年3 月在药品监管申请中评估的1 002 种杂质的回顾性分析中,评估了专家审查对(Q)SAR 预测的影响,专家知识回顾推翻了26%的错误预测,解决了91%的模棱两可(Equivocal)的预测和75% 的超出域(Outside domain)的结果[14]。261个被推翻的预测中,15%的预测上调至“模棱两可”或“阳性”,79%的预测下调至“模棱两可”或“阴性”[14]。
应用专家知识对预测结果进行评价取决于预测结果的质量,如是否可信度较高、是否存在无法正确判断的结构等信息。对于两类软件给出了一致的预测结果,专家评估较易给出结论,但对于两类软件结果不一致、模棱两可、超出域等情况,进行专家评估需要研究者具备深厚的专业知识的和丰富的工作经验。利用专家知识进行评估时,依据要充分,特别是将阳性预测结果评价为阴性时,一定要充分考虑被评价杂质的风险[15]。近年来,越来越多的学者开始关注专家评估,并给出了经典案例[11,16]。本研究中提供的3 个案例均为笔者在杂质遗传毒性评价工作中遇到的实际案例,不仅包含了2 类软件结果不一致、未得到分类结果,还包含了1 个一致阴性预测结果被推翻的实例,可为药物杂质遗传毒性评价中应用专家知识评估提供参考。