数字医学时代罕见病研究发展新趋势
2024-04-02王剑李牛
王 剑 李 牛
1.上海交通大学医学院附属国际和平妇幼保健院(上海 200030)
2.上海市胚胎源性疾病重点实验室(上海 200030)
罕见病是指患病率较低(<1∶10000)的一类疾病,其种类繁多(>7000种),同时还具有病情严重、误诊率高、诊断困难和可治性低等特点,大部分罕见病属于遗传性疾病(>80%),其中一半以上在出生时或儿童期发病[1-2]。早期准确诊断对于罕见疾病患者至关重要,它能确保知情决策、进行有针对性的治疗、降低并发症风险、改善患者健康状况和维持医疗保健可持续性等。但目前仍有相当部分罕见病患者需要经历一个漫长而艰巨的诊断过程[1]。随着大数据、机器学习、云计算等技术在医学领域的广泛应用,罕见病的筛查、诊断、治疗及预防也进入了数字化医学时代[3]。本文从多组学技术、罕见病登记数据库、人工智能、基因治疗等方面,探讨罕见病领域发展趋势和前景。
1 多组学技术提升罕见病筛查与诊断效率
在过去的十多年中,外周血基因组DNA样本高通量测序已逐步成为罕见病诊断的主要手段,使大多数罕见遗传病能够被精准筛查和诊断,但目前仍有部分患者未能得到准确诊断。近年来随着多组学技术的飞速发展以及生物信息、计算分析能力的提升,包括转录组学、蛋白质组学、代谢组学和脂质组学、表观遗传甲基化分析在内的多种技术已可作为罕见病新的筛查与诊断方法。以下逐一介绍各组学技术临床应用进展。
1.1 转录组学方法
转录组学方法可能是近年来应用于罕见病中发展最快的的组学技术之一,在多项临床研究中,其已被成功用于全外显子组测序(whole-exome sequencing,WES)或全基因组测序(whole-genome sequencing,WGS)的有效补充,可单独增加10%~20%的诊断率。在许多已报道病例中,RNA测序(RNA-seq)为分子诊断提供了重要的功能证据支持[4-7]。转录组学可用于意义不明变异(variant of uncertain significance,VUS)的重新分类和提示容易被忽视的可能致病性基因变异。研究显示,RNA-seq最优的效用是帮助提供非编码区变异的临床解读,这是现阶段WGS在临床应用中面临的最大挑战[8]。目前,RNA-seq常规分析主要分为异常RNA表达丰度、异常剪接和等位基因特异性表达三种形式。此外,也可以用于基因变异筛检、单倍型分析、融合基因或重复扩增的检测等[8]。尽管RNA-seq 是一种非常通用的检测方法,但mRNA表达的组织特异性与不稳定性限制了其在临床上的应用,因为很难获取需要侵入性活检的组织标本。多项研究表明,与血液中的表达相比,临床相关基因在成纤维细胞中的表达更高[4,9]。如果目标基因在可用组织中不表达,也可转导到诱导多能干细胞(iPSC)或受影响的组织相关细胞系[10]。
1.2 蛋白质组学
该方法提供了蛋白质水平的直接定量,为RNAseq和DNA分析提供了一种很好的互补分析。此外,致病性错义突变很少导致异常的RNA表达,但经常影响蛋白质的稳定性。蛋白质水平的显著降低可为判断错义突变和调控突变的功能提供有价值的参考[11-12]。蛋白质组学提供了额外水平的功能证据,可以验证和扩展转录组学数据,从而为提高诊断率开辟新的前景。
1.3 代谢组学和脂质组学
代谢组学和脂质组学可以提供细胞代谢的全面和整体视图,并能够检测致病性变异引起的代谢紊乱。通过将这些分子物种的水平与健康个体或普通人群的水平进行比较,可以确定与特定遗传条件相关的特征代谢生物标志物和特征。代谢生物标志物和特征可以直接为临床诊断、指导患者治疗和评估遗传发现提供信息[13]。非靶向代谢组学检测方法可以量化数万个特征,可用于筛选新的生物标志物[13-14]。代谢物异常值检测可以帮助提供VUS重新分类所需的功能证据[15]。
1.4 表观遗传学修饰
DNA甲基化和组蛋白修饰已被广泛研究,并已被证明在多种罕见病的发展和表现中发挥着关键作用[16]。多项研究表明,部分基因的致病性变异可以在基因组的多个位置诱导DNA 甲基化模式发生改变[17]。这个现象可以通过DNA甲基化芯片或测序等方法进行表观遗传检测,然后对数据进行二元分类,并进行机器学习以完成特征谱分析[18]。迄今为止,已经描述了超过65种孟德尔神经发育障碍的表观遗传学修饰特征,所描述的特征对临床综合征、蛋白质复合物、特定基因、蛋白质结构域甚至单碱基致病性变异显示出高度特异性[17]。因此,该策略可用于对候选基因变异进行功能评估和VUS重新分类,也支持基因组拷贝数变异的鉴定和嵌合变异的解读[19]。有文献报道,在神经发育障碍病例中,表观遗传学修饰特征检测可提高约10%的诊断率,当用于选定患者队列中VUS 的重新分类时,验证率可高达35%[20]。
2 罕见病登记和数据库建设
世界各国越来越重视罕见病的登记和数据库建设。罕见病具有异质性、复杂性和患者数量少等特征,往往导致缺乏数据、证据和知识,因此数据收集和登记对罕见病诊治至关重要[21]。开展罕见病病例诊疗信息登记工作,建立信息系统收集罕见病资料,有助于了解罕见病流行病学、临床诊疗和医疗保障现状,从而为制定人群干预策略、完善诊疗服务体系、提高患者医疗保障水平、提高药物可及性提供科学依据[22]。如果罕见病登记系统有高质量的临床数据,还可以协助临床试验招募和上市后药物监测等[21,23]。此外罕见病登记系统还可以在了解疾病自然史方面发挥重要作用,并有助于开发符合安全性和有效性标准的罕见病临床试验[23]。
全球罕见病领域专家一致认识到罕见病登记系统的重要性,共同确定了十项关键原则[24],包括:①患者登记应被视为罕见病领域的全球优先事项;②尽可能涵盖广泛的地理范围;③应以一种疾病或一组疾病为中心,而不是以治疗干预为中心;④追求罕见病患者登记系统之间的互操作性和协调性;⑤尽可能使用一致的通用数据参数;⑥数据应与相应的生物样本库数据相关联;⑦应包括患者直接报告的数据以及医疗专业人员报告的数据;⑧鼓励公私合作,以确保罕见病患者登记的可持续性;⑨保证患者与其他利益相关者平等参与罕见病患者登记管理;⑩应成为建立和增强患者社区能力的关键工具。
在过去的20 年中,美国、英国、法国、加拿大、澳大利亚等发达国家相继开展了罕见病登记管理相关工作,包括立法、制定标准、开发罕见病网络基础设施以及建立这些疾病信息系统等[25-26]。2011年欧盟委员会资助了欧盟罕见病患者登记建立共识和协作项目,之后建立了欧洲罕见病登记平台[27]。中国于2016 年成立了第一个国家层面的罕见病专家委员会,协助罕见病相关的政策制定,并由北京协和医院牵头联合全国20家罕见病诊疗优势医院,启动建设了国家罕见病注册系统(national rare diseases registry system of China,NRDRS),包括临床信息库和生物样本库[22,28]。该系统建立了采集、录入、保存等各个环节的技术标准,采集信息涵盖罕见病患者临床表型、遗传诊断和生物样本信息等。目前,该系统已经注册了近200 个罕见病队列,并已有逾百家医院使用该平台开展队列研究[28-29]。另外由国家卫健委、医政医管局支持建设的“中国罕见病诊疗直报系统”已累计登记57万病例数,近400家医院参与了病例注册[28-29]。
3 人工智能帮助罕见病患者获得最优诊疗方案
人工智能和机器学习正逐渐应用于罕见病领域,在诊断、治疗和护理方面带来了革命性的进步。罕见病由于其发病率和表现形式多样,长期以来一直面临着复杂性挑战。人工智能可以有效地将大量生物医学知识和数据融合,通过快速处理来自各种来源的广泛数据集而快速识别诊断罕见疾病[30]。人工智能和机器学习可以将患者分为不同的疾病组,分析症状,甚至可以使用面部照片进行诊断,有效地克服了有限信息和认识所带来的挑战[31]。人工智能不仅可以进行视觉图像等表型分析,还拥有处理高通量测序所产生海量数据的能力[32]。通过有效识别各种变异组合在遗传疾病患者中的意义,显著提高疾病检测和诊断的准确性和速度[33]。
在寻求罕见病创新治疗过程中,包括第二代人工智能系统在内的人工智能驱动工具发挥着关键作用[34]。这些系统采用以患者为中心的方法,提供量身定制的治疗方案,优化药物剂量,并整合非药物治疗模式。它们提高了治疗效果,最大限度地减少了不良反应,解决了罕见病管理的独特复杂性。人工智能的影响力超越了诊断和治疗,简化了临床试验,使患者招募更加高效和可行[35]。此外,人工智能在药物研发中也发挥着重要作用,通过定量构效关系建模和高通量筛选可以生成大型数据集,帮助研究人员预测患者易感性,识别潜在的药物和疗法[36]。
4 基因治疗在罕见单基因病领域的进展
基因治疗在治疗遗传性疾病方面取得了重大进展,尤其是在罕见单基因疾病治疗方面。例如,基因疗法已被开发批准用于治疗脊髓性肌萎缩等疾病,并且已经证明了其有效性[37]。目前大量临床试验正在进行,以评估基因治疗在各种疾病中的安全性和有效性,特别是在儿科神经病学领域[38]。这些研究正在产生令人鼓舞的数据,并有助于改进基因治疗技术。
除了先前已获美国食品和药物管理局(FDA)与欧洲药品管理局(EMA)批准的基于腺相关病毒(AAV)基因治疗药物Luxturna与Zolgensma,前者经口内递送的AAV 2 载体用于治疗Leber 先天性黑蒙与色素性视网膜病,后者基于静脉注射高剂量AAV9治疗1型脊髓性肌萎缩症[39]。还有一些基于AAV的产品在过去2~3 年中获得了批准,包括一种基于局部脑内递送治疗单基因帕金森病的Upstaza,以及治疗血友病A的Roctavian与血友病B的Hemgenix[40]。这两种血友病治疗药物均是通过单次静脉内给药且以肝脏为靶向器官,能够实现在肝脏中长期分泌凝血因子,从而避免定期输注凝血因子[41-42]。2023年6月,一种以高剂量单次静脉注射靶向肌肉治疗杜氏肌营养不良(DMD)的AAV载体Elevidys 也已获得批准[43]。最近,一种基于单纯疱疹病毒1型(HSV-1)载体的基因治疗药物Vyjuvik已获准在美国商业化,用于治疗具有COL7A1基因变异的显性和隐性营养不良大疱性表皮松解症,该病毒载体可有效转导入角质细胞与成纤维细胞,从而恢复患者体内胶原的表达[44]。
除了基于病毒载体的基因治疗产品外,近年来还批准了几种非病毒产品[40],如一种用于治疗1 型脊髓性肌萎缩症的反义寡核苷酸Spinraza,在患者鞘内给药,使SMN2基因能够翻译产生全长蛋白,从而取代缺失的SMN 1 蛋白。此外,一些小型干扰RNA产品也获得了商业授权,包括治疗遗传性转甲状腺素蛋白(hATTR)淀粉样变性的Onpattro,以及另外两种分别治疗急性肝卟啉和原发性Ⅰ型高草酸尿的Givosiran和Oxlumo[40]。
体内基因组编辑方案用于治疗单基因疾病也正在如火如荼探索中,视网膜疾病因其良好的适用性而处于这一发展的前沿,如CRISPR-Cas9技术首次被报道用于治疗Leber先天性黑蒙10型的失明儿童[45]。另外,CRISPR-Cas9-脂质纳米颗粒经肝脏给药后可以使转甲状腺素淀粉样变性患者的表型显著改善[46],这表明用非病毒递送方法进一步实施肝脏基因组编辑的时机已经成熟。
尽管基因治疗取得了进步,但仍面临重大挑战。这种治疗方法昂贵且技术复杂,限制了其可及性。此外,有效的基因递送、对载体的免疫反应和治疗反应的持续时间等方面仍需要改进。关于基因治疗的未来,基因编辑技术如CRISPR-Cas 9 的进步,有望提高基因修饰的准确性和效率。对基因治疗载体的研究有望提高治疗的递送能力和安全性。新一代的病毒和非病毒载体正在开发中,这些载体可以克服目前的限制,使基因治疗的给药更加高效和精确[40]。
5 结语
数字化时代背景下,数据已成为驱动医学发展的核心元素。多组学技术、机器学习与人工智能的兴起使得数据的应用在罕见病领域变得更加广泛和深入,从患者精准诊断到个体化治疗方案、基因治疗药物研发,再到人群疾病筛查预防,未来将继续带来新的机会和挑战。数字医学时代已经来临,让我们共同努力迎接这个以数据为驱动的罕见病诊疗未来。