APP下载

免疫组学的研究进展

2024-03-27唐康侯永利王亚珍陈丽华

中国免疫学杂志 2024年1期
关键词:表位免疫系统组学

唐康 侯永利 王亚珍 陈丽华

(中国人民解放军空军军医大学基础医学院免疫学教研室,西安 710032)

免疫组(immunome)是宿主免疫系统与抗原的互作关系以及宿主免疫系统应答机制的全景图谱,包括免疫系统的识别对象、识别受体以及参与免疫应答过程的其他分子[1-3]。免疫组学(immunomics)是研究免疫组的学科,通过基因组学、蛋白组学和免疫信息学等手段解析宿主免疫系统识别的抗原、生理或病理条件下宿主免疫系统的组成特点,研究抗原刺激后宿主免疫细胞和分子的变化及其变化机制,进而揭示宿主免疫系统与抗原的互作关系及应答机制[2,4-5]。免疫组学解析免疫系统识别的抗原表位,对疫苗研发具有重要指导作用;同时,免疫组学揭示免疫系统成员在疾病发生、发展中的作用,为疾病预防、诊断或治疗提供新靶点或新策略,促进精准医疗发展[6-9]。

1 免疫组学的研究历史

免疫组和免疫组学的概念最早在1999年由PEDERSON[1]在奥斯陆举行的第六届自身抗体和自身免疫国际研讨会中提出。当时认为免疫组是人体内所有重排后的抗体、B细胞受体(B cell receptor,BCR)、T细胞受体(T cell receptor,TCR)的基因序列,而免疫组学是解读BCR、TCR DNA或mRNA序列而形成的学科。随着免疫学和其他生物学技术的发展,免疫组、免疫组学的概念也在不断补充和完善。2002年、2003年,陆续有学者将免疫系统识别的蛋白质肽段等抗原纳入免疫组[10-11]。而针对免疫系统本身,免疫组不再局限于BCR、TCR基因序列,其他免疫受体基因序列也被纳入了免疫组[12]。此时,免疫组学扩展为对免疫系统识别对象的研究,对TCR、BCR和其他免疫受体基因序列和分子功能的研究。

2004年,美国国家过敏和传染病研究所(National Institutes of Allergy and Infectious Diseases,NIAID)牵头启动“大型表位探索项目”,并建立了免疫表位数据库(Immune Epitope Database,IEDB),将已知的抗原表位及其识别受体纳入数据库[3]。随后,参与免疫应答过程的关键分子,如主要组织相容性抗原等,也陆续被纳入免疫组学研究。这一阶段,免疫组学研究不再局限于对某一抗原对象、某一受体序列的研究,而是深入对宿主免疫系统与抗原识别关系以及识别后应答机制的探索[4-5]。

2010年,NIAID建立的“人类免疫学项目联盟(Human Immunology Project Consortium,HIPC)”计划是更为全面的免疫组学研究计划,旨在生成大量跨中心和跨检测数据以描述不同人群在生理、病理或其他特定抗原刺激下的免疫系统组成。利用转录组学、蛋白质组学、代谢组学和免疫信息学等揭示新的免疫系统组成与其他生物系统的联系,解析新的免疫分子和应答途径,并建立不同人群疫苗安全性的预测体系和快速的疫苗生产及接种方案,提供全面的人类免疫系统组成及其识别的抗原和应答以及调控机制[2,13]。

2015年,WAYNE KOFF等牵头启动了人类疫苗计划(Human Vaccines Project,HVP),旨在解码人类免疫基因组,包括异质人群中的固有和适应性免疫受体库,以及相关的人类抗原组(感染细胞或肿瘤细胞中的抗原),并阐明抗原具备免疫原性的内在机制,如抗原如何诱导持久且具有临床疗效的免疫应答,最终确定可刺激产生和维持效应性T细胞应答的免疫接种策略等[14-16]。后来HVP更名为人类免疫组计划(Human Immunome Project,HIP)。2022年,HIP召开了人类免疫组学人工智能(artificial intelligence,AI)峰会,旨在绘制人类健康的下一个前沿:开发人类免疫组学的首个AI模型。峰会后,还将在全球范围内举办一系列会议以完善战略计划,AI将加速免疫组学发展。我国吴玉章教授带领团队建立了病毒表位数据库、超型数据库,截至2022年3月,已发明11种基于大数据的AI新方法,实现了在表位水平对病毒抗原的快拆、能装、可调,推动了免疫组学发展。

2 免疫组的组成

免疫组包括免疫系统的识别对象,如非己抗原、自身抗原、病原体相关分子模式(pathogen-associated molecular pattern,PAMP)和损伤相关分子模式(damage-associated molecular pattern,DAMP)等,免疫系统的识别受体,如BCR、TCR和模式识别受体(pattern recognition receptor,PRR)等,以及参与免疫应答过程的其他分子,如MHC编码的分子等[1-3]。免疫组是宿主免疫系统和抗原的互作关系以及宿主免疫系统应答机制的全景图谱,目前较为完善的是PAMP、DAMP与PRR的互作图谱,如PAMP中肽聚糖(peptidoglycan,PGN)被PRR中的Toll样受体2(Toll-like receptor 2,TLR2)识别,脂多糖(lipopolysaccharide,LPS)被TLR4识别等,DAMP中高迁移率族蛋白B1(high mobility group box1 protein,HMGB1)和热休克蛋白60(heat shock protein 60,HSP60)均被TLR2识别等[17-18]。TLR等PRR下游信号转导机制已得到较为深入的研究[19-20]。巨细胞病毒和新型冠状病毒感染等感染性疾病、1型糖尿病和自身免疫性肝病等自身免疫性疾病中,被识别的病原体表位和自身反应性的TCR、BCR(或抗体)已陆续被发现[21-24]。

3 免疫组学的研究内容

3.1 抗原表位组学 抗原表位组学是利用肽库、四聚体染色、抗体库等鉴定TCR或抗体识别的抗原表位,并研究抗原表位功能,绘制功能性抗原表位图谱。基于对抗原表位结构和功能的研究,设计和研发免疫治疗药物或疫苗用于治疗或预防相关疾病。同时,研究抗原表位与抗体的互作机制对治疗性抗体的人源化改造、亲和力提高、稳定性改造等具有重要意义[25-27]。肿瘤免疫组学研究中,利用重组cDNA表达文库血清学分析(serological analysis of recombinant cDNA expression libraries,SEREX)、血清学蛋白质组分析(serological proteome analysis,SERPA)等技术对肿瘤抗原表位进行筛选和鉴定,为肿瘤疫苗研发奠定基础[28-30]。

3.2 免疫基因组学 免疫基因组学是通过高通量测序技术,解析人类免疫系统的基因序列,揭示免疫系统的遗传多样性和个体差异。免疫基因组学的研究内容包括免疫相关基因鉴定及功能注释、免疫相关基因多态性与疾病易感性的关联、免疫相关基因表达的调控机制等。免疫基因组学研究对理解免疫系统进化和功能、揭示免疫相关疾病遗传机制以及实现个体化医疗具有重要意义[31-34]。免疫基因组学为免疫学、遗传学和生物信息学等学科交叉应用提供了新的研究方向和机会,将促进人类免疫健康和疾病治疗。

3.3 免疫蛋白质组学 免疫蛋白质组学主要研究免疫系统中的蛋白组成、结构和功能等,利用高通量技术和生物信息学分析方法系统性研究免疫系统中的蛋白表达、修饰、相互作用及其在免疫应答和疾病发展中的作用。通过分析免疫系统中蛋白表达和修饰变化揭示免疫应答和调控机制,发现免疫相关疾病的特异性标志物,为预防和治疗免疫相关性疾病提供理论基础,为疾病早期诊断、预后评估和治疗等提供依据[35-38]。

3.4 免疫细胞组学 免疫细胞组学基于单细胞测序技术、流式细胞术和功能实验等解析生理或病理条件下个体免疫细胞组成,并分析各类免疫细胞表型特征和功能特点以及细胞间相互作用[39-43]。免疫细胞在疾病发展和治疗过程中会发生动态变化,利用免疫细胞组学相关技术监测免疫细胞变化,找到疾病预后相关免疫细胞亚群,可为疾病诊断和治疗提供重要依据,促进个性化免疫治疗发展[7,9,44]。

3.5 抗体组学 抗体组学是通过基因工程抗体技术体外建立大规模抗体库(如噬菌体抗体库、酵母细胞抗体库、核糖体抗体库等),结合生物信息学等高通量筛选,优化可用于研究、诊断或治疗的抗体[45-50]。近年来高通量单细胞BCR测序技术发展迅猛,结合单细胞BCR测序技术可对分选的每个抗原特异性B细胞功能状态进行评估,获取单个B细胞VDJ序列,得到抗体轻重链的天然配对信息,提高高亲和力中和抗体的筛选效率和成功率,加快全人源抗体药物研发[24,51-52]。

3.6 免疫信息学 将计算机科学和生物学中的信息学方法用于免疫学研究,利用计算机算法、统计学和数学模型分析和解释免疫系统中的大量数据,以揭示免疫系统的结构、功能和调控机制[53-55]。免疫组学研究产生了大量数据,为了更好地利用已有数据资源,研究人员基于免疫信息学建立了免疫组学相关数据库。这些数据库整合了来自不同研究团队的数据,包括抗原表位组学、免疫基因组学和抗体组学等数据,为其他研究人员提供了数据资源和分析工具,进一步促进了免疫组学发展[56-58]。免疫信息学既是免疫组学研究的重要内容,也是进行免疫组学研究的重要手段。

4 免疫信息学相关数据库

4.1 ImmPort数据库 ImmPort(https://www.immport.org/home)由美国国立卫生研究院资助,北卡罗来纳州立大学和密歇根大学等合作机构共同建立和维护,包括人类和动物免疫学研究的大规模数据集、临床试验数据、基因表达数据、免疫细胞表型数据以及免疫学相关生物标志物等。除数据存储和共享外,ImmPort还提供了一系列分析工具和资源,包括免疫学数据标准化和注释、数据挖掘和分析工具、统计学方法和模型等,这些工具和资源有助于研究人员从大规模免疫学数据中提取有意义的信息,并进行更深入的研究和分析[59]。

4.2 VDJdb数据库 VDJdb(https://vdjdb.cdr3.net/)收集了TCR和BCR的CDR3序列、MHC及其对应的抗原表位信息,涵盖了多个物种数据,包括人、鼠和其他哺乳动物,用于解析免疫系统中抗原-受体相互作用位点。同时提供了一些在线分析工具,如免疫表位预测工具和CDR3序列聚类分析工具,帮助研究者更好地理解和解析数据[60]。

4.3 IEDB数据库 IEDB(https://www.iedb.org/)收集整理了抗原表位、免疫应答相关数据,包括抗原表位、抗原-抗体相互作用,免疫识别等信息。其在线分析工具可用于抗原表位预测、评估表位与受体的结合强度等。其他抗原表位数据库BIMAS、YFPEITHI、NetMHC-4.0、NetMHCpan-4.1等也可用于抗原表位预测[61]。

4.4 InnateDB数据库 InnateDB(https://www.innatedb.ca/index.jsp)用于存储、检索和分析与先天免疫系统相关的基因、蛋白、信号通路和相互作用信息,提供了丰富的注释、交互信息和可视化的互作网络图,帮助研究人员鉴定和分析先天免疫系统中的重要调控因子和信号通路[62-63]。

4.5 ImmGen数据库 ImmGen(https://www.immgen.org/)收集整理了大量免疫系统相关基因表达数据,包括多个免疫细胞类型和亚群,如T细胞、B细胞、巨噬细胞和树突状细胞等,并提供了多种数据分析和可视化工具(包括差异表达分析、聚类分析、基因共表达网络和基因调控网络等),有助于研究人员了解不同免疫细胞类型的功能和调控网络[57,64]。

4.6 Allele Frequency Net数据库 Allele Frequency Net Database(http://www.alle-lefrequencies.net/)汇集了来自不同族群和地理区域人群的样本遗传数据,包括基因型频率、等位基因频率和遗传多样性等信息,有助于研究人员了解人类种群遗传变异的地理分布和演化历史,在人类遗传和生物医学研究领域发挥重要作用[65]。不同疾病人群MHC等位基因频率等信息有助于解析疾病易感MHC等位基因,并发现诱发疾病的抗原表位[66]。

5 免疫组学的研究意义

5.1 揭示免疫系统与疾病的关联 免疫组学研究可深入了解个体间和种群间免疫应答和疾病易感性差异,揭示免疫系统与疾病的关联。通过免疫组学研究可发现导致疾病易感性和发展的遗传因素、免疫应答异常等,为疾病的预防、早期诊断和治疗提供依据[36,66-67]。

5.2 促进新型疫苗和免疫治疗策略开发 通过鉴定免疫系统识别的抗原表位和解析抗原表位发挥作用的结构基础,可针对性地设计和研发具有更强保护效应的疫苗,为疾病预防提供新的可能性[25,53,55]。免疫治疗通过调节免疫系统治疗疾病,包括免疫抑制剂、免疫增强剂和免疫细胞治疗等。免疫组学通过检测和分析免疫细胞、细胞因子和免疫相关基因变化,帮助优化免疫治疗策略。通过了解免疫细胞的功能和调节机制可设计更精准的免疫治疗方案,提高治疗有效性和安全性[44,68]。

5.3 推动个体化医疗和精准药物治疗 通过免疫组学检测和分析免疫细胞表型、功能和分布等特征评估个体免疫系统状态,包括免疫细胞功能状态及免疫调节的平衡状态等。这些信息能够帮助医生更好地预测个体对疾病的易感性以及个体对特定药物的反应性,为每位患者提供个体化诊断、治疗和预防策略,从而实现精准药物治疗[8,69-71]。如在癌症治疗中,免疫组学可分析免疫细胞的抗肿瘤活性和可能存在的免疫逃逸机制,从而指导免疫治疗方法的选择和监测免疫治疗效果[72-74]。

6 免疫组学未来的发展趋势

6.1 多组学整合分析 多组学整合是免疫组学未来发展的必经之路。免疫组学与其他组学领域,如暴露组学(exposome)、表观遗传组学(epigenome)和代谢组学(metabonomics)等的整合分析将有助于全面理解免疫系统对环境因素的响应和调节机制,进一步探索疾病发生和发展的分子机制[67-68,73-74]。

免疫组学研究了免疫系统在正常和疾病状态下的组成、结构和功能,而暴露组学揭示了个体暴露的多种环境因素,如接触不同化学物质、不同病原微生物等。将这两个领域结合可深入研究环境因素对免疫系统的影响及其与疾病的关系。通过整合个体的免疫组学和暴露组学数据建立预测模型可识别出与特定环境暴露相关的免疫特征和生物标志物,从而预测个体的免疫状态和潜在的健康风险,并为个体提供定制的免疫调节和治疗策略。表观遗传学研究了基因表达和表观修饰变化,将其与免疫组学结合能够找到与免疫相关的表观遗传标记和调控因子,如DNA甲基化、组蛋白修饰和非编码RNA等,从而深入了解免疫系统的表观遗传调控网络,揭示表观修饰在免疫应答和疾病发生中的作用。而免疫组学、暴露组学和表观遗传学联合分析可实现对免疫系统、环境因素和表观调控的全面分析,为理解疾病发生和发展的分子机制提供更深入的视角。

2020年比利时鲁汶大学环境与健康中心牵头制定了“EXIMIOUS”计划[68]。“EXIMIOUS”计划利用系统生物学和机器学习等综合分析暴露组学、免疫组学和其他组学数据(表观遗传组学等)与个体疾病的关联,探索从暴露组学到免疫组学再到疾病的整个过程,解析导致不同阶段人群暴露相关免疫效应的因素,进而确定最关键的暴露类型以及承担最高风险的个体/群体,以便在个体和群体层面采取正确的疾病预防措施。

6.2 免疫组学与AI结合 AI的应用能够极大地推动免疫组学的研究。免疫组学数据获取和分析通常是复杂且耗时的,包括大规模的基因表达数据、蛋白质组学数据以及细胞代谢数据等。AI技术可帮助处理和解读这些大规模数据,提供更准确、高效的结果。如基于机器学习算法的分类模型可帮助识别免疫应答的关键因素和特征,从而更好地理解和预测免疫系统的功能和异常[75-77]。

另一方面,免疫组学和AI结合也可在疾病诊断和治疗方面发挥重要作用。通过整合临床数据、基因组数据、免疫组学数据和其他相关数据,AI可帮助建立更准确的疾病模型和风险评估模型,有助于早期发现和预测免疫相关疾病风险,为个体化治疗方案提供指导[71-72,78-80]。

此外,免疫组学和AI结合还可以在流行病学研究和公共卫生领域发挥重要作用。通过整合大规模的流行病学数据和环境因素数据,AI可帮助揭示疾病传播和发生规律,提供更精确的预测和干预策略。如结合免疫组学和AI的方法可帮助识别特定人群在疾病暴发时的易感性,从而采取针对性的预防和控制措施等[81-84]。

2023年7月,国际电信联盟(International Telecommunications Union,ITU)在日内瓦召开了“AI for Good全球峰会”。HIP董事长JANE METCALFE和首席执行官HANS KEIRSTEAD在峰会上发表讲话,详细介绍了如何通过解码和构建免疫系统的AI模型革新我们应对疾病的方式,并使每个人都能够活得更长、更健康。峰会上指出,免疫系统是人体对抗疾病和改善健康的关键,但其复杂性限制了人类对免疫系统的充分利用,AI为人类提供了能够处理数万亿数据的工具用以建立免疫组学模型。可以通过生成反映人类多样性的免疫学基线和功能性数据集解析免疫系统在不同年龄、种族、性别、社会经济阶层和健康状况下的变化,开发针对癌症、阿尔茨海默病、心脏病和自身免疫病等疾病的特异性诊断和治疗方法,并通过预防疾病和提高治疗效果大幅减少全球医疗保健成本。

7 总结

免疫系统成员广泛分布于机体内各器官组织,维持生理稳态或参与组织损伤。因其成员和功能的复杂性,单一的技术手段难以全面、深入地探究免疫系统在疾病中发挥的作用及机制。而免疫组学发展为全面、深入解析免疫系统识别受体与抗原的互作关系、免疫细胞和分子在疾病发生发展的作用机制等提供了可能。多组学与AI的深度融合将进一步推动免疫组学发展,加速新型疫苗研发和疾病精准治疗,为全人类健康事业贡献力量。

猜你喜欢

表位免疫系统组学
H3N2流感病毒HA保守Th表位对CD4+T细胞活化及分化的影响
让免疫系统适当“放松”
一类具有抗原性的肿瘤-免疫系统的定性分析
保护好你自己的免疫系统
口腔代谢组学研究
Staying healthy
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
联合T、B细胞表位设计多肽疫苗的研究进展①
小反刍兽疫病毒化学合成表位多肽对小鼠的免疫效果研究
结核分枝杆菌抗原Lppx和MT0322人T细胞抗原表位的多态性研究