APP下载

特发性肺纤维化的组学研究进展

2020-01-13双,叶

中国药理学与毒理学杂志 2020年2期
关键词:端粒易感性组学

李 双,叶 俏

(首都医科大学附属北京朝阳医院,职业病与中毒医学科,间质性肺疾病临床诊疗与研究中心,北京 100020)

特发性肺纤维化(idiopathic pulmonary fibrosis,IPF)是一种慢性、进行性肺纤维化疾病,表现为逐渐加重的劳力性呼吸困难、肺功能障碍甚至发展为呼吸衰竭而死亡,确诊后患者的生存期中位数为2.3~3.5年[1]。IPF是一种具有代表性的慢性纤维化性肺疾病,抗肺纤维化药物吡非尼酮(pirfenidone)和尼达尼布(nintedanib),两者在随机对照试验和真实世界研究表明,均可一定程度地延缓IPF患者肺功能的下降,部分地抑制病情进展[2-3]。近年,高通量技术的发展极大地增加了研究的生物数据量,为探索IPF的病因、发病机制及新药治疗靶点提供了新的思路,也为疾病的研究提供了新的手段。

高通量技术应用于各种“组学”,主要包括:①基因组学,用于检测DNA突变;②转录组学,用于检测mRNA表达;③表观基因组学,在不改变序列的情况下,研究DNA的修饰变化对mRNA表达的影响;④蛋白质组学,用于检测蛋白质组分;⑤代谢组学,用于测定代谢物的水平。组学技术可以分析和整合组织和细胞的特异性组学数据,精确地展示疾病的生物学过程,识别环境及干预措施的影响,便于达到个体化精准医疗的目标。本文综述以上5种高通量组学技术在阐明IPF的发病机制、寻找生物标志物和提供治疗靶点中的应用研究进展。

1 基因组学

基因组学是指对所有基因进行基因组作图、核苷酸序列分析、基因定位和基因功能分析的一门技术。常用的研究方法有全基因组关联分析研究(genome-wide association studies,GWAS)、全外显子测序(whole-exome sequencing,WES)和全基因组测序(whole-genome sequencing,WGS)。GWAS主要用于发现单核苷酸多态性(single nucleotide polymorphisms,SNP)的等位基因或基因频率在患者与健康人群中的差异,研究常见遗传变异与疾病之间的关系。WES用于检测功能性基因的突变。WGS检测所有类型的DNA序列突变。随着高通量测序成本的降低,WES和WGS已经成为基因组学研究的首选技术,可以识别罕见和新型基因突变。

1.1 探讨发病机制

IPF基因组学研究从探讨家族性间质性肺炎(familial interstitial pneumonia,FIP)开始。2011年,SEIBOLD等[4]对来自美国的83例FIP、492例IPF和322例非肺纤维化受试者的肺组织进行GWAS,发现11号染色体上的SNP,即MUC5B启动子rs35705950与FIP和IPF易感性相关。MUC5B编码黏蛋白5B,是黏液中主要的凝胶形成蛋白,由气道上皮细胞表达,参与宿主防御。IPF中MUC5B的表达定位于远端气道、呼吸性细支气管、蜂窝肺和支气管上皮[5-6]。组织病理研究发现,MUC5B在蜂窝肺中过度表达[5],提示MUC5B在IPF发病中起作用。MUC5B rs35705950启动子多态性是非西班牙裔白种人IPF的最强遗传危险因子,但它在亚洲人群中并不常见[7],影响亚洲人群IPF易感性的遗传或环境因素有待进一步研究。一项类风湿关节炎相关间质性肺疾病(rheumatoid arthritis-interstitial lung disease,RA-ILD)的多国家、多中心研究,入选620例RA-ILD、614例RA无ILD和5448例无RA无ILD受试者,检测其MUC5B rs35705950启动子多态性,发现MUC5B rs35705950阳性的RA受试者较其阴性者出现ILD的风险更高,且发生普通型间质性肺炎(usual interstitial pneumonia,UIP)型频率增加,提示MUC5B rs35705950与RA-ILD尤其是表现为UIP型的易感性相关[8]。

端粒是染色体末端的重复核苷酸序列,保护染色体免于在正常细胞复制过程中进行性缩短。端粒酶恢复端粒长度需要2个主要成分:端粒酶逆转录酶(telomerase reverse transcriptase,TERT)和端粒酶RNA组分(telomerase RNA component,TERC)。FIP患者和无症状端粒酶基因突变携带者的平均端粒长度明显短于未携带端粒酶基因突变的受试者,突变携带者的端粒长度与健康对照相比明显缩短,同时FIP患者的端粒长度具有比无症状携带者更短的倾向[9]。日本和欧洲的2个研究分别用GWAS和WES方法发现,与非肺纤维化人群相比,散发性IPF患者肺组织中端粒相关基因TERT、RTEL1和PARN突变增加[10-11],表明端粒功能障碍与散发性IPF易感性相关。CRONKHITE等[12]入选46例FIP、42例散发性IPF和201例非纤维化对照受试者,测量其端粒长度及端粒酶基因突变情况,发现与对照组相比,具有端粒酶基因突变的肺纤维化受试者端粒长度更短。值得注意的是,24%FIP和23%散发性IPF无TERT或TERC基因突变,但其端粒长度也较对照组明显缩短,说明导致端粒长度缩短的因素不限于端粒酶基因突变。

桥粒在连接细胞并稳定组织结构中起重要作用,桥粒斑蛋白(desmoplakin,DSP)是桥粒结构的关键组成部分。研究显示,DSP基因多态性影响IPF患病风险,rs2076295的次要等位基因增加IPF易感性,而rs2744371的次要等位基因具有保护作用[13]。IPF肺组织DSP通常高表达,然而rs2076295基因表型的IPF患者DSP低表达,DSP的差异化表达可能提示IPF能够分为不同亚组进行进一步研究[13]。一项GWAS研究表明,编码表面活性蛋白C和A的基因与FIP易感性相关,但在散发性IPF中属于罕见突变[14]。

1.2 寻找生物标志物

一项GWAS研究入选了1400例IPF患者和1900例对照者,与对照组相比,IPF组肺组织的单核苷酸多态性Toll相互作用蛋白(Toll-interacting protein,TOLLIP)基因(rs111521887,rs5743894和rs5743890)、MUC5B(rs35705950)、MDGA2(rs7144383)和 SPPL2C(rs17690703)均存在差异[15]。回归分析显示,MUC5B与IPF易感性关联最强。单变量荟萃分析显示,主要等位基因rs5743890_A的携带者,IPF易感性增加,死亡率降低;次要等位基因rs5743890_G的携带者,IPF易感性降低,而死亡率增加[15]。研究表明,多个基因突变可能影响疾病的易感性和自然病程。细胞端粒长度是IPF患者生存时间的独立预测因子[16-17],在具有自身免疫特征的间质性肺炎患者中,端粒长度<第10百分位数者比≥第10百分位数者肺功能下降更快,是无移植存期的危险因素[18]。

1.3 提供个体化治疗方向

为确定TOLLIP和MUC5B多态性是否会改变IPF患者接受免疫抑制剂和抗氧化治疗的疗效,研究入选3组非西班牙裔白种人受试者,分为对照组、IPF组和具有TOLLIP或MUC5B基因型多态性的IPF组,分别接受安慰剂和N-乙酰半胱氨酸(N-acetylcysteine,NAC)治疗,将死亡、肺移植、住院治疗和用力肺活量占预计值百分比较基线降低>10%定义为复合终点事件。研究发现,具有TOLLIP rs3750920 TT基因型的受试者服用NAC降低了复合终点风险;相反,CC基因型的IPF受试者接受NAC治疗后复合终点风险增加[19]。遗传变异影响IPF的易感性、结局和预后,不同基因型间治疗效果的差异为个体化治疗提供了方向,基因组学研究将使IPF个体化治疗成为可能。

2 转录组学

转录组学是从RNA水平研究细胞或组织的基因表达或转录调控通路的一门技术,易受健康状态及环境暴露等条件影响,是动态过程中的某一静态显像。转录组学最初的检测手段主要是基于已知RNA设计的基因表达微阵列,用于检测已知基因的表达,随着高通量技术的发展,转录组测序(RNA-sequencing,RNA-Seq)技术可以对细胞或组织中的整体转录活动进行检测,能发现未知RNA并进行测序和定量,提供全面的转录组信息。

2.1 探讨发病机制

IPF患者基因表达和非编码RNA水平较健康人群均有改变,微生物刺激也可以影响IPF基因表达。NANCE等[20]纳入8例IPF患者和7例健康受试者,应用RNA-Seq技术检测2组肺组织中基因表达差异,用PCR追溯基因外显子差异,发现胶原蛋白Ⅵ型α3基因和骨膜素基因表达水平下调与IPF易感性相关。非编码RNA和肺内微生物群影响IPF的发生发展。在纤维化肺组织中调控基因表达的非编码RNA:微RNA(microRNA,miRNA)-130b-3p下调和长链非编码RNA(uc.77与2700086A05Rik)上调可促进上皮细胞-间充质转化[21-22]。微生物-宿主防御机制研究显示,微生物刺激改变宿主防御机制相关的核苷酸结合寡聚化结构域样受体家族成员4基因、肽聚糖识别蛋白1基因、基质金属蛋白酶9(matrix metalloproteinase 9,MMP9)基因、防御素α4基因及2种编码特定抗菌肽分泌型白细胞蛋白酶抑制因子基因和组织蛋白酶抑制素抗菌肽基因的表达,下调核苷酸结合寡聚化结构域、Toll和RIG1样受体途径,并影响IPF无进展生存期,反映下呼吸道细菌群落对IPF损伤的肺泡造成反复持续性刺激,加剧病情进展[23-24]。LUZINA等[25]对3例IPF肺移植患者的患肺和3例供肺者的健康肺组织进行RNA-seq检测,根据大体标本将患肺分为纤维化肺组织和纤维化旁肺组织。研究发现,与健康对照组相比,纤维化肺组织中结缔组织相关mRNA(胶原mRNA,MMP1、MMP7、威尔姆斯肿瘤蛋白和骨桥蛋白mRNA),与免疫和炎症相关基因(CD3链、MS4A1/CD20、CD79A、CD40配体和FAS配体)的mRNA,细胞因子和趋化因子〔包括C-C基序趋化因子配体2(C-C motif chemokine ligand 2,CCL2)、CCL8、CCL18、CCL19、CCL22、CCL24和CCR7、CXC基序趋化因子配体12(C-X-C motif chemokine ligand 12,CXCL12)、CXCL13、CXCL14、CXCR3、白细胞介素13受体α2(interleukin-13 receptor-α2,IL-13Rα2)和IL-33〕及其mRNA表达水平均提高[25]。值得注意的是,纤维化旁肺组织呈现出与纤维化肺组织相似的转录组变化,提示未来IPF的治疗方向可能由已发生纤维化病变的肺组织区转向纤维化旁肺组织,抑制甚至阻止肺泡结构不可逆性破坏,保留肺泡完整性。

2.2 寻找生物标志物

一项研究入选23例稳定期IPF患者、8例急性加重期IPF患者和15例对照受试者,并对其肺组织进行基因表达微阵列分析研究发现,与稳定期IPF相比,细胞周期蛋白A2基因和α-防御素基因的表达在急性加重期上调[26]。生存分析显示,以死亡或肺移植为终点指标,应用基因表达微阵列分析IPF患者外周血单核细胞基因表达,发现CD28、可诱导共刺激分子、淋巴细胞特异性蛋白酪氨酸激酶和IL-2诱导的T细胞激酶的基因表达下降与无移植存活时间减低显著相关,提示它们可能是IPF患者生存期预测因子[27]。尽管转录组学尚无诊断或治疗方面的突破点,但仍有助于发现靶基因及与病程变化和预后相关的生物标志物。随着研究的深入、样本量的不断增加以及设计优化,更多研究结果将向临床转化。

3 表观基因组学

表观基因组学是研究基因组修饰的一门技术。基因组修饰是指在不影响DNA序列的情况下调节基因表达活性和下游表型,这种调节可遗传。常见的表观基因组现象包括DNA甲基化、组蛋白修饰和非编码RNA调控。目前已证实,IPF肺实质中存在广泛的表观遗传因素导致的基因表达改变。诱发IPF的危险因素如吸烟会影响表观遗传标记[28]。常用的表观基因组学包括以下检测方法:①全基因组关联研究,类似于GWAS,是一种无偏差的检测方法,用于测量整个基因组的表观遗传修饰与疾病或表型之间的关联[29],常用来检测DNA甲基化差异;②染色质免疫沉淀测序(chromatin immunoprecipitation sequencing,ChIP-Seq),研究组蛋白修饰与基因表达的关系。基因表达和蛋白质丰度的表观遗传调节是一系列高度保守的生物过程,具有细胞和组织特异性,这种特性使表观遗传标记具有成为生物标志物和治疗靶点的可能。

3.1 探讨发病机制

YANG等[30]应用针对相对甲基化的综合高通量阵列发现,与健康人群相比,IPF患者肺组织全基因组存在广泛的差异甲基化区域,在2130个差异甲基化区域中,738个与显著差异性基因表达相关,包括与IPF易感性相关的基因(NOTCH1,FBXO32和TOLLIP),表明表观遗传因素影响IPF的易感性。目前已经发现一些与IPF易感性相关的基因和miRNA的差异表达、表观基因组调控改变相关,如环氧合酶 2(cyclooxygenases-2,COX-2)[31]、趋化因子 IP-10[32]、Thy-1(CD90)[33]、p14ARF[34]、α-平滑肌肌动蛋白[35]和miR-17-92簇[36]。

3.2 寻找生物标志物

最近一项研究入选160例IPF患者和108例非纤维化受试者,应用加权基因共表达网络分析(weighted gene coexpression network analysis)检测2组肺组织,IPF和对照组交叉验证后将IPF的差异表达基因分为16个模块(module eigengene,ME1-16),生物学功能相似的基因分在同一模块中[37],其中与纤毛、DNA复制和修复、B细胞和未折叠蛋白反应以及细胞外基质相关的基因模块上调,与血管、T细胞和干扰素反应、白细胞活化和脱粒、表面活性剂代谢以及细胞代谢和分解代谢过程相关的基因模块下调[37]。应用ChIP-Seq检测IPF患者的外周血标本确定不同基因模块相关的转录因子和miRNA,并对这些外周血RNA进行生存分析,发现ME1,ME8,ME9和ME12相关的miRNA与IPF患者生存率相关,其中纤毛相关模块ME1与生存率关联最大,可改善IPF 30月的生存率[37],这是首次发现外周血RNA可以作为IPF的生物标志物。GUIOT等[38]纳入23例未治疗的IPF患者、27例接受抗纤维化治疗的IPF患者和27例健康受试者,收集受试者的血液样本,根据表观遗传修饰,应用Nu.Q™酶联免疫吸附测定游离核小体上的循环表位,发现在IPF患者中5-甲基胞嘧啶甲基化的核小体、结合高迁移率生长蛋白B1(high-mobility growth protein B1)的核小体和组蛋白H3在赖氨酸9或27残基处乙酰化的核小体水平显著低于健康受试者。根据以上4种游离核小体的表观遗传学修饰构建模型,其AUC达0.93(特异性80%和灵敏度91%),有可能作为IPF的生物标志物。

3.3 提供治疗靶点

泛组蛋白去乙酰化酶抑制剂辛二酰苯胺异羟肟酸(suberoylanilide hydroxamic acid,SAHA)通过3'端非翻译区介导的转录后调控抑制转化生长因子β1诱导的成纤维细胞中COX-2水平下调,达到抑制纤维化的作用[39],促进原代IPF成纤维细胞凋亡,改善博来霉素诱导的小鼠肺纤维化病变,增加气道顺应性和降低气道阻力[40]。SAHA目前被批准用于治疗皮肤T细胞淋巴瘤,也是一种有前景的IPF候选药物。表观基因组学一直被应用于研究各种疾病,检测多元化样本,研究IPF的机制、生物标志物和治疗靶点。

4 蛋白质组学

蛋白质组学是对蛋白质进行鉴定、定量、定位、修饰和其相互作用及功能检测的一门技术。蛋白质表达水平反映细胞的代谢状态和细胞过程。可用于检测的标本范围广泛,包括诱导痰、支气管肺泡灌洗液、血浆和血清等。常用的检测方法包括定量蛋白质组学、组蛋白翻译后修饰和磷酸化蛋白质组学。

4.1 探讨发病机制

我国最近一项研究应用蛋白质同位素标记的相对和绝对定量技术联合反相色谱法及液相色谱-质谱,质谱联用技术分析20例IPF患者肺组织和20例非纤维化受试者肺组织中的蛋白质表达。应用途径富集分析发现,IPF肺组织中上调的蛋白质主要与磷脂酰肌醇3-激酶-蛋白激酶信号通路、吞噬体、黏着斑、细胞外基质受体相互作用、碳代谢,以及人乳头瘤病毒感染和核糖体通路有关,从蛋白质相互作用的途径和调节节点描述IPF蛋白质组的改变[41]。

4.2 寻找生物标志物

一项靶向蛋白质组学研究试图从外周血中寻找IPF的蛋白质生物标志物,该研究测定了74例IPF患者和53例对照受试者血浆中的49种蛋白质浓度,对照组包括慢性阻塞性肺疾病、结节病和过敏性肺炎患者,发现IPF组较对照组中的MMP7和MMP1水平明显升高,并可与对照组相鉴别[42]。从免疫细胞的变化看,蛋白质组学研究已经鉴定出血清蛋白,包括MMP7和CCL18,与疾病严重程度和预后有关[43]。蛋白质组学不仅反映IPF患者蛋白质水平变化,还在不同时间和空间上反映蛋白质组成的复合物和信号网络。蛋白质组学分析的高通量特性,提高了筛选生物标志物的效率。

5 代谢组学

代谢组学是指测量生物体内所有代谢物的一门技术。代谢物包括内源性(氨基酸、脂质、核酸和维生素)和外源性(药物和毒素)化学物质,是参与生物体内化学反应的小分子(<1 ku)。代谢组学反映细胞或组织活跃的生理状态,常用技术方法是核磁共振和高分辨率质谱[44-45]。目前已经建立了公共人类代谢组数据库(Human Metabolome Database)提供了代谢组学数据,列出了42 000个代谢物可供参考[46]。多种生物样本已用于肺部疾病的代谢组学研究,包括血清和血浆、诱导痰、呼出气冷凝物、支气管肺泡灌洗液以及肺组织。尿液在临床环境中能以便捷、非侵入性的方式获得,因此也作为检测目标来鉴定代谢组学生物标志物。

5.1 探讨发病机制与生物标志物

ZHAO等[47]应用质谱法检测8例IPF患者和8例健康受试者的肺组织,发现与对照组相比,IPF组存在鞘脂、精氨酸、能量代谢、血红素和谷氨酸/天冬氨酸代谢的信号通路改变,反映IPF存在能量代谢紊乱、细胞外基质沉积、细胞增殖增加、肺结构重塑及氧化应激增加,从代谢组学角度解读IPF发病机制。代谢物是生命活动的直观表现,是IPF寻找生物标志物的方向之一。一项研究纳入22例未接受治疗的IPF患者和18例健康受试者的血液样本,应用超高效液相色谱结合四极杆飞行时间质谱检测2组血浆中脂质差异,发现62种差异脂质,其中6种(R7,R9,R13,R16,R17和R21)可作为潜在的生物标志物,经ROC分析可区分IPF患者与健康人群[48]。

5.2 提供治疗靶点

一项研究收集了10例IPF患者和10例健康受试者的血清样本,应用超高效液相色谱联合高分辨率质谱的方法发现差异代谢物溶血磷脂酰胆碱(lysophosphatidylcholine,LysoPC),并在另外11例IPF患者和10例健康受试者中验证LysoPC的差异性[49]。LysoPC 是溶血磷脂酸(lysophosphatidic acid,LPA)的前体,LPA是肺纤维化的已知介质,LPA1缺陷小鼠可使博来霉素诱导的肺纤维化明显减轻[50]。这提示IPF患者血清中LysoPC升高,可能通过向LPA转换,使LPA水平升高,从而起到促肺纤维化作用。自溶素是产生LPA的主要酶,GLPG1690是一种新型自分泌运动因子抑制剂,可抑制自溶素-LPA途径。一项GLPG1690治疗IPF的2a期随机安慰剂对照试验(FLORA),患者入选年龄≥40岁,不吸烟、不服用吡非尼酮或尼达尼布。其中20例患者完成研究,包括15例GLPG1690受试者组和5例安慰剂受试者组,其用力肺活量在第12周时较基线的平均变化分别为25 mL(95%可信区间:-75~124 mL)和-70 mL(-208~68 mL),同时GLPG1690表现出良好的耐受性。尽管该研究入选的样本量小,但其用力肺活量结果仍提示GLPG1690治疗有意义[51]。

6 结语与展望

IPF的发生和发展是一个多元化的复杂过程。目前,组学技术可以检测肺组织、支气管肺泡灌洗液、诱导痰或外周血中的DNA、RNA、蛋白质和代谢物,从不同角度、不同层次研究IPF的生物学特征。从疾病和干预治疗两方面研究,更全面地了解IPF的发生发展机制,寻找可用于早期诊断、预后评估的生物标志物,筛查治疗靶点,筛选治疗药物,提供个体化精准治疗的新思路。随着技术快速发展,将出现多种组学方法的整合,运用现代高通量计算分析方法,进一步深化对疾病本质的理解,有助于开发出影响预后的新药。

猜你喜欢

端粒易感性组学
端粒蛋白复合物shelterin的结构及功能研究进展
口腔代谢组学研究
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
抑癌基因P53新解读:可保护端粒
40—65岁是健身黄金期
盐酸阿霉素与人端粒DNA相互作用的电化学研究
CD14启动子-260C/T基因多态性与胃癌易感性的Meta分析
α1抗胰蛋白酶基因多态性与肺癌易感性的研究
代谢组学在多囊卵巢综合征中的应用
TLR9和VDR基因多态性与结核病易感性的相关性分析