长链非编码RNA H19变异基因型与中国人群肾细胞癌发病风险及预后的相关性研究
2021-12-11邓夏珩李鹏超
邓夏珩,吕 强,李鹏超*
1南京医科大学第一附属医院胸外科,2泌尿外科,江苏 南京 210029
肾细胞癌(renal cell carcinoma,RCC)是肾癌的主要类型,分别占男性和女性所有恶性肿瘤的5%和3%[1-2],其中高达17%的患者在诊断时出现转移,其余30%的患者甚至在手术治疗后也会出现转移[3-4],总体预后较差。肾癌的发生是一个复杂的过程,涉及环境和遗传因素之间的相互作用[5]。近年来,基因变异已被广泛研究并证明影响RCC的易感性、进展和预后[6-7]。
长链非编码RNA(long non⁃coding RNA,lncRNA)是一类长度超过200个核苷酸的内源性细胞核糖核酸,缺乏蛋白质编码能力[8],越来越多的证据表明lncRNA 在各种癌症的发生和发展中起到至关重要的作用[9]。lncRNAH19 是一种父系印记基因,位于人类染色体11p15.5上[10],通过调节miRNA功能及介导DNA甲基化参与重要的生物学和病理学过程[11]。H19 与胰岛素样生长因子2(insulin like growth fac⁃tor 2,IGF⁃2)基因密切相关,该基因也位于受甲基化印记影响的区域,参与胎儿的正常生长和发育[12],同时也在癌症的发生发展中发挥功能[13]。研究表明H19异常表达与多种恶性肿瘤包括膀胱癌、乳腺癌、食管癌及肾细胞癌的发生相关[14]。Wang 等[15]研究发现,H19 在RCC 肿瘤组织中高表达,并与肿瘤分期、淋巴结转移及远处转移有关,且H19 表达是RCC 患者临床预后的独立预测因子。新近研究一致表明H19 基因多态性与各种癌症发病风险及预后相关,包括胃癌[16]、结直肠癌[17]、膀胱癌[18]和乳腺癌[19]等。最近一项荟萃分析表明,H19 rs2839698与胃肠癌风险增加有关[20]。鉴于H19 在RCC 发生发展中的关键作用,其基因变异可能与RCC发病及预后相关。然而目前并没有研究探讨此类问题,因此本研究选择H19 最被广泛研究的4 个多态性:rs2839698、rs217727、rs3741216 和rs3741219,并在一项两阶段病例对照研究中评估其与RCC 风险及预后的关系。
1 对象和方法
1.1 对象
本研究始于2004年5 月,得到南京医科大学第一附属医院伦理委员会批准。所有入组者均为汉族,无血缘基因联系。所有患者均经组织病理学证实患RCC,既往接受过化疗、放疗或有其他类型恶性肿瘤的患者被排除在本研究之外。根据WHO标准及TNM系统进行分级,分为局部(Ⅰ期和Ⅱ期)及晚期(Ⅲ期和Ⅳ期)RCC。对照组为门诊体检患者,并按照性别和年龄(±5岁)进行频率匹配,排除与患者有遗传关联或有癌症病史的患者。本研究设计为两个阶段:实验组于2004年5月—2009年10月共纳入342例RCC患者和361例对照,每6个月在门诊随访患者,终点为患者死亡或丢失访。其中44 例(12.9%)患者缺少足够的随访信息被排除,最长随访时间为72.0个月,中位随访时间为25.1个月。验证组至今共纳入672例RCC患者和702例对照。所有患者信息均通过标准问卷调查获得,获得知情同意后,捐献5 mL 静脉血。本研究对1 014 例RCC 患者及1 063 例健康对照4 种基因多态性的多种组合进行分型与分析。
1.2 方法
1.2.1 多态性选择
使用UCSC网站(http://genome.ucsc.edu/)对位于人染色体11p15.5(位置20164062021693)H19 基因及其启动子中的基因多态性进行鉴定,在千人基因组计划的东亚人群中以定位等位基因频率>0.05 为标准。本研究最终选择并研究rs2839698、rs217727、rs3741216和rs3741219 4个标记多态性。
1.2.2 DNA提取和基因分型
通过蛋白酶K消化及氯仿从外周血中提取基因组DNA,4 种多态性基因分型使用预先设计的Taq⁃Man SNP基因分型试剂盒(Applied Biosystems 公司,美国)进行分析,每个单核苷酸多态性的引物和探针序列可根据要求提供(表1)。在384 孔ABI 7900HT实时聚合酶链反应系统中进行扩增和分析,使用SDS 2.3软件进行等位基因鉴别。每个平板内均包括质控品,以确保基因分型的准确性。随机选择约10%的样本进行重复基因分型,结果100%一致。
表1 基因多态性的引物与探针序列Table 1 Primers and probe sequences of polymorphisms
1.3 统计学方法
基因突变的等位基因频率在分析前使用拟合优度χ2检验检测是否偏离Hardy⁃Weinberg 平衡,采用Student’st检验(连续变量)和χ2检验(分类变量)评估病例和对照组之间的人口统计学特征、特定变量及基因型频率分布的差异。基于Benjamin⁃Hoch⁃berg 方法对4组单核苷酸多态性的多重P值比较进行FDR矫正,当FDR矫正后的P<0.05时,差异具有统计学意义。H19多态性与RCC风险和肿瘤特征的关系通过计算OR值和95%置信区间(95%CI)进行评估。生存时间为RCC诊断时至死亡或最后一次随访日期,Kaplan⁃Meier曲线评估临床特征与H19不同基因型的生存状态。采用COX回归分析计算HR值和95%CI评估影响RCC预后的独立危险因素。所有分析均使用SAS 9.1.3,P<0.05为差异有统计学意义。
2 结果
2.1 RCC患者及健康对照的临床特征
所有纳入研究的RCC 患者及健康对照的特征分布见表2。其中,病例组与对照组在年龄、性别和饮酒状况方面无显著差异(P>0.05),病例组中吸烟者、高血压患者与糖尿病患者多于对照组(分别为P=0.021、P<0.001、P<0.001)。65.7%的患者临床分期处于Ⅰ期,而19.2%的患者处于Ⅱ期,6.9%和8.2%的患者分别位于Ⅲ和Ⅳ期。21.4%、51.4%、20.6%和6.6%的患者病理分级分别为Ⅰ至Ⅳ级。
表2 肾细胞癌患者与健康对照的特征分布Table 2 Characteristic distribution of patients with renal cell carcinoma and healthy controls
2.2 H19基因多态性与RCC发病风险的关系
H19 rs2839698、rs217727、rs3741216和rs3741219基因多态性与RCC发病风险的关系见表3,对照组4种多态性的基因型频率均符合HWE(P>0.05)。病例组与对照组中rs2839698 基因型分布显著不同(P=0.003),经多次比较后仍保持显著性(FDR=0.013)。与携带rs2839698 CC 基因型的个体相比,携带rs2839698变异TT基因型的个体与显著增加的RCC 发病风险相关(P=0.005,OR=1.37,95%CI=1.34~3.02)。采用隐性遗传模型,结合CT/TT 基因型,与rs2839698CC基因型相比,RCC风险也显著增 加(P=0.012,OR=1.13,95%CI=1.02~1.55)。但未发现其他多态性与RCC 发病风险的证据,结果表明H19 rs2839698 基因多态性可能赋予个体RCC 的遗传易感性。
表3 H19基因多态性在病例组与对照组中的分布频率及其与RCC风险的关系Table 3 Frequencies of H19 polymorphisms of the cases and controls as well as the linkage with the risk of RCC[n(%)]
2.3 H19 rs2839698基因多态性对RCC患者临床病理特征的影响
探究rs2839698基因型与病例组中RCC 肿瘤大小、临床分期及病理分级之间的关系,以评估H19 rs2839698 基因多态性对RCC 疾病进展的影响。如表4所示,未观察到rs2839698基因型与病理分级之间的显著关联;然而,rs2839698 CT/TT 基因型在肿瘤大小超过4 cm 及临床晚期患者中更常见(CT/TTvs.CC:P=0.003,OR=1.35,95% CI=1.10~1.73;P=0.010,OR=1.63,95%CI=1.08~2.21)。结果表明,与rs2839698 CC 基因型患者相比,CT/TT 基因型患者更可能出现临床高分期。
表4 H19 rs2839698基因多态性与RCC患者临床病理特征的关系Table 4 H19 rs2839698 polymorphism association with clinicopathological features of RCC patients [n(%)]
2.4 H19 rs2839698基因多态性对RCC患者生存的影响
前阶段结果证明rs2839698 基因多态性与RCC进展相关,采用Log⁃Rank 检验及Kaplan⁃Meier 分析评估rs2839698基因多态性与RCC患者生存之间的关系。rs2839698 基因多态性与RCC 患者生存显著相关(Log⁃rankP=0.007,表5)。与携带rs2839698 CC 基因型的患者相比,携带rs2839698 TT 或CT/TT基因型的患者RCC 生存较差(HR=4.35,95%CI=1.65~16.92;HR=2.24,95%CI=1.10~4.59)。然而,在其他多态性和RCC 生存之间仍然没有发现显著的关联证据。随后,对RCC患者生存进行单因素与多因素COX 分析(表5 及图1),单因素分析显示临床分期、病理分级和H19 rs2839698(隐性遗传模型:CT/TTvs.CC)与肾细胞癌生存相关;在多因素分析中,临床分期是影响RCC 生存的最主要预测因子,其次是病理分级(P< 0.001,HR=15.51,95%CI=5.94~40.42;P< 0.001,HR=4.89,95% CI=2.58~10.85)。有趣的是,H19 rs2839698(CT/TTvs.CC)也是RCC 生存的独立预测因子(P=0.027,HR=2.24,95%CI=1.10~4.59)。
表5 H19 rs2839698基因多态性与RCC患者生存的关系Table 5 H19 rs2839698 polymorphism association with survival of RCC patients
图1 H19 rs2839698基因多态性对RCC患者生存的影响Figure 1 Effects of H19 rs2839698 polymorphism on survival of RCC patients
3 讨论
本研究探讨了H19 基因多态性与中国人群RCC 易感性及预后之间的关系,结果表明H19 rs2839698 变异基因型与RCC 风险增加相关,且rs2839698 变异基因型与较大的肿瘤和晚期RCC 有关;在多变量分析中,它与临床分期和病理分级均是患者生存的独立预后预测因子。
lncRNA H19 位于染色体11p15.5,作为癌基因参与恶性肿瘤的发生和转移过程[21]。H19属于高度保守的印记基因,存在3种转录变体,分别包含5个外显子和4个内含子,通过调节RNA 及核糖体参与炎症发生、血管形成、细胞凋亡及死亡等进展[22-23]。生物信息学研究表明,脑缺血发生时H19的关联基因主要富集于甲基化、基因印记、RNA 折叠及DNA转录[24]。中国人群研究显示,H19 基因高表达与乳腺癌发生风险呈正相关,且在ER(+)及HER2(+)患者中差异表达更为明显[25]。研究表明,H19 在肾肿瘤中的表达水平明显高于临近的正常组织,且高表达与临床分期级别高及预后较差明显相关[15];He等[26]表明H19在肾癌中高度表达,通过miR⁃29a⁃3p/E2F1 途径参与RCC 的转移和侵袭。越来越多的证据表明,基因变异在癌症易感性和预后中起重要作用,H19 基因多态性也在各种恶性肿瘤中被广泛研究。Ge等[27]研究表明rs217727 GG基因型携带者在肝细胞癌中H19的表达远高于GA及AA基因型携带者,表明17727G>A突变可能调控H19表达。结果与我们一致,都表明rs2839698突变基因是胃癌[20]、结直肠癌[17]和肝癌[28]的独立危险因素。Yang 等[28]发现H19 rs2839698变异基因型不仅增加了肝癌风险,而且也是吸烟亚组肝癌预后的潜在遗传预测因子,另外也发现H19 rs2839698CT 基因型的患者预后不良。一项大型多肿瘤Meta 分析显示rs2839698变异基因型在亚洲人群中与肿瘤风险增加相关,而在高加索人群中与肿瘤风险降低相关[29]。本研究结果和既往其他肿瘤中的研究发现基本一致,首先两阶段病例对照研究分析发现H19 rs2839698 位点的突变等位基因T是肾癌的发病危险因素,与野生基因型携带者相比较,携带TT基因型的个体肾癌发病风险增加了1.37倍。此外,在患者群的分层分析中发现,突变基因型携带患者更易罹患较大肿瘤以及临床高分期肾癌,风险分别为野生型患者的1.35 倍、1.63 倍,总体死亡风险为野生型患者的4.35 倍。大量研究证实H19 是促癌基因,如前所述,其不仅在肾癌中高表达,参与肾癌的发生发展,在其他多种肿瘤中,H19 也具有类似作用。因此,我们推测H19 rs2839698 位点的突变等位基因T 具有潜在的生物学功能,其可能通过调控H19的表达甚至功能而影响到肾癌的易感性、进展以及患者预后。
新近研究表明基因变异可能通过改变DNA 及RNA的二级结构来发挥作用[30],影响miRNA与特定区域的结合亲和力。研究表明,LINC00673 中rs11655237处的G>A变化可以为miR1231产生一个靶向位点,以一种特殊的等位基因方式削弱了LINC00673的作用,增加胰腺癌易感性[31]。结直肠癌研究也表明MALAT1中rs664589的等位基因C>G改变,改变了miR⁃195⁃5p与突变区的结合亲和力,导致MALAT1表达增加,促进结直肠癌的生长和转移[32]。SNPfold 预测H19 的二级结构随着rs2839698 C/T 等位基因突变发生改变,表明rs2839698 突变可能通过改变H19 的二级结构来影响RCC 的易感性和预后。此外,H19 rs2839698 多态性位点位于H19基因的3′UTR 区域,可能通过改变相关miRNA 和H19 3′UTR 区域的结合而影响H19的表达和功能。生物信息学预测发现(http://bioinfo.life.hust.edu.cn/ln⁃cRNASNP#/),H19 rs2839698 位点等位基因从C 突变为T 时,可能会导致hsa⁃miR⁃24⁃1⁃5p、hsa⁃miR⁃4486、hsa⁃miR⁃566 以及hsa⁃miR⁃24⁃2⁃5p 等结合失常,但是产生了hsa⁃miR⁃612、hsa⁃miR⁃5189、hsa⁃miR⁃1285⁃3p 以及hsa⁃miR⁃3187⁃5p的结合位点。我们推测,H19 rs2839698 位点突变可能导致了miRNA 结合状态的变化而影响其表达,进一步参与到肾癌的发展和预后。在上述这些miRNA 中,hsa⁃miR⁃566被报道在肾癌组织和细胞中高表达,并参与了肾癌细胞的侵袭行为[33]。因此,H19 rs2839698 是否和hsa⁃miR⁃566共同参与肾癌的发生发展,可能是未来的一个研究方向。
本研究也有一定局限性。首先,目前的病例对照研究是基于医院就诊人群,而不是基于总体人群,因此,不能排除特定基因型相关的个体存在选择偏差的可能性。此外,我们仅初步探讨H19 rs2839698基因型突变与RCC发病和预后的关系,仍需深入研究其对上下游基因及ncRNA功能影响的具体机制。本研究优势在于采用了两阶段的设计,在一阶段研究关联性分析中发现的结果,进一步在二阶段的研究中得到验证,可以在一定程度上排除因群体选择带来的偏倚;此外,本研究的发现结合生物信息学预测结果,推测hsa⁃miR⁃566 可能与H19 rs2839698变异有关,为将来深入的功能研究提供了方向。
综上所述,中国汉族人群lncRNA H19 rs2839698 变异与RCC 患者发病率及远期预后密切相关,可能是RCC 易感性和生存的遗传预测因子,但具体作用机制仍需进一步验证。