各基因亚型乳腺癌间基因组拷贝数变异的比较
2021-04-30王智辉钟媚共陈秋旋孟子杰伍婉婷郑焱张鑫
王智辉,钟媚共,陈秋旋,孟子杰,伍婉婷,郑焱,张鑫
0 引言
乳腺癌是最常见的女性恶性肿瘤,近四十年间,全球乳腺癌发病率保持上升趋势,严重威胁着女性健康[1-2]。乳腺癌是生物学高度异质的恶性肿瘤,临床最为常见且恶性程度较高的是浸润性乳腺癌,根据组织形态进一步分为浸润性导管癌(invasive ductal carcinoma,IDC)和浸润性小叶癌(invasive lobular carcinoma,ILC)等,并以IDC为临床的主要病理类型[3]。然而,同样的病理类型在临床生物学特征及治疗反应性上常常截然不同,这是因为特征基因的突变与异常表达往往更能反映乳腺癌的治疗反应及患者预后[4],随着高通量基因检测技术的成熟应用,乳腺癌基因特征与临床特征的关系逐渐清晰,由此建立病理基因分型逐步被临床所接受并广泛应用。
乳腺癌基因分型的方法有多种,主要通过基因的表达谱算法和免疫组织化学判读等,虽然不同的分型方法在具体样品的判断中存在差异,但群体的分类重复性上基本相似[5]。临床上公认的四个基因亚型为管腔A型(Luminal A,LumA)、管腔B型(Luminal B,LumB)、人表皮生长因子受体2过表达型(HER2 overexpression,Her2)和基底细胞样型(Basal-like,BasL),其中BasL型基本等同于免疫组织化学分型中的三阴乳腺癌(triple negative breast carcinoma,TNBC)[6]。现已知Her2型乳腺癌的特征是人表皮生长因子受体2(human epidermal growth factor receptor 2,HER2)的过表达及下游通路的持续激活,而其编码基因ERBB2(erb-B2 receptor tyrosine kinase 2)的扩增是HER2蛋白过表达的主要原因[4],迄今未见系统性报道其余三个基因亚型的基因组拷贝数变异(copy number variations,CNV)特征,因此,本课题组通过全基因组CNV分析,在癌症基因组图谱数据库(The Cancer Genome Atlas,TCGA,https://gdc-portal.nci.nih.gov/)中挖掘出与基因分型相关的CNV并加以验证。
1 资料与方法
1.1 TCGA乳腺癌的AIMS分型及全基因组CNV分析
下载TCGA中乳腺癌的表达谱测序数据、基因组拷贝信息及对应样品的临床信息,数据库的更新下载日期为2020年1月31日。参考本课题组已发表文献[5],在R语言(版本3.2.2)程序平台上,使用AIMS程序包(版本1.2.0)对每个样品的表达谱进行基因分型,纳入LumA、LumB、Her2和BasL四个基因亚型及临床信息详细的1 006例乳腺癌病例。参考本课题组已发表文献[7],利用GISTIC 2.0软件分析肿瘤组织的全基因组拷贝信息,运行所得的关键数据有:(1)每个探针标记位点的扩增或缺失情况,即G评分(G-score)。G评分的高低能综合反映该位点的扩增或缺失的深度和频率;(2)每个样品中单个基因的拷贝数变异情况,包括深度缺失(Deep deletion)、浅度缺失(Shallow deletion)、二倍体(Diploid)、第三拷贝获得(Gain)和显著扩增(Amplification)五个状况;其中在分析缺失中,将深度缺失及浅度缺失均纳入为缺失,而在扩增分析中,仅将显著扩增定义为扩增,并在R4.0.2软件中对各基因在不同基因亚型的拷贝数分布进行卡方检验(Chi-square test函数),并采用Benjamin-Hochberg方法(p.adjust函数)进行P值校正,得到Q值。
1.2 患者一般信息
收集整理2017年1月—2019年12月在江门市中心医院就诊的浸润性乳腺癌324例,均为原发灶的手术或活检检查后的剩余标本,取样前均未行任何新辅助治疗,保存在该院临床生物资源库中。TCGA与江门市中心医院乳腺癌患者的一般信息见表1,两组样品在性别、年龄、病理类型、临床分期和基因分型的分布差异均无统计学意义(均P>0.05)。本研究为回顾性研究,已申请并获批免患者知情同意,且整个项目经江门市中心医院伦理委员会审查并批准(2020-51号)。
表1 TCGA及江门市中心医院浸润性乳腺癌患者的基本信息Table 1 General information of invasive breast carcinoma patients in TCGA and Jiangmen Central Hospital
1.3 qPCR检测石蜡标本的基因拷贝数变异
参考本课题组已发表文献[7],调取石蜡组织切片,利用GeneRead DNA FFPE Kit按操作说明书提取石蜡切片的DNA;利用Taq-Man Copy Number Assay的荧光定量PCR引物Hs00450668_cn检测ERBB2基因拷贝数,引物Hs03853983_cn检测TFDP1基因拷贝数,引物Hs06966674_cn检测MIR148B基因拷贝数,引物Hs01978234_cn检测CCND1基因拷贝数,引物Hs00738157_cn检测MDM2基因拷贝数,引物Hs06266734_cn检测MIR139基因拷贝数,其中内参引物为TaqMan Copy Number Reference Assay RNase P,二倍体参考样品为健康人血浆白膜层样品,扩增试剂盒为TaqMan Fast Advanced Master Mix,按说明书在CFX96荧光定量PCR仪中检测。规定样品中目标基因的相对拷贝数检测值小于0.75为缺失(Deletion),大于1.9为显著扩增(Amplification)。
1.4 统计学方法
计数资料用频数表示,用R4.0.2、Excel 2016及GraphPad Prism7.0软件处理数据,各组间频数数据统计使用卡方检验(Chi-squared test)或Fisher’s精确检验(Fisher’s exact test),检验水准α=0.05,组间频数的两两比较使用rcompanion程序包的pairwiseNominalIndependence函数,并采用函数内默认的Benjamin-Hochberg方法进行P值校正,得到Q值。
2 结果
2.1 TCGA中各亚型的扩增区段分析
除BasL型外,另外3种亚型乳腺癌的扩增峰较为聚集,且热点扩增峰的G评分较高,可达0.8以上。以软件默认的FDR<0.25为显著性扩增的阈值,可发现BasL型的特征峰有1q43和13q34,LumB型的特征峰为12q15,Her2型的特征峰为17q12;而11q13.3在Her2型、LumA型及LumB型中扩增,在BasL型中无扩增,见图1。
2.2 TCGA中各亚型的缺失区段分析
相对于全基因组的扩增情况,各亚型缺失区段缺少明显的规律,且G评分也普遍较低,在0.2左右。6q15在Her2型、LumA型及LumB型中缺失,11q13.4特异性在LumB型中缺失,12q13.13特异性在BasL型中缺失,21q21.1在Her2型和LumB型中缺失,见图2。
图1 TCGA中各亚型的扩增区段分析Figure 1 Amplified chromosome regions of each subtype from TCGA
图2 TCGA中各亚型的缺失区段分析Figure 2 Deleted chromosome regions of each subtype from TCGA
2.3 TCGA中各拷贝数变异热点基因在各亚型间的分布
利用IGV软件并结合相关文献报道(见讨论部分),确定各区段的扩增或缺失关键基因:1q43为丝氨酸/苏氨酸蛋白激酶Akt-3(AKT serine/threonine kinase 3,Akt3)、11q13.3为细胞周期蛋白D1(Cyclin D1,CCND1)、12q15为原癌基因MDM2(MDM2 proto-oncogene,MDM2)、13q34为转录因子Dp-1(transcription factor Dp-1,TFDP1)、17q12为Erb-B2受体酪氨酸激酶2(Erb-B2 receptor tyrosine kinase 2,ERBB2)、6q15为丝裂原活化蛋白激酶7(mitogen-activated protein kinase kinase kinase 7,MAP3K7)、11q13.4为微小RNA-139(microRNA 139,MIR139)、12q13.13为微小RNA-148B(microRNA 148B,MIR148B)及21q21.1为微小RNA Let-7c(microRNA Let-7c,MIRLET7C)。上述热点基因的CNV在四种亚型的分布差异均有统计学意义(均P<0.05),其中,在BasL型中,TFDP1(13q34)的扩增和MIR148B(12q13.13)的缺失占比高;在Her2型中,ERBB2(17q12)的扩增是最显著的特征;LumB型中,CCND1(11q13.3)和MDM2(12q15)的扩增及MIR139(11q13.4)的缺失占比高;而未见LumA型的特异性CNV热点基因,见表2。
2.4 ERBB2的拷贝数变异与Her2型乳腺癌的相关性
将ERBB2的扩增定义为阳性事件,比较发现,在TCGA中Her2型阳性事件发生率为55.2%,BasL型和LumA型的阳性率均低于或等于4.4%,而LumB型较高,可达16.8%;在江门市中心医院样品中,Her2型阳性事件发生率为86.7%,BasL型和LumA型的阳性率均为0,而LumB型为2.0%,组间分布差异均有统计学意义(均P<0.05),见表3。
2.5 TFDP1/MIR148B的拷贝数变异与BasL型乳腺癌的相关性
表2 TCGA中各拷贝数变异热点基因在各亚型间的分布Table 2 Distribution of CNV hotspot genes among subtypes from TCGA
表3 ERBB2的拷贝数变异在各基因亚型间的分布Table 3 Distribution of CNV of ERBB2 among gene subtypes
将TFDP1的扩增或MIR148B的缺失定义为阳性事件,分析发现57.8%的BasL型发生了TFDP1的扩增或MIR148B的缺失,而其他亚型的阳性事件发生率均低于或等于15.2%,分布差异均有统计学意义(均P<0.05)。江门市中心医院样品中71.4%的BasL型发生了TFDP1的扩增或MIR148B的缺失,而其他亚型的阳性事件发生率均低于或等于19.5%,组间分布均差异有统计学意义(均P<0.05),见表4。
表4 TFDP1/MIR148B的拷贝数变异在各基因亚型间的分布Table 4 Distribution of CNV of TFDP1/MIR148B among gene subtypes
2.6 CCND1/MDM2/MIR139的拷贝数变异与LumB型乳腺癌的相关性分析
将CCND1或MDM2的扩增或MIR139的缺失定义为阳性事件,分析发现,47.6%的LumB型发生了CCND1或MDM2的扩增或MIR139的缺失,而其他亚型的阳性事件发生率均低于35%,分布差异均有统计学意义(P<0.05)。江门市中心医院样品中61.8%的LumB型发生了CCND1或MDM2的扩增或MIR139的缺失,而其他亚型乳腺癌的阳性事件发生率均低于或等于20.0%,组间分布差异有统计学意义(P<0.05),见表5。
表5 CCND1/MDM2/MIR139的拷贝数变异在各基因亚型间的分布Table 5 Distribution of CNV of CCND1/MDM2/MIR139 among gene subtypes
3 讨论
本研究首先利用AIMS分型软件,将TCGA数据库中的乳腺癌患者按表达谱进行基因分型,再利用GISTIC2.0软件分别对BasL型、Her2型、LumA型和LumB型患者的肿瘤组织进行全基因组CNV分析,发现:(1)相对于其他三种亚型,BasL型的扩增峰较为杂乱,表明BasL型乳腺癌的发生过程中维持基因组稳定及参与修复的功能受损,这与BasL型有高频率的肿瘤相关蛋白53(tumor protein 53,TP53)和乳腺癌易感基因1(breast cancer 1,BRCA1)突变相一致[4];(2)相对于全基因组的扩增情况,各亚型缺失区段缺少明显的规律,且具体缺失区段的程度和频率均较低,表明在各亚型中抑癌基因的功能失活只有小部分与缺失相关,这与同行的研究[8]结论相似;(3)BasL型中有高比例的13q34扩增和12q13.13缺失,Her2型有高比例的17q12扩增,LumB型的特征为高比例的12q15扩增和11q13.4缺失,而LumA型则无特异性扩增或缺失的染色体区段,这部分发现值得进一步讨论。
位于17q12区段的关键癌基因ERBB2的扩增是Her2型乳腺癌的重要分子特征,江门市中心医院样品结果显示,ERBB2(17q12)在Her2型乳腺癌中显著扩增,虽然与其他亚型间的分布比例有显著性差异,但无法做到100%的区分,其原因主要是:(1)相对于临床常用的免疫组织化学及荧光原位杂交法[9],本研究采用的qPCR法和TCGA的高通量分析均无法完全排除肿瘤组织中的原位癌、坏死及间质成分;(2)各种方法中,对于临界值的争议依然存在,无法完全做到客观分析。不过,相比于TCGA,江门市中心医院样品的验证过程中,尽可能采用显微切割的方法,剔除了大部分非目标区域组织,其临床一致性较高,可以作为TCGA分析结果的验证支持数据。
随后,用TFDP1(13q34)的扩增或MIR148B(12q13.13)的缺失定义为BasL型乳腺癌的特征分子事件,通过对TCGA的分析及江门市中心医院样品的验证,可知该事件在BasL型的阳性率比其他各亚型高3.6~7.3倍,且差异具统计学意义,表明BasL型乳腺癌中有高比例的TFDP1/MIR148B拷贝数变异。已有研究报道,BasL型乳腺癌或TNBC存在较高比例的13q34区段扩增[10],且该区段的扩增能导致TFDP1蛋白水平的上调,而TFDP1为细胞周期启动的关键转录因子家族E2Fs的共激活因子,体外实验证明,沉默TFDP1能有效抑制生长因子驱动的乳腺癌细胞增殖[11],这表明TFDP1很可能参与了BasL型乳腺癌的恶性生物学行为,是潜在的特异性靶点。同样,值得我们注意的是,有报道指出miR-148b具有抑制多种恶性肿瘤的转移能力,过表达miR-148b能抑制乳腺癌细胞浸润破坏血管内皮层,抑制乳腺癌等多种恶性肿瘤的体内转移[12-13],这提示MIR148B的缺失可能与BasL型乳腺癌部分患者的高转移临床表型相关,值得进一步挖掘其临床转化价值。
在四个分子分型中,LumA型和LumB型的区分标准还存在一定的争议,我们利用全基因组CNV分型也未能发现LumA型中较典型的扩增或缺失峰,只观察到CCND1(11q13.3)和MDM2(12q15)的扩增及MIR139(11q13.4)的缺失在LumB型中的比例更高,其中,TCGA的LumA型和LumB型发生CCND1/MDM2/MIR139拷贝数变异情况的比例分别是25%和48%,江门市中心医院样品的比例分别是14%和62%,差异均有统计学意义。虽然未见MIR139在乳腺癌组织中缺失的报道,但已有大量文献报道,CCND1和MDM2在LumB型乳腺癌中的显著扩增,其中CCND1的扩增是细胞周期素依赖性激酶4/6(cyclin-dependent kinase 4/6,CDK4/6)抑制剂帕博西尼(Palbociclib)的伴随诊断用药指标[14],而MDM2的扩增能通过抑制p53蛋白的功能促进乳腺癌化疗抵抗,是潜在的治疗靶点[15]。虽然本研究挖掘到了较新颖的乳腺癌分子分型标志物,但具体的临床价值还需要进一步加以验证。