应用高通量测序研究人参皂苷Rh1对乳腺癌SKBR3细胞基因表达的影响
2020-11-16李秋华鞠伶伟刘兆喆汪天青
李秋华,鞠伶伟,刘兆喆,汪天青
应用高通量测序研究人参皂苷Rh1对乳腺癌SKBR3细胞基因表达的影响
李秋华1,鞠伶伟2,刘兆喆2,汪天青1
1.辽宁中医药大学附属第二医院,辽宁 沈阳 110034;2.北部战区总医院,辽宁 沈阳 110016
观察人参皂苷Rh1对乳腺癌SKBR3细胞基因表达的影响,筛查人参皂苷Rh1干预下乳腺癌SKBR3细胞中差异表达的基因。对乳腺癌SKBR3细胞进行样本准备,获得去rRNA链特异性转录组;测序获得原始图像文件经碱基识别后转化为原始序列文件;通过质量分析评估测序数据是否适合进行生物信息学分析,应用剪切转录产物比对软件(STAR)对测序数据与参考基因组进行比对;基于美国国家生物技术信息中心(NCBI)数据库,对人参皂苷Rh1干预下乳腺癌SKBR3细胞基因的表达及差异基因的表达进行分析。高通量测序共筛查出基因26 978个,其中根据NCBI数据库注释为mRNA的基因19 229个,注释为lncRNA的基因4385个,高通量测序结果表明差异表达基因6580个,以Fold change>1为上调,<-1为下调,上调差异基因3403个,其中差异表达显著基因为小整合膜蛋白11A(SMIM11A)、嘌呤能受体P2X1(P2RX1)、碳酸酐酶9(CA9)、磷脂酰肌醇-3激酶催化亚基δ核糖核酸2(PIK3CD-AS2)、血管活性肠肽受体2(VIPR2)、非特征LOC100506314(LOC100506314)、长基因间非蛋白编码核糖核酸1389(LINC01389)、表皮生长因子受体激酶底物8-样蛋白3(EPS8L3)、视网膜筋膜基因2(FSCN2)、肠壁碱性磷酸酶(ALPI);下调差异表达基因3177个,其中差异表达显著基因为溶质载体家族1成员3(SLC1A3)、羟基类固醇17-β脱氢酶1(HSD17B1)、碳水化合物磺基转移酶11(CHST11)、溶质载体家族25成员51(SLC25A51)、β-1,3-半乳糖基转移酶6(B3GALT6)、非特征LOC101929882(LOC101929882)、δ连环蛋白家族成员(ARVCF)、蛋白磷酸酶2A催化亚基α(PPP2CA)、星形胶质细胞上调基因-1(AEG1)、磷脂酰肌醇-4-激酶B(PI4KB)。应用高通量测序技术可筛查出人参皂苷Rh1对乳腺癌SKBR3细胞增殖相关的差异性表达基因,并对筛选出的重要基因进行总结和分类。
乳腺癌;人参皂苷Rh1;SKBR3细胞;高通量测序
乳腺癌是女性常见的恶性肿瘤之一,目前发病率居女性恶性肿瘤首位。人表皮生长因子受体2(human epidermal growth factor receptor 2,HER2)是乳腺癌分类和治疗中的重要考量因素,普遍认为HER2过表达的乳腺癌患者预后较差,恶性程度较高,患者复发转移的概率较高[1-3]。随着分子生物学技术不断发展,对生命、疾病研究目前已不再局限于某个基因位点,而是集中于全基因组研究。高通量测序技术较好地弥补了一代测序的不足,可一次检测数千甚至数百万的DNA碱基序列。现代药理研究发现,人参主要有效成分人参皂苷Rh1在抗肿瘤方面具有较高的药用价值,对肺癌、胃癌、乳腺癌、结肠癌、肝癌、胰腺癌均具有一定的治疗效果[4-6]。目前关于人参皂苷Rh1在乳腺癌治疗中的研究相对较少,本团队前期采用MTS试验以明确人参皂苷Rh1对乳腺癌SKBR3细胞活性的影响,并确定了人参皂苷Rh1治疗干预的最佳药物剂量[7],本研究应用高通量测序技术筛选干预后差异表达基因,现报道如下。
1 实验材料
1.1 药物和细胞株
人参皂苷Rh1,上海纯优生物制药公司。人乳腺癌Her-2阳性细胞系SKBR3细胞,辽宁佰昊生物科技有限公司。
1.2 主要试剂与仪器
DMEM培养基(美国Gibco,批号8117230),Roswell Park Memorial Institute 1640培养基(美国Gibco,批号12002-090),胎牛血清(FBS,北京索莱宝科技有限公司,批号20160525),胰蛋白酶(美国Gibco,批号27254-019),RNAiso Plus(瑞士罗氏,批号BK1122)。CO2组织细胞培养箱(美国Thermo,3111型),净化工作台(北京长城),-25 ℃低温冰箱(青岛海尔,DW-25L262),电热恒温水浴箱(BIOER),96孔细胞培养板(美国Corning,3599),倒置式金相显微镜(日本Olympus,GX41),聚合酶链反应核酸扩增仪(美国MJ.Research Inc.,PTC-200),全自动毛细管电泳系统(德国Qiagen,QIAxcel12-96),微量离心机(德国Thermo,17 000×)。
2 实验方法
2.1 细胞培养及给药
细胞接种后,用含10%FBS PRMI1640,置于5%CO2、37 ℃恒温培养箱中培养,24 h换培养液1次。当细胞生长至80%~90%密度时进行细胞传代。细胞给药过程参照相关研究[7]。
2.2 总RNA提取
2.2.1 细胞破碎
弃培养液,PBS清洗细胞1次;加2 mL RNAiso Plus,轻轻晃动;将细胞裂解液移至离心管,反复吹吸,待裂解液中无明显沉淀为止;室温静置5 min。
2.2.2 总RNA提取
裂解液中加入氯仿,涡旋乳液化;室温静置5 min,4 ℃、12 000 r/min离心15 min;吸上清液至新的离心管,加入0.5~1倍RNAiso Plus体积异丙醇,颠倒混匀,静置10 min;4 ℃、12 000 r/min离心10 min;弃上清液,加入等量75%乙醇,4 ℃、7500 r/min离心5 min,弃上清液;用RNase-free Water溶解沉淀。
2.3 总RNA质检
以RNase-free Water作为空白,测定总RNA浓度和纯度,QIAxcel Advanced检测总RNA完整性,Nano Drop 1000检测OD260/280≥1.5、OD260/230≥1.0,电泳图像示样品条带完整,进行RNA分子完整性检测[8]。
2.4 构建文库
对乳腺癌SKBR3细胞进行样本准备,获得去rRNA链特异性转录组。总RNA中加带Oligo d(T)磁珠,对mRNA进行富集。片段化处理:mRNA反转录;反转录合成cDNA,加入AMPure XP磁珠;纯化cDNA末端补平磷酸化,cDNA的3’末端加poly(A)尾,连测序接头,AMPure XP磁珠再次对cDNA进行纯化;应用PCR技术进行文库富集,AMPure XP磁珠纯化PCR反应[9]。
2.5 测序分析
测序获得原始图像文件经碱基识别后转化为原始序列文件。扩增cDNA片段中,dNTP荧光标记,高通量测序检测与cDNA片段结合的dNTP信号,了解碱基信息[10]。
2.6 数据分析
通过质量分析评估测序数据是否适合进行生物信息学分析,应用剪切转录产物比对软件(STAR)对测序数据与参考基因组进行比对。
2.6.1 RNA质控
一般以Q20及Q30值作为测序质量评价标准,read中N含量超过该read长度比例的10%,或read中含有低质量(Q≤5)碱基数超过该条read长度的50%,去除paired reads[11]。
2.6.2 差异表达基因的过滤与注释
高通量测序后,过滤筛查的差异表达基因,过滤条件以RPKM、Fold change为依据,RPKM单边>0.5且双边不为0,Fold change>1.5或<0.666 7,基于美国国家生物技术信息中心(NCBI)数据库进行差异基因注释归纳[12-13]。
3 结果
3.1 总RNA完整性检测结果
毛细管电泳结果见图1,M组为Marker,A~F 6组样品总RNA 28 s/18 s面积比值均大于1,RIN值均大于7,完整性较好,符合实验要求。
3.2 RNA质控结果
根据质控条件对每个测序循环的碱基组成及碱基质量进行统计,绘制碱基组成及碱基质量分布图。测序样本说明。实验组:人参皂苷Rh1培养的乳腺癌SKBR3细胞(Rh1+样品序号1、2、3),对照组:无应用药物培养的乳腺癌SKBR3细胞(S+样品序号1、2、3)。碱基质量值与错误率:sQ=-10 log10℮。
图1 总RNA凝胶电泳图
3.2.1 碱基组成分布
测序采用2*150碱基测序模式,每个样本对应产生2个碱基组成的分布图,见图2。
图2 碱基组成分布图
3.2.2 碱基质量分布
碱基为横坐标,对应Q值为纵坐标,红线代表中位数,蓝线表示平均值,黄色为25%~75%区间,触须为10%~90%。见图3。
图3 碱基质量分布图
3.3 read样本分布结果
3.3.1 read样本组成分布
R1样本中的reads在基因组成分中分布见图4。
图4 R1样本中reads在基因中分布
3.3.2 差异表达基因过滤与注释结果
基因差异表达分析存在多种不同的软件,其算法基于不同的统计学算法和统计学假设,因此获取的差异表达基因结果差异很大,具体基因在不同样本间比较过程中得到的值也可能存在较大差异,且在无生物学重复的情况下值意义不十分明显。所以,我们以RPKM和Fold change为标准作为过滤条件,找到差异基因后,使用聚类分析判断差异转录本基因在不同实验条件下的表达模式,以不同实验条件下的差异基因RPKM值为表达水平,使用层次聚类分析将表达模式相同或相近的基因聚集成类,并使用不同颜色的区域代表不同的聚类分组信息,从而判断不同样品或不同实验条件下调控模式的聚类模式。
以Fold change>1与<-1的结果作为相应的上调与下调结果,Fold change阈值可根据具体样本情况进行调整。共筛查出基因26 978个,NCBI数据库注释为mRNA的基因19 229个,注释为lncRNA的基因4385个,筛查差异表达基因合计6580个。其中上调差异表达基因3403个,主要差异表达显著基因为小整合膜蛋白11A(SMIM11A)、嘌呤能受体P2X1(P2RX1)、小整合膜蛋白11A(SMIM11A)、嘌呤能受体P2X1(P2RX1)、血管活性肠肽受体2(VIPR2)、非特征LOC100506314(LOC100506314)、长基因间非蛋白编码核糖核酸1389(LINC01389)、表皮生长因子受体激酶底物8-样蛋白3(EPS8L3)、视网膜筋膜基因2(FSCN2)、肠壁碱性磷酸酶(ALPI)。下调差异表达基因3177个,其中差异表达显著基因为溶质载体家族1成员3(SLC1A3)、羟基类固醇17-β脱氢酶1(HSD17B1)、碳水化合物磺基转移酶11(CHST11)、溶质载体家族25成员51(SLC25A51)、β-1,3-半乳糖基转移酶6(B3GALT6)、非特征LOC101929882(LOC101929882)、δ连环蛋白家族成员(ARVCF)、蛋白磷酸酶2A催化亚基α(PPP2CA)、星形胶质细胞上调基因-1(AEG1)、磷脂酰肌醇-4-激酶B(PI4KB)。上调、下调差异基因前10位见表1、表2,差异表达基因过滤与注释统计情况见表3。
表1 上调显著差异表达基因
基因名称 位置表达量差异表达倍数 样本1样本2 SMIM11Achr21:35747748-357614520.001 1.9251458.227 P2RX1chr17:3799884-38199600.043 5.737 132.145 CA9chr9:35673914-356811540.30028.377 94.332 PIK3CD-AS2chr1:9711789-98845840.020 1.911 91.549 VIPR2chr7:158820865-1589376490.028 1.910 69.543 LOC100506314chr12:13127798-131532430.009 0.580 63.543 LINC01389chr1:47846467-479063630.021 1.350 61.903 EPS8L3chr1:110292701-1103066440.018 0.952 54.339 FSCN2chr17:79495416-795041560.020 0.896 44.728 ALPIchr2:233320821-2333254550.013 0.529 43.547
表2 下调显著差异表达基因
基因名称 位置表达量差异表达倍数 样本1样本2 SLC1A3chr5:36606456-3668843628.83519.2320.667 HSD17B1chr17:40703983-40707232 1.059 0.7060.667 CHST11chr12:104850691-10515579214.076 9.3830.667 SLC25A51chr9:37877571-3790435010.775 7.1820.667 B3GALT6chr1:1167628-117042045.28630.1830.667 LOC101929882chr2:10181679-10183528 0.763 0.5090.666 ARVCFchr22:19863040-20004309 1.768 1.1780.666 PPP2CAchr5:133532147-133561950110.25773.4450.666 AEG1chr8:98656406-98742488 94.24362.7750.666 PI4KBchr1:151252499-151300191 42.17128.0860.666
表3 差异表达基因过滤与注释统计情况(个)
名称差异表达基因数 DEG6580 Up Regulate3403 Down Regulate3177 mRNA19 229 lncRNA4385 mRNA DEG5967 lncRNA DEG451
4 讨论
高通量测序技术近年来被广泛应用于各行各业,尤其在基因检测中。转录组测序技术RNA-seq又称全转录组鸟枪法测序,主要以高通量测序技术为基础,将mRNA、small RNA和non-coding RNA等通过高通量测序技术检测其碱基序列。本实验通过该技术筛查药物干预下差异表达基因,过滤条件干预后,发现乳腺癌SKBR3细胞中差异表达基因6580个:上调差异表达基因3403个,包括SMIM11A、P2RX1、CA9、PIK3CD-AS2、VIPR2、LOC100506314、LINC01389、EPS8L3、FSCN2、ALPI;下调差异表达基因3177个,差异表达显著的基因为SLC1A3、HSD17B1、CHST11、SLC25A51、B3GALT6、LOC101929882、ARVCF、PPP2CA、AEG1、PI4KB。
人参皂苷Rh1作为人参皂苷主要组成成分之一,其抗肿瘤作用越发受到关注。陈声武等[14]研究发现,人参皂苷Rh1在离体和整体情况下均有抗肿瘤作用,且人参皂苷Rh1的作用强于其前体人参皂苷Rg1,人参皂苷Rh1抗肿瘤作用与促进肿瘤坏死因子分泌及基因表达具有一定的相关性。孙倩[15]研究发现,人参皂苷Rh1对白血病K56细胞及人宫颈癌Hela细胞均有抑制作用。Yoon等[16]研究发现,人参皂苷Rh1可抑制C-Jun及C-fos的表达,下调MMP-1,进而抑制肝癌细胞侵袭转移。Choi等[17]研究发现,人参皂苷Rh1可抑制Juk、p38MAPK磷酸化,从而抑制MAPK信号通路,进而抑制肿瘤侵袭转移。魏然等[18]研究发现,人参皂苷Rhl可通过抑制MMP-9表达,进而抑制人结肠癌细胞SW480的侵袭转移。
目前大多数恶性肿瘤的病因和机制尚不十分清晰,而在临床工作中,应用针对性的检测分析,对干预治疗和个体化指导用药均有积极意义。应用高通量测序技术可筛查人参皂苷Rh1对乳腺癌SKBR3细胞增殖有关的差异性表达基因,并对筛选出的重要基因进行总结和分类。依据本次筛查发现的差异表达基因情况,我们对差异表达基因的表达情况进行层次聚类分析,应用京都基因和基因组百科全书数据库进行生物信息学富集分析,对差异表达基因功能及相关信号通路进一步分析发现,差异表达基因在人类乳头瘤病毒感染、剪接体、基底黏附、细胞凋亡及mTOR、MAPK、TNF、泛素-蛋白酶体信号通路等富集结果显著,表明人参皂苷Rh1可能通过这些信号通路对乳腺癌SKBR3细胞的活性进行抑制[7],这对于进一步探索药物作用靶点及分子机制具有重要意义。
[1] 孟文静,张继博,李淑芬,等.曲妥珠单抗治疗185例HER2阳性乳腺癌患者的心脏安全性评价[J].肿瘤防治研究,2018,45(2):86-90.
[2] LABIDI S, MEJRI N, LAGHA A, et al. Targeted therapies in HER2 overexpressing metastatic breast cancer[J]. Breast Care(Basel), 2016,11(6):418-422.
[3] FLORIDO R, SMITH K L, CUOMO K K, et al. Cardiotoxicity from human epidermal growth factor receptor-2(HER2) targeted therapies[J]. J Am Heart Assoc,2017,6(9):e006915.
[4] 李为,刘伟,邹君君.人参皂苷Rg-5通过 miR-125b/STARD13/NEU1信号通路对胃癌 BGC-823 细胞侵袭迁移的影响[J].中国实验方剂学杂志, 2018,24(22):138-142.
[5]宋齐.人参化学成分和药理作用研究进展[J].人参研究,2017,29(2):47-54.
[6] 丁艳芬,李江霞,杨崇仁.人参皂苷Rh1的药理作用研究进展[J].中国现代中药,2013,15(4):282-285.
[7] 李秋华,鞠伶伟,王宁,等.通过KEGG生物通路富集分析探析人参皂苷Rh1对乳腺癌SKBR3细胞基因表达的影响[J].中医药导报,2019,25(20):36-41.
[8] WANG J, LIU K, LIU Y, et al. Evaluating the bias of circRNA predictions from total RNA-Seq data[J]. Oncotarget,2017,67(8):110914-110921.
[9] 何雨琦,李桂梅,周鑫,等.用于Illumina测序平台不同试剂盒制备RNA-seq文库的方法比较[J].基因组学与应用生物学,2017,36(11):4607-4615.
[10] 张际峰,王洋,汪成润.高通量测序技术及其在表观遗传学上的应用[J].生命科学,2012,24(7):705-711.
[11] 吴金雨.基于高通量测序的DNA甲基化相关生物信息学工具的开发[D].合肥:中国科学技术大学,2014.
[12] 孙金泽.染料木黄酮与内源性雌二醇对人乳腺癌细胞系MDA-MB-231和T47D双向作用后差异表达基因的筛选与验证分析[D].昆明:昆明医科大学,2016.
[13] GUO Y, SHENG Q, LI J, et al. Fold-change consistency between the Agilent method and the RPKM method from 53 paired tumor-normal breast cancer samples[J]. PLoS One,2013,8(8):e71462.
[14] 陈声武,王岩,王毅,等.人参皂苷Rg1、Rh1抗肿瘤作用的研究[J].吉林大学学报(医学版),2003,29(1):25-28.
[15] 孙倩.人参皂苷Rh诱导Hela和K562细胞凋亡[J].肿瘤药学,2011, 1(5):434-438.
[16] YOON J H, CHOI Y J, LEE S G. Ginsenoside Rh1 suppresses matrix metalloproteinase-1 expression through Inhibition of activator protein-1 and mitogen-activated protein kinase signaling pathway in human hepatocellular carcinoma cells[J]. Eur J Pharmacol,2012, 679(1/2/3):24-33.
[17] CHOI Y J, Y00N J H, CHA S W, et a1. Ginsenoside Rh1 inhibits the invasion and migration of THP-1 acute monocytic leukemia cells via inactivation of the MAPK signaling pathway[J]. Fitoterapia, 2011,82(6):911-919.
[18] 魏然,肖玉红,徐维,等.人参皂苷Rh1对人结肠癌细胞侵袭和转移的影响[J].重庆医学,2019,48(12):1996-2000.
Effects of Ginsenoside Rh1 on Gene Expression of Breast Cancer SKBR3 Cells by High Throughput Sequencing
LI Qiuhua1, JU Lingwei2, LIU Zhaozhe2, WANG Tianqing1
To determine the effects of ginsenoside Rh1 on gene expression of breast cancer SKBR3 cells; To screen the differentially expressed genes in breast cancer SKBR3 cells under the intervention of ginsenoside Rh1.Samples of breast cancer SKBR3 cells were prepared to obtain rRNA chain-removed specific transcriptome. The original image file obtained by sequencing was transformed into the original sequence file after base recognition. After quality analysis, the sequencing data were evaluated whether suitable for bioinformatics analysis and the sequencing data were compared with the reference genome by using STAR software. Based on the NCBI database, the gene expression level and differential gene expression of SKBR3 cells under the intervention of ginsenoside Rh1 were screened and annotated.Through high throughput sequencing technology, a total of 26 978 genes were screened, of which 19 229 genes were annotated to mRNA and 4385 genes were annotated to lncRNA according to the NCBI database. High throughput sequencing showed 6580 differentially expressed genes. Fold change value greater than 1 was used as up-regulation, less than -1 as down-regulation. There were 3403 differentially expressed genes up-regulated, including SMIM11A (small integral membrane protein 11A), P2RX1 (purinergic receptor P2X1), CA9 (carbonic anhydrase 9), PIK3CD-AS2 (PIK3CD antisense RNA 2), VIPR2 (vasoactive intestinal peptide receptor 2), LOC100506314 (uncharacterized LOC100506314), LINC01389 (long intergenic non-protein coding RNA 1389), EPS8L3 (epidermal growth factor receptor kinase substrate 8-like protein 3), FSCN2 (fascin gene 2), ALPI (alkaline phosphatase, intestinal). There were 3177 down-regulated genes, including SLC1A3 (solute carrier family 1 member 3), HSD17B1 (hydroxysteroid 17-beta dehydrogenase 1), CHST11 (carbohydrate sulfotransferase 11), SLC25A51 (solute carrier family 25 member 51), B3GALT6 (beta-1,3-galactosyltransferase 6), LOC101929882 (uncharacterized LOC101929882), ARVCF (delta catenin family member), PPP2CA (protein phosphatase 2 catalytic subunit alpha), AEG1(astrocyte elevated gene-1 protein), and PI4KB (phosphatidylinositol 4-kinase beta).This study screens out the differentially expressed genes of ginsenoside Rh1 related to the proliferation of SKBR3 cells by high throughput sequencing technology, and summarizes and classifies the important genes.
breast cancer; ginsenoside Rh1; SKBR3 cells; high throughput sequencing
R285.5
A
1005-5304(2020)10-0048-06
10.19879/j.cnki.1005-5304.202003727
辽宁省中医药临床学(专)科能力建设项目(2017年);辽宁省博士启动基金(20180540043);辽宁省自然科学基金(2019-MS-351)
汪天青,E-mail:34318974@qq.com;刘兆喆,E-mail:lzz_summer@126.com
(2020-03-27)
(2020-04-09;编辑:华强)