APP下载

润滑障碍中的lncRNA⁃mRNA共表达网络的构建及功能预测

2021-12-11刘天娇张晶晶马洁桦潘连军阮红杰

关键词:共表达测序阴道

刘天娇,张晶晶,马洁桦,潘连军,阮红杰

1南京医科大学附属妇产医院妇女保健科,2产科,3医学研究中心,4泌尿外科,5急诊医学科,江苏 南京 210004

女性性功能障碍(female sexual dysfunction,FSD)是一种病因复杂的盆底功能障碍性疾病,受年龄、种族、月经状况、人际关系、心理健康等多重因素影响,严重影响夫妻关系的和谐[1-2]。《诊断与统计手册:精神障碍》5版将FSD 分为:女性性欲⁃唤起障碍、女性性高潮障碍和性交痛障碍[3]。据估计,FSD的全球发生率为25.8%~91.0%[2],而中国城市女性阴道润滑障碍(lubrication disorder,LD)、性高潮障碍、性唤起障碍、性欲低下以及性交痛的发生率分别为36.8%、30.6%、25.4%、23.6%和21.8%[4],其中LD 为最常见类型。虽然LD 的发生率如此之高,但受传统文化的影响,女性羞于表达自己的烦恼和诉求,尤其是涉及性需求相关的问题,这使得患有LD的女性在中国并没有受到足够的重视[5]。因此,亟需相关研究来阐明LD 的发病机制等问题,为其诊疗提供线索和依据。

近年来,随着基因测序分析技术的盛行,非编码RNA作为基因调节器的一部分在人类疾病的发生发展中起着至关重要的作用[6-7],而长链非编码RNA(long non⁃coding RNA,lncRNA)更是引起了人们的广泛关注[8]。lncRNA是指长度超过200个核苷酸的转录本[9-10],其生物学功能包括:①顺式或反式转录调节因子;②mRNA加工、转录后调控和蛋白活性的调节因子;③核结构域的调节[9]。lncRNA具有多种调控方式,它不仅可以作为miRNA的前体在生物体内发挥作用,而且还对mRNA有调控作用。根据lncRNA不同的调控方式,lncRNA与mRNA之间的关联关系也较多,包括Antisense 关系、Cis 关系以及Trans 关系,不同的lncRNA⁃mRNA关系可能行使不同的功能[11]。先前研究发现miR⁃137 可以通过下调Aquaporin⁃2(AQP2)的表达抑制阴道上皮细胞的通透性,这表明miRNA可能通过降低AQP2的蛋白水平参与LD的发生发展[12]。因此,有理由认为lncRNA可能与LD的发病机制有关,而其间的相互作用也值得深入研究。

本研究为了探索LD 中的差异表达lncRNA⁃mRNA 网络,进一步了解LD 的潜在发病机制,利用下一代测序中LD 患者lncRNA 测序数据,筛选出阴道上皮组织与对照组织中差异lncRNA,并以候选lncRNA 为中心构建了lncRNA⁃mRNA 共表达网络,并预测了其生物学功能。

1 对象和方法

1.1 对象

研究对象来源于南京医科大学附属妇产医院美容整形外科,2017年10月—2018年5月对在此科室行阴道紧缩术的、无其他妇科疾病的女性,使用自制问卷、焦虑自评量表(self⁃rating anxiety scale,SAS)、抑郁自评量表(self⁃rating depression scale,SDS)、中文版女性性功能指数量表(Chinese version of female sexual function index,CVFSFI)收集志愿者的一般资料,并评估其焦虑抑郁情况及性功能障碍程度。剔除存在焦虑抑郁症状的患者后,随机选择6 例阴道润滑维度单项评分<3.9 分者作为LD 组以及6例总体评分>25分且LD单项评分>3.9分者为对照组。纳入标准如下:①成年汉族女性,具有中等以上学历;②无其他基础妇科疾病;③计划接受阴道紧缩术。本研究使用《中文版女性性功能指数评估表》进行评估。在手术过程中,取LD组和对照组女性的阴道上皮组织置于冻存管,随后立即保存在液氮中待用。本研究经南京医科大学附属妇产医院伦理委员会批准(宁妇伦字〔2014〕64号)。

1.2 方法

1.2.1 组织RNA提取及下一代测序技术

组织RNA 提取使用QIAzol 裂解液(Qiagen 公司,德国)进行,按照说明书上的步骤提取样本总RNA。提取出的样本RNA 的质量和浓度通过分光光度计ND⁃1000(Thermo Fisher 公司,美国)检测。RNA 提取完成后,cDNA 文库的构建和下一代测序全部由北京博奥生物集团有限公司完成。RNA 中的rRNA 经Ribo⁃ZeroTMMagnetic Kit(Epicentre 公司,美国)去除,线性RNA 用Ribonuclease R 酶(Epicen⁃tre公司,美国)消化。cDNA文库的构建根据TruSeq文库构建流程完成。通过Illumina Cluster Genera⁃tion成簇,通过Illumina Hiseq 2500完成测序。

1.2.2 测序数据质控

使用FastQC 软件评估fastq 格式的原始数据的测序质量;使用NGSQC 软件对原始数据进行过滤,删除低质量及含N 高于5%的不满足分析标准的reads,得到可用于后续比对、统计以及分析的clean reads;选用人类基因组的hg19(UCSC)基因组作为参考,使用具有默认参数的Tophat2 将高质量的纯净读段与参考基因组进行比对。

1.2.3 序列回帖

回帖结果统计主要包括对所有reads 总体的比对情况统计以及饱和度分析,通过Picard 软件统计reads 比对的位置分布、reads 均一性分布等。本研究以reads 的总体回帖率≥70%,且多重比对率≤10%为回帖标准。根据reads 回帖到参考基因组上的位置进行分类得到分布图,直观反映出在已有的参考基因组注释中样品基因组的转录情况。同时,通过均一性分布图观察reads 在基因的不同位置分布情况,若分布相对比较均匀,则表明cDNA片段化的随机性好。

1.2.4 lncRNA表达量及样品相关性分析

新的lncRNA 预测主要通过基本过滤、编码能力过滤等筛选出符合要求的转录本,将筛选所得的转录本作为新的lncRNA 进行后续分析,通过长度进行过滤。通过过滤得到了known lncRNA 及novol lncRNA,合并全部lncRNA以及mRNA得到lncRNA及mRNA的全部转录本id,根据转录本id,在total RNA的表达量分析列表中分别提取lncRNA 与mRNA 的表达量,进行lncRNA部分样品的相关性分析。

1.2.5 差异表达分析

使用R语言的edgeR/limma软件包实现对LD组和对照组中lncRNA 以及mRNA 进行差异表达分析。limma包分析过程中通过比较假设检验来评估给定基因集中的基因是否相对于不在集内的基因在差异表达基因的排序中更靠前。再通过基因间相关性和基因集的规模得到方差膨胀因子,用它调整基因集检验统计值的方差后,将会返回根据多重假设检验进行了校正的P值。在两个组中,以差异倍数(fold change,FC)绝对值≥2和P值<0.05为标准来筛选组间显著差异表达(Differentially expressed,DE)的DE⁃lncRNA 以及DE⁃mRNA。同时,以皮尔森相关系数(Pearson correlation coefficient,PCC)的绝对值>0.95 及校正后P值<0.05 为标准,结合lncRNA和mRNA间的相关性分析筛选具有相关关系的DE⁃lncRNA及DE⁃mRNA。用Circos软件绘制circos图。

1.2.6 基于DE⁃lncRNA 和DE⁃mRNA的共表达网络构建

基因共表达网络的构建直观地显示了lncRNA和mRNA 之间的关联性,其基本方法是对差异lncRNA 和mRNA 的全部样本表达值进行相关性计算,筛选出显著相关的lncRNA⁃mRNA 关系对。通过R 软件中的corr.test 函数计算基于DE⁃lncRNA 表达水平和DE⁃mRNA 靶向的PCC 值,采用Pearson 相关系数,默认过滤阈值为0.99;假设检验P值校正采用holm算法,默认过滤阈值为0.05。默认不考虑同种RNA 类型之间的相关性。以PCC>0.95 和P<0.05 为标准,保留有相关关系的DE⁃lncRNA 和DE⁃mRNA 作为后续研究的基础。使用Cytoscape 软件实现lncRNA⁃mRNA共表达网络的可视化。

1.2.7 差异基因功能富集分析

对显著性差异表达的mRNA 进行富集分析,以了解mRNA 在LD 中的作用。结合KEGG orthology based annotation system(KOBAS)数据库对共表达网络中的mRNA 进行了通路(pathway)、疾病(dis⁃ease)、基因本体学(gene ontology,GO)和KEGG(kyo⁃to encyclopedia of genes and genomes)富集分析。利用Benjamini⁃Hochberg进行多重假设检验,校正P值<0.05 被认为富集分析具有统计学意义,根据结果显示排名前30的通路、疾病和GO富集术语。

2 结果

2.1 lncRNA及mRNA的差异表达分析

通过下一代测序技术,根据|Log2FC|≥2、校正后P值<0.05 的标准筛选出LD 组和对照组中差异表达的lncRNA以及mRNA(图1)。通过对LD组和对照组相关RNA的差异表达分析,共得到499条表达上调的lncRNA 与337 条表达下调的lncRNA,以及1 582 条表达上调的mRNA 与633 条表达下调的mRNA。后续研究也以这些差异表达的基因为基础进行分析。

图1 LD组和对照组lncRNA及mRNA的差异表达分析Figure 1 Analysis of differential expression of lncRNA and mRNA in the LD group and control group

2.2 基于lncRNA与mRNA的共表达网络的构建

为了探索LD组与对照组差异表达的lncRNA与mRNA 之间的关系,使用Cytoscape 软件进一步构建了共表达网络以可视化lncRNA 与mRNA 之间的关系(图2)。最终,100个lncRNA与311个mRNA 共同参与构建了lncRNA⁃mRNA 的共表达网络。

图2 基于差异表达的lncRNA与mRNA构建的共表达网络(部分)Figure 2 Co⁃expression network coustrucfion based on differentially expressed lncRNAs and mRNAs(partial graph)

2.3 共表达网络中mRNA的功能富集分析

当共表达结果得到的mRNA数量多于20时,进行富集分析。本研究对显著关系对中的mRNA 对应的基因分别进行了疾病、基因本体学以及通路的富集分析,并展示了富集分析中排名前30项的富集结果。在疾病富集分析中,发现显著富集到的疾病包括Brugada 综合征(Brugada syndrome)、上皮性卵巢癌(epithelial ovarian cancer)、肌原纤维肌病(myo⁃fibrillar myopathies,MFM)、心肌疾病(muscular dis⁃eases)、扩张性心肌病(dilated cardiomyopathy,DCM)以及骨密度(bone mineral density)等(表1)。而在随后的GO 分析中,发现显著富集到的生物过程包括循环系统的发育(circulatory system development,GO:0072359)、心血管系统的发育(cardiovascular system development,GO:0072358)以及单个组织发育过程(single⁃organism developmental process,GO:0044767)等,显著富集到的细胞成分则包括收缩性纤维(contractile fiber,GO:0043292)、Z 盘(Z disc,GO:0030018)、I带(I band,GO:0031674)、肌原纤维(myofibril,GO:0030016)以及收缩纤维部分(con⁃tractile fiber part,GO:0044449)(表2)。而GO 富集分析中的前30 位均与分子功能无关。通路富集分析中最显著富集的通路是cGMP⁃PKG 信号通路(cGMP⁃PKG singling pathway),其后依次为醛固酮调节的钠重吸收(aldosterone⁃regulated sodium reab⁃sorption)、肌肉收缩(muscle contraction)、血管平滑肌收缩(vascular smooth muscle contraction)以及内分泌和其他因素调节的钙重吸收(endocrine and other factor⁃regulated calcium reabsorption)(表3)。

表2 GO分析中富集前10的功能Table 2 The top 10 significant enriched GO fuction

表3 GO分析中富集前10的通路Table 3 The top 10 significant enriched pathways

3 讨论

近年来,随着人们对健康的关注及重视,性健康也成为健康的一部分,尤其是FSD 中发病率最高的LD。当前的研究者们对LD 发病机制的研究仍然匮乏,而对于非编码RNA的研究让我们看到了曙光[13]。此外,也不乏非编码RNA在LD中的研究[5,12]。然而,作为在基因功能和调控等各个层面都发挥着重要作用的lncRNA 却未见其在LD 中的研究报道。本研究通过对LD 组和对照组人群的阴道上皮组织进行下一代测序,分别鉴定出499 条表达上调的lncRNA和1 582条表达上调的mRNA,以及337条表达下调的lncRNA 和633 条表达下调的mRNA。随后构建了基于差异表达的lncRNA 和mRNA 的共表达网络,并通过富集分析阐明了与LD 潜在相关的通路与机制。

为了进一步了解共表达网络中的lncRNA在LD发生发展中的生物学功能,对网络中的mRNA 进行了疾病、通路和GO 富集分析。通过对结果的分析表明,LD 的发生机制可能与循环系统的发育、肌肉的发育状况以及cGMP⁃PKG等信号通路有关。研究表明,血管平滑肌收缩会使得包括阴道、阴蒂在内的生殖器官血流量减少,进而导致阴道润滑不足、阴蒂勃起无力[14]。同时,该研究还证实NO 相关的cGMP 途径可以改善血管平滑肌细胞的松弛状态,这与本研究结果不谋而合。Park等[15]研究表明,NO⁃cGMP 信号通路参与了对阴蒂肿大的调节,这进一步表明cGMP 信号通路有望成为解决LD 的潜在机制。Comeglio 等[14]研究还表明睾酮可能通过NO⁃cGMP 通路调节血管舒张功能参与女性性唤起反应,雌激素的降低会导致盆腔内血流减少,而这些都可能导致阴道润滑不足乃至障碍的发生。本研究也表明血循环障碍可能是导致LD发生的一个潜在机制。此外,先前研究也表明肌肉力量的强弱是性功能中重要的一环[16]。本研究则显示心肌功能、肌肉收缩纤维及其组成(Z 盘、I 带)可能与LD 的发生发展息息相关。综合以上,猜测心肌功能障碍可能会导致血液循环障碍的发生,进而导致全身血管血液供应出现问题,随之而来的便是阴道血管收缩舒张功能障碍,性高潮时的阴道润滑不足。

虽然本研究揭示了一部分和LD 相关的问题,但是也无法避免其中存在的一些局限性。首先,需要扩大样本量行进一步研究。虽然LD的发病率并不低,但是符合本研究纳入标准的患者及正常对照组并不算多。因此,取到的样本量也较少。虽然纳入研究的样本量较少,但这也足够达到统计学标准。其次,研究发现了LD的一些潜在机制,但这仅依赖于生物信息技术,还需要进一步的研究来证实其在细胞、动物乃至人体水平的作用情况,以进一步阐释其作用机制。

综上所述,通过对LD 组和对照组女性阴道组织进行下一代测序,发现部分差异表达的lncRNA以及mRNA,对基于其构建的共表达网络进行富集分析发现,LD 的发病机制可能与cGMP 通路、局部肌肉功能障碍、血液循环功能障碍等有关。未来需要更多的基础及临床研究来证实猜想,以期为LD患者解决实际困扰找到合理有效的方案。

猜你喜欢

共表达测序阴道
两种高通量测序平台应用于不同SARS-CoV-2变异株的对比研究
SO2引起巨峰葡萄采后落粒的共表达网络和转录调控分析
UdhA和博伊丁假丝酵母xylI基因共表达对木糖醇发酵的影响
盆底仪在阴道分娩后尿潴留治疗中的应用
高世代回交玉米矮秆种质的转录组分析
生物测序走在前
怀孕做阴道B超,会引起流产吗
外显子组测序助力产前诊断胎儿骨骼发育不良
分析阴道气囊仿生助产术对提高阴道分娩质量的效果
基因测序技术研究进展