APP下载

陆地棉LTPG 基因家族的全基因组鉴定及表达分析

2023-04-26吴翠翠肖水平夏芝任文斌任翔张先亮

棉花学报 2023年1期
关键词:基序同源元件

吴翠翠,肖水平,夏芝,任文斌,任翔,张先亮*

(1.山西农业大学棉花研究所,山西 运城 044000;2.江西省经济作物研究所,南昌 330001;3.中国农业科学院棉花研究所/ 棉花生物学国家重点实验室,河南 安阳 455000)

棉花属于锦葵科棉属,是全球最重要的经济作物之一[1],棉花产业在我国经济发展中占有举足轻重的地位。植物的角质层是由蜡质覆盖在角质的聚酯基质中形成的[2],具有防止水分散失、保护植物免受紫外线损伤等作用[2-3]。表皮蜡质可以维持植物体内的水分平衡,增强植物抵抗生物和非生物胁迫的能力[3-5]。表皮蜡质是在表皮细胞中合成的,主要在细胞快速伸长期间合成[6]。蜡质的组成因物种、器官和发育状态而异[7]。植物脂质转运蛋白(lipid transfer protein,LTP)是1 类参与生物膜间脂质转运的小肽,在角质层组装过程中转运蜡质[8]。LTPs 具有1 个疏水腔,在体外能够结合脂肪酸[9],促进脂质体之间的蛋白转移。在植物中,ABC 转运体(ATP-binding cassette transporter,ABC transporter)和LTP 是2 种主要的脂质转运体[10]。LTP 可以分为5 种主要类型(LTP1、LTP2、LTPC、LTPD 和LTPG),其中LTPG 是指带有糖基磷脂酰肌醇(glycosylphosphatidylinositol, GPI)锚定修饰的1 类脂质转移蛋白[11]。在AtLTPG1突变株系中,拟南芥茎秆表面的蜡质减少,表明LTPG 直接或间接参与了角质层脂类的沉积[12]。AtLTPG2具有与AtLTPG1类似的功能,能够将蜡质转移到拟南芥的角质层[5]。

目前,关于LTPG家族基因的研究主要集中于拟南芥[13]、小麦[14]、苹果[15]等植物,这些LTPG基因在调控抗病性及非生物胁迫响应等方面发挥了重要的作用。邓婷等[16]对雷蒙德氏棉(Gossypium raimondii)的LTPG家族开 展了研究,结果表明LTPG家族基因可能参与调控棉纤维的起始与伸长。前期研究表明,GhLTPG6基因可能对棉纤维的伸长起重要调控作用,并参与了棉花对非生物胁迫的响应[17]。本研究基于已公布的陆地棉(G.hirsutum)标准系TM-1 的基因组数据,在全基因组范围内系统鉴定了LTPG家族基因,对其编码蛋白的理化特性、保守结构域特征、基因结构、基因复制和系统进化关系等进行了分析;利用已发表的转录组数据分析了GhLTPG在棉花不同组织器官以及多种非生物胁迫下的表达模式,并通过实时荧光定量聚合酶链式反应(quantitative real-time polymerase chain reaction,qRT-PCR)对部分GhLTPG基因在非生物胁迫下的表达模式进行了验证。相关研究结果可为陆地棉GhLTPG家族成员在棉花生长发育、逆境胁迫响应等方面的功能研究奠定基础。

从棉花功能基因组数据库CottonFGD(https://cottonfgd.net/)中下载陆地棉的基因组序列(ZJU,TM-1,version 2.1)、编码序列(coding sequence, CDS)和蛋白质序列。从Pfam 数据库(http://pfam.xfam.org)获得该家族基因的隐马尔可夫模型 (hidden Markov models, HMM)文件PF14368。然后,使用HMMER 3.0 软件(http://www.hmmer.org),以1×10-5为e值阈值,初步筛选获得陆地棉LTPG家族基因ID 及蛋白序列。通过NCBI Web Batch CD-Search Tool(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)[18]和SMART(http://smart.embl-heidelberg.de/)在线工具进一步筛选鉴定GhLTPG基因。

利用在线网站ExPASy[19](https://web.expasy.org/compute_pi/)获得GhLTPG 蛋白的理论等电点和分子质量等信息。利用WoLF-PSORT[20](https://wolfpsort.hgc.jp/)和Cello 2.5[21](http://cello.life.nctu.edu.tw/)预测GhLTPG 蛋白的亚细胞定位情况。

利用Clustal X[22]软件对95 个GhLTPG 蛋白和拟南芥 (Arabidopsis thaliana)32 个AtLTPG[15]蛋白进行多序列比对,使用MEGA 7.0 软件中的邻接法(neighbor-joining,NJ)构建系统发育树[23],校准参数Bootstrap 值设置为1 000。利用在线工具Evolview(https://evolgenius.info//evolview-v2/#login)对进化树进行修饰。

利用MapChart 2.2 软件分析并绘制GhLTPG在染色体上的物理位置。利用MCScanX[24]程序进行共线性分析,并使用TBTools[25]软件进行可视化。

在MCScanX 共线性分析的基础上,进一步筛选陆地棉基因组中GhLTPG家族的同源基因对。利用KaKs_Calculator 2.0 软件[26]计算同源基因对的非同义突变率 (non-synonymous mutation rate,Ka)、同义突变率(synonymous mutation rate,Ks)以及二者的比值(Ka/Ks)。

在Gene Structure Display Server (GSDS)[27](http://gsds.cbi.pku.edu.cn)中输入基因注释文件,分析GhLTPG家族基因的外显子- 内含子结构。利用MEME SUITE[28]在线网站(http://meme-suite.org/memei)分析GhLTPG 蛋白的保守基序,基序最大发现数设为10。利用TBTools 软件对GhLTPG的系统发育树、基因结构和保守蛋白质基序进行可视化合并作图[25]。

从棉花功能基因组数据库CottonFGD(https://cottonfgd.net/)中下载GhLTPG基因起始密码子上游2 000 bp 的序列作为启动子区域。利用在线工具PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)对GhLTPG基 因 启 动子区的顺式作用元件进行预测分析。筛选出具有特定表达模式的GhLTPG的启动子作为靶序列,用Homer[29]鉴定靶序列中的特定顺式作用元件。

将GhLTPG24和GhLTPG62的全长CDS 分别克隆到pBI101-35S-GFP 载体中,并以空载体pBI101-35S-GFP 为对照进行亚细胞定位试验。将上述载体分别转化至根癌农杆菌GV3101 菌株;当烟草生长至4~5 片叶时,选择中上部叶片将农杆菌注射至烟草叶片中;室温黑暗条件下培养36~48 h 后,用激光共聚焦显微镜SP8(莱卡,德国)观察叶片中的绿色荧光蛋白(green fluorescent protein,GFP)信号。载体构建所用的引物序列见表1。

表1 本研究所用引物Table 1 Primers used in the study

从NCBI 网站SAR 数据库下载GhLTPG在不同组织器官(根、茎、叶、花托、花瓣、雄蕊、雌蕊、花萼、胚珠)和非生物胁迫(4 ℃低温,37 ℃高温,0.40 mol·L-1NaCl 盐 胁 迫,200 g·L-1PEG 6000 溶液模拟干旱胁迫)下的转录组数据(登录号:PRJNA248163)。基于FPKM (fragments per kilobase of transcript per million mapped reads,每千个碱基的转录每百万映射读取的片段)对表达量数据进行log2(FPKM+1)标准化处理,并利用TBTools[24]绘制基因表达量的热图。

1.10.1材料种植及取样。将陆地棉TM-1 的种子种植在中国农业科学院棉花研究所(河南省安阳县)的试验田中。收集棉花不同发育阶段的组织样品,包括苗期的根、茎和幼叶以及花期的雄蕊、雌蕊、花托、花瓣和花萼、开花当天(0 days post anthesis,0 DPA)的胚珠。将样品立即冷冻在液氮中,并储存在-80 ℃冰箱。每个样品取3 个重复。

1.10.2非生物胁迫处理及取样。陆地棉TM-1 植株在培养箱中(温度为26~28 ℃、16 h 光照/8 h黑暗)生长至三片真叶期,分别进行4 种非生物胁迫处理,包括低温(4 ℃)、高温(40 ℃)、盐(0.25 mol·L-1NaCl)和干旱 (300 g·L-1PEG 6000),用清水处理作为对照。在胁迫处理后0 h、3 h、6 h、12 h 和24 h 取棉花幼苗叶片。

1.10.3总RNA 的提取和qRT-PCR 验证。使用RNAprep Pure Plant Kit 试剂盒(北京天根生化科技有限公司)提取棉花样品的总RNA,并利用PrimeScriptTMRT reagent Kit 试剂盒(TaKaRa)合成第一链cDNA。使用TBGreen Premix Ex Taq Kit 试剂盒(Takara)进行qRT-PCR。以GhHis3(GH_D03G0404)为内参基因,采用2-ΔΔCt 法计算目的基因的相对表达量。qRT-PCR 所用的引物序列见表1。

在陆地棉基因组中共鉴定到95 个GhLTPG基因。根据LTPG基因在不同染色体上的位置信息,将其依次命名为GhLTPG1~GhLTPG95。经预测,GhLTPG基因的CDS 长度为273~942 bp,编码的蛋白含有90~313 个氨基酸,平均含有157 个氨基酸,其中GhLTPG15 的氨基酸数量最少,GhLTPG48 的氨基酸数量最多。GhLTPG 蛋白的理论等电点为3.91 (GhLTPG8)~11.07(GhLTPG50),平均为7.06;蛋白质分子质量在9.52(GhLTPG15)~32.01 ku(GhLTPG48)。亚细胞定位预测结果表明,43 个GhLTPG 定位于细胞 外,20 个GhLTPG 定 位 于 叶 绿 体,16 个GhLTPG 定 位 于 液 泡,10 个GhLTPG 定 位 于 质膜,4 个GhLTPG 定位于高尔基体,2 个GhLTPG定位于细胞质(附表1)。

陆地棉和拟南芥的LTPG 蛋白系统进化分析结果表明,2 个物种的LTPG 家族成员可以分为6 个亚群(Group I~VI)(图1)。在Group I 中有33 个GhLTPG 和12 个AtLTPG,是 含 有LTPG 蛋白数量最多的亚群;在Group II 中有15个GhLTPG 和6 个AtLTPG;在Group III 中有6个GhLTPG 和3 个AtLTPG,是含有LTPG 蛋白数量最少的亚群;在Group IV 中有13 个GhLTPG 和6 个AtLTPG;在Group V 中有11 个GhLTPG 和1 个AtLTPG(AtLTPG30);而Group VI 中有17 个GhLTPG 和4 个AtLTPG。

图1 陆地棉和拟南芥中LTPG 蛋白的进化树Fig.1 Phylogenetic tree of LTPG proteins in G.hirsutum and A.thaliana

由图2 可知,陆地棉每条染色体上都含有GhLTPG基因。A 亚基因组中分布有48 个GhLTPG基因,而D 亚基因组中分布有47 个GhLTPG基因。在A12 和D12 染色体上,分别含有7 个GhLTPG基因,是GhLTPG分布数量最多的染色体;D08 染色体上包含6 个GhLTPG基因;A03、A08、A09、D09、A11 和D11 染色体上均含有5 个GhLTPG基因;D01 和D02 染色体上均 含 有4 个GhLTPG基 因;9 条 染 色 体(A01、A02、A04、A07、A13、D03、D04、D05 和D13)上分布了3 个GhLTPG基因;4 条染色体(A05、A06、A10 和D07)上均含有2 个GhLTPG基因;而D06和D10 染色体均仅含有1 个GhLTPG基因。上述结果表明,GhLTPG在陆地棉A 和D 亚基因组上呈现出不完全均匀分布。

图2 GhLTPG 基因的染色体定位Fig.2 Chromosomal location of GhLTPG genes

基因家族的扩大主要依赖于片段复制、串联重复和全基因组复制等复制形式[29]。本研究分析了陆地棉GhLTPG成员的共线性关系,并鉴定了该家族的同源基因对(图3)。结果表明,共鉴定出140 对旁系同源基因,其中129 对为片段复制,占基因对总数的92.1%(附表2)。同时检测到11 对GhLTPG串联重复基因(GhLTPG5/6、GhLTPG7/8、GhLTPG8/9、GhLTPG9/10、GhLTPG-28/29、GhLTPG32/33、GhLTPG39/40、GhLTPG-50/51、GhLTPG54/55、GhLTPG76/77、GhLTPG-87/88),其中GhLTPG7/8/9/10这4 个基因串联在一起,说明个别GhLTPG基因在进化过程中可能发生了多次串联重复的扩增。

图3 GhLTPG 基因的共线性分析Fig.3 Collinearity relationship of GhLTPG genes

进一步通过计算选择压力确定GhLTPG基因对的性质。当Ka/Ks值大于1 时,表明该基因对经历了正向选择;Ka/Ks值小于1 表明该基因对经历了负向选择[31]。计算了其中130 对GhLTPG同源基因的Ka/Ks值(附表3)。其中104 对同源基因的Ka/Ks值小于0.5,占比80.0%;19 对同源基因的Ka/Ks值在0.5~1.0,占比14.6%,说明这123 对同源基因经历了纯化选择。此外,仅有7 对同源基因(GhLTPG45/GhLTPG92、GhLTPG8/GhLTPG9、GhLTPG37/GhLTPG84、GhLTPG27/GhLTPG75、GhLTPG24/GhLTPG71、GhLTPG36/GhLTPG83和GhLTPG44/GhLTPG91)的Ka/Ks值大于1,说明这些同源基因对经历了正向选择。这表明纯化选择对GhLTPG同源基因对的形成至关重要。

基于陆地棉GhLTPG 的蛋白序列构建物种进化树,可将GhLTPG 划分为5 个亚组。利用MEME 在线工具对GhLTPG 蛋白的保守基序进行预测分析,在GhLTPG 中共发现了10 个保守基序,将其命名为Motif 1~Motif 10。大多数GhLTPG 包 含 2 ~9 个 保 守 基 序,其 中GhLTPG48/95 保守基序数量最多,均为9 个;而GhLTPG20/44/68/91/94 的保守基序数量最少,均为2 个;同时发现大多数GhLTPG 蛋白含有Motif 2、Motif 3 和Motif 4,表明这3 个保守基序在GhLTPG 蛋白中高度保守(图4A)。其中,Motif 2是最保守的基序,所有的GhLTPG 蛋白都含有该基序(图4C)。

已有研究证明,基因的外显子-内含子分布模式与其生物学功能有关[32]。分析GhLTPG基因结构,发现GhLTPG基因的外显子和内含子的数量 分 别 为1 ~4 和0 ~3 (图4B)。有20 个GhLTPG没有内含子,大多数GhLTPG含有1~2 个内含子,GhLTPG17/48/86含有3 个内含子。值得注意的是,进化关系较近的基因具有相似的外显子-内含子结构。

图4 GhLTPG 的系统发育、保守蛋白基序和基因结构分析Fig.4 Phylogenetic tree, conserved protein motifs and gene structure of GhLTPG

对GhLTPG基因启动子区的顺式作用元件进行预测分析,结果表明:GhLTPG的启动子区存在组成型和诱导型顺式作用元件,可分为3 大类(生长发育、植物激素响应和非生物胁迫响应相关的元件)共22 种功能元件类型(图5)。

图5 GhLTPG 基因启动子区顺式作用元件的分布Fig.5 Distribution of cis-acting elements in the promoter region of GhLTPG genes

在生长发育类别中,主要有11 个功能元件类型,包括41 种基序。其中,95 个GhLTPG的启动子区都含有光响应元件(Sp1、chs-CMA1a、G-Box 和ACE 等31 种基序类型),5 个GhLTPG的启动子区含有控制细胞周期的响应元件MSA-like,38 个GhLTPG的启 动子区含有分生组织表达响应元件(CAT-box),16 个GhLTPG的启动子区含有昼夜节律调控响应元件(circadian),14 个GhLTPG的启动子区含有MYBHv1 结合位点元件 (CCAAT-box),4 个GhLTPG的启动子区含有栅栏叶肉细胞分化响应元件(HD-Zip1),14 个GhLTPG的启动子区含有胚乳表达响应元件(GCN4 motif),9 个GhLTPGs的启动子区含有种子特异调节响应元件(RY-element),3 个GhLTPG的启动子区含有最大激发子介导的激活响应元件 (AT-rich sequence),41 个GhLTPG的启动子区含有玉米醇溶蛋白代谢调节响应元件(O2-site),5 个GhLTPG的启动子区含有类黄酮生物合成基因调控响应元件(MBSI)。

在GhLTPG基因的启动子区鉴定出赤霉素应答元件(GARE-motif、P-box 和TATC-box)、脱落酸应答元件 (ABRE)和生长素应答元件(AuxRE 和TGA-box),分别存在于52、66 和31个GhLTPG的启动子区。

非生物胁迫响应类别共鉴定出8 种与非生物胁迫响应相关的顺式作用元件。其中,49 个GhLTPG的启动子区含有干旱诱导相关的功能元件 (MBS),41 个GhLTPG的启动子区具有低温响应元件(LTR),62 个GhLTPG的启动子区含有茉莉酸甲酯应答元件(CGTCA-motif 和TGACG-motif),51 个GhLTPG的启动子区含有防御和胁迫应答元件(TC-rich repeats),38 个GhLTPG的启动子区含有水杨酸应答元件(TCA-element 和SARE),82 个GhLTPG的启动子区含有厌氧诱导元件 (ARE),16 个GhLTPG的启动子区含有缺氧特异性诱导元件(GC-motif),37 个GhLTPGs的启动子区具有伤口反应元件(WUN-motif)。

总体而言,大多数基因的启动子区含有光响应元件、厌氧诱导元件和脱落酸响应元件,表明这些元件在GhLTPG基因家族中高度保守,可能在棉花的生长发育、激素响应和非生物胁迫响应中发挥重要作用。

利用棉花中9 个组织器官的转录组测序数据,分析GhLTPG的表达模式。GhLTPG基因的表达谱表现出明显的差异性,这种差异性表现在不同基因之间以及同一基因在不同组织器官之间。在95 个GhLTPG基因中,有17 个基因在9个组织器官中的FPKM 值接近于零,说明它们几乎不表达。另外,发现GhLTPG2/50/64/81在根中优势表达;GhLTPG7/26/36/38/39/41/59/70/73/83/85/86/88在茎中优势表达,GhLTPG13/16/23/27/60/61/75在叶中优势表达;GhLTPG34在花托中高表达;GhLTPG4/9/10/14/48/57/58/62/66/95在花瓣中高表达,其中GhLTPG4/14/48/57/62/95在花瓣中表达量较高,GhLTPG4在花瓣中特异性表达;GhLTPG17/35/44/54/82/94在雄蕊中优势表达,其中GhLTPG17/54/94在雄蕊中特异性表达;GhLTPG8/11/32/33/37/63/80/84/91在雌蕊中优势表达;GhLTPG24/42/56在花萼中优势表达;GhLTPG1/3/21/22/49/52/68/69/89在0 DPA 的 胚珠中优势表达,其中GhLTPG22/69在0 DPA 的胚珠中表达量最高。GhLTPG62在花瓣和雄蕊中的表达量均较高(图6)。上述结果表明,GhLTPG基因可能广泛参与棉花各组织器官的发育过程。

图6 GhLTPG 基因在陆地棉不同组织器官中的表达量热图Fig.6 Expression heatmap of GhLTPG genes in different tissues of G.hirsutum

利用转录组数据分析了GhLTPG基因在低温、高温、盐和干旱胁迫条件下的表达水平,发现在4 种非生物胁迫处理后,其中,48 个GhLTPG基因的FPKM 几乎为零,22 个GhLTPG基因在处理后的个别时间点表达量较高,25 个GhLTPG基因在不同胁迫处理下的表达量均较高(图7)。

在非生物胁迫下,部分基因的表达量随着处理时间的推移呈现明显的变化。在低温胁迫下,GhLTPG8/14/24/52/63/66在处理1 h 的表达量最高,在处理3 h、6 h 和12 h 的表达量逐渐降低;GhLTPG2/11/23/38/43/44/50/56/60/62/81/90在处理3 h 的表达量达到峰值;GhLTPG37/80在处理6 h 的表达量达到最高。在高温胁迫下,GhLTPG14/43/90在处理3 h 的表达量最高;GhLTPG10/13/38/75在处理6 h 的表达量最高;GhLTPG7/8/11/24/34/37/52/59/60/62/81在 处理12 h 的表达量最高。在盐胁迫下,GhLTPG11/14/24/42/43/56/62/80/90在处理后1 h 的表达量最高;GhLTPG3/8/52/84在处理后3 h 的表达量达到峰值;GhLTP2/7/16/27/34/38/50/51/59/60/67/70/75/81在处理后12 h 的表达量最高。在干旱胁迫下,GhLTPG11/14/24/42/48/52/56/62/80/95在处理后1 h 的表达量最高;GhLTPG23/27/38/43/75在处理后3 h 的表达量达到峰值;GhLTPG66在处理后6 h 的表达量最高;GhLTP7/10/34/59在处理后12 h 的表达量最高。综合分析,发现GhLTPG11/14/24/52/56/62在低温、高温、盐和干旱4 种胁迫处理下的表达量都较高,说明这6 个基因可能在非生物胁迫响应中发挥重要作用。

在棉花苗期进行低温、高温、盐和干旱胁迫处理,利用qRT-PCR 进一步验证GhLTPG11/14/24/52/56/62在棉花幼苗叶片中的相对表达量(图8)。

图8 6 个GhLTPG 基因在低温、高温、盐、和干旱胁迫处理下的表达模式分析Fig.8 Expression pattern of six GhLTPG genes under low temperature, high temperature, salt and drought stress

低温胁迫条件下,GhLTPG14/52/56基因在处理3 h 的表达量最高,均极显著高于其在CK中的表达量,然后逐渐下降,表明GhLTPG14/52/56可能在冷应激的早期发挥作用。而GhLTPG11/24/62在处理6 h 的表达量最高,较处理前均极显著升高,这3 个基因的表达量均呈现出先升后降的趋势。

在高温胁迫处理下,GhLTPG11/14/24/52/56/62的表达量在处理24 h 达到峰值,除GhLTPG24/56外,其余4 个基因的表达量均显著或极显著高于处理前,说明GhLTPG11/14/52/62均可响应高温胁迫。

在盐胁迫处理下,GhLTPG14/24/52/56在处理后3 h 的表达量最高,均极显著或显著高于处理前;另外,GhLTPG11/62在处理后6 h 的表达量达到峰值,这2 个基因在处理后3 h 和6 h 的表达量均显著或极显著高于处理前,整体表现为先升后降的表达趋势。综合分析表明,GhLTPG11/14/24/52/56/62均参与棉花对盐胁迫的响应。

在干旱胁迫处理下,GhLTPG11/14/52/56在处理后3 h 的表达量最高,极显著高于处理前;GhLTPG24在处理后12 h 的表达量达到峰值,在处理后24 h 又急剧下降,该基因在处理后3 h、6 h和12 h 的表达量均极显著或显著高于处理前;GhLTPG62在处理后6 h 的表达量最高,之后呈现下降趋势,该基因在处理后3 h 和6 h 的表达量均极显著高于处理前。综合分析表明,GhLTPG11/14/24/52/56/62均参与棉花对干旱胁迫的响应。

蛋白质的亚细胞定位与其功能密切相关。转录组数据结合qRT-PCR 分析表明,GhLTPG24和GhLTPG62基因在各种非生物胁迫处理下的表达量均较高,研究GhLTPG24 和GhLTPG62蛋白亚细胞定位分析,结果表明,GhLTPG24-GFP和GhLTPG62-GFP 融合表达蛋白均位于细胞膜上(图9)。

图9 GhLTPG24 和GhLTPG62 蛋白在烟草叶片中的亚细胞定位Fig.9 Subcellular localization of GhLTPG24 and GhLTPG62 proteins in tobacco leaves

LTPG 的功能已在多个物种中得到研究[13-15],棉花中仅对二倍体雷蒙德氏棉的LTPG基因进行了相关研究[16]。本研究在陆地棉TM-1 基因组中共鉴定到95 个GhLTPG家族基因,数量明显多于二倍体雷蒙德氏棉 (有44 个LTPG基因)。陆地棉是异源四倍体,由二倍体亚洲棉、非洲棉共同的祖先与雷蒙德氏棉杂交、染色体加倍后形成。由于多倍体化会增加基因的拷贝数,本研究也表明陆地棉基因组中数量较多的LTPG基因可能与其进化过程中经历的基因组加倍事件有关,这与前人关于棉花中其他家族基因的进化分析结果[33]一致。

基因的功能与其结构紧密相关,本研究对GhLTPG的基因结构和蛋白保守基序进行了分析,发现所有的GhLTPG 均含有Motif 2,表明Motif 2 在GhLTPG 家族中高度保守,将其与已公布的LTPG家族基因的功能域进行序列比对,发现该基序为LTPG家族基因特有的功能结构域。此外,在陆地棉进化树的同一亚组中,蛋白保守基序具有相似的排列模式,说明同一亚组内的基因功能可能相似。

在进化过程中,复制的基因也可能偏离原始功能,导致非功能化和亚功能化(行使部分原始功能或新功能化)[34]。共线性和Ka/Ks分析阐明了基因的复制和进化选择状态。本研究中共鉴定出130 对GhLTPG同源基因,其中7 对的Ka/Ks值大于1,除了GhLTPG8/GhLTPG9之外,其余6对分别是1 个基因来自A 亚组,另1 个基因来自D 亚组,说明陆地棉内部的GhLTPG基因的正向选择可能主要是由不同亚组间的突变所致。另外,123 对GhLTPG同源基因的Ka/Ks值小于0.5,说明纯化选择是该基因家族进化的主要方式,这与棉花中其他多数家族基因的进化方式一致[33,35-38]。

本研究中,进化树分析表明陆地棉和拟南芥的LTPG 蛋白的分布情况基本对应,说明陆地棉和拟南芥中LTPG家族可能具有相似的功能[13]。利用转录组数据分析GhLTPG的表达模式,结果表明GhLTPG在4 种非生物胁迫下的表达量存在差异,其中有49.5%的GhLTPG基因可能参与了相关胁迫响应。此外,基因启动子区的顺式作用元件对于基因的组织特异性表达和在不同胁迫条件下的表达模式有重要作用。本研究发现许多胁迫诱导的GhLTPG基因的启动子区含有大量与胁迫响应相关的顺式作用元件,上述结果表明棉花LTPG家族基因广泛参与了非生物胁迫响应过程。此外,通过对棉花幼苗进行胁迫处理以及qRT-PCR 分析,发现GhLTPG11/14/24/52/56/62基因在低温、高温、盐和干旱胁迫条件下显著高表达。Gao 等[15]研究表明,苹果中部分LTPG基因可能在低温和盐胁迫的早期发挥作用。此外,拟南芥中的一些AtLTPG基因可以增强植株对生物和非生物的抗性,并参与许多生物学过程(如磷脂转移、生殖发育、病原体防御等)[39-41]。本研究结果也表明棉花LTPG基因也可能具有相似的功能,后续还需进一步通过分子生物学手段验证相关基因的功能。

本研究从陆地棉基因组中共鉴定到95 个GhLTPG,根据蛋白质序列经系统发育分析将其分为5 个亚组。基因复制分析表明,片段重复是导致GhLTPG基因家族成员扩增的主要原因。顺式作用元件分析表明,GhLTPG基因可能在棉花的生长发育、非生物胁迫响应和植物激素响应中发挥重要作用。转录组数据结合qRT-PCR 结果分析表明,GhLTPG11/14/52/62基因响应低温、高温、盐及干旱胁迫,GhLTPG24/56响应低温、盐及干旱胁迫。此外,亚细胞定位分析表明,GhLTPG24 和GhLTPG62 蛋白均定位于细胞膜上。本研究为深入解析GhLTPG基因的功能奠定了基础。

附表:详见本刊网站(http://journal.cricaas.com.cn/)本文网页版。

附表1GhLTPG基因的基本信息

Table S1 Basic information ofGhLTPGgenes

附表2GhLTPG同源基因对信息

Table S2 Information ofGhLTPGhomologous gene pairs

附表3GhLTPG同源基因对Ka/Ks值

Table S3Ka/Ksvalues ofGhLTPGhomologous gene pairs

猜你喜欢

基序同源元件
EPIYA 基序与幽门螺杆菌感染相关胃病关系的研究进展
两岸年味连根同源
带TRS基序突变的新型冠状病毒威胁更大
以同源词看《诗经》的训释三则
芥蓝Aux/IAA家族基因生物信息学与表达分析
“铤”有“直”义的词源学解释——兼说/直/义的同源词族
QFN元件的返工指南
虔诚书画乃同源
在新兴产业看小元件如何发挥大作用
宝马i3高电压元件介绍(上)