叉柱棉sHSP基因家族的鉴定与特征分析
2021-08-05潘鑫峰毛志君叶方婷李兆伟林伟伟林文雄
范 凯 潘鑫峰 毛志君 叶方婷 李兆伟 林伟伟 林文雄
叉柱棉基因家族的鉴定与特征分析
范 凯 潘鑫峰 毛志君 叶方婷 李兆伟 林伟伟 林文雄*
福建农林大学农学院作物遗传育种与综合利用教育部重点实验室, 福建福州 350002
植物小分子热激蛋白(small heat shock protein, sHSP)是植物热激蛋白中一类分子量最小的基因家族, 该家族具有保守的α-晶体结构域, 在响应外界环境胁迫过程中具有重要的作用。叉柱棉()有关sHSP家族的鉴定与特征分析还未见相关报道。本研究在叉柱棉中共鉴定了39个GksHSP成员, 并且可以将GksHSP成员进一步分为10个亚家族。在GksHSP家族中发现了7个基因复制事件, 并且所有的基因复制事件都是片段复制事件。棉属特有的全基因组复制事件主要导致了GksHSP成员的扩增, 其扩增还与蛋白激酶家族、线粒体载体蛋白家族以及植物生长素响应蛋白家族有关。此外, GksHSP家族可能与ABA和茉莉酸甲酯调控的胁迫响应相关, 并且GksHSP26成员及其在陆地棉中的同源基因可能在胁迫响应中具有关键的作用。本研究的结果可以进一步为今后叉柱棉和棉花的抗逆育种研究提供一定的理论基础。
叉柱棉; sHSP; 鉴定; 扩增; 功能
在自然环境中, 植物会频繁受到诸如干旱、盐渍、高温等胁迫的影响, 这些胁迫严重制约着植物的生长和发育过程, 进而影响植物的产量和品质。目前已经发现有许多基因家族可以响应外界的环境胁迫, 如WRKY家族[1]、PP2C家族[2]、NAC家族[3]等, 其中植物热激蛋白(heat shock protein, HSP)是一类重要的响应外界环境胁迫的基因家族[4]。
植物热激蛋白依据分子量的大小可以进一步分为HSP100家族、HSP90家族、HSP70家族、HSP60家族和HSP20家族, 其中HSP20家族是分子量最小的一类植物热激蛋白[5]。HSP20成员的分子量集中在15~42 kD之间, 因此又称为植物小分子热激蛋白(small heat shock protein, sHSP)[5]。sHSP成员在C端具有长度大约为80~100个氨基酸组成的保守的α-晶体结构域, 该结构域主要由β-sandwich结构组成, 其N端具有相对多样化的结构[6]。sHSP家族不仅存在于酵母、动物等中[7-8], 而且在拟南芥[9]、水稻[10]、番茄[11]、马铃薯[12]、棉花[13]、银杏[14]、簸箕柳[15]等植物中也识别出许多成员。在植物中, sHSP家族主要以分子伴侣形式保护其他蛋白质免受多种胁迫的伤害, 已有大量的研究表明sHSP成员可以响应多种外界胁迫[6]。过表达水稻的sHSP成员可以提高水稻植株的抗盐和抗旱能力[16]。过表达苜蓿的sHSP成员可以提高拟南芥植株的抗热、抗旱以及抗氧化胁迫的能力[17]。过表达拟南芥的sHSP成员可以提高拟南芥植株的抗盐和抗旱能力[18]。
叉柱棉()主要分布在莫桑比克、肯尼亚、坦桑尼亚以及南非等地区, 其可以产生棕色的纤维, 种子呈椭圆状且无短绒毛。叉柱棉属于锦葵科棉族叉柱棉属, 是常见的重要经济作物棉花的近缘物种, 是研究棉花进化趋势的关键物种。叉柱棉常年生长在高温地区, 对其高温相关基因的研究有助于揭示其耐高温调控机制并对棉花的耐高温育种具有重要的意义。叉柱棉全基因组测序的完成为研究叉柱棉乃至棉花的耐高温机制提供了便利的条件[19]。目前有关叉柱棉的研究主要集中在揭示其染色体数目(=12)比棉花染色体数目(=13)少一条的起因上[19-21], 而叉柱棉基因家族的研究还未见相关报道, 其相关的逆境胁迫研究还处于空白状态。本研究主要对叉柱棉sHSP家族的鉴定、结构特征、系统发育关系、保守结构域、基因结构、染色体定位、基因复制事件、启动子中的顺式调控元件分布等方面进行综合分析, 旨在全面解析叉柱棉sHSP家族的进化历史, 为今后叉柱棉和棉花的抗逆育种研究提供一定的理论基础。
1 材料与方法
1.1 材料
从Cottongen (https://www.cottongen.org/)中下载叉柱棉的全基因组数据, 从TAIR (https://www. arabidopsis.org/)中提取拟南芥的sHSP成员, 从CottonFGD (https://cottonfgd.org/)中获得陆地棉的全基因组数据以及表达谱数据。
1.2 sHSP成员的鉴定以及序列分析
从pfam数据库中下载(http://pfam.xfam.org/) sHSP保守区域的隐马尔可夫模型(PF00011), 并且使用HMMER 3.0程序获得候选的叉柱棉sHSP成员(GksHSP)。候选的GksHSP成员进一步利用NCBI中的CDD程序(https://www.ncbi.nlm.nih.gov/cdd)确保每一个GksHSP成员均包含保守的PF00011结构域。
通过MEME程序(http://meme-suite.org/tools/meme)对叉柱棉sHSP家族的保守基序进行分析, 使用的参数与之前的研究相一致[22]。识别出的保守基序利用NCBI中的CDD程序(https://www.ncbi.nlm.nih.gov/cdd)进行注释。使用TBtools软件对GksHSP成员的染色体定位以及基因结构的结果进行可视化展示[23]。分别使用ProtParam网站(http://web.expasy.org/protparam/)和SOPMA网站(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)计算GksHSP蛋白质的一级结构以及二级结构。
1.3 系统发育分析
所有的sHSP成员通过MAFFT软件进行序列联配分析。本研究使用最大似然法利用IQ-tree软件构建系统发育进化树, 其中最合适的模型使用ModelFinder程序进行评估, bootstrap值设定为1000。进化树使用MEGA软件进行可视化展示。
1.4 基因复制事件分析
GksHSP成员的基因复制事件主要通过MCScan (Python version)软件进行识别, 每个复制框中至少包括5个基因复制事件, 其余均为默认参数, 并且用Circos软件对基因复制关系进行可视化展示。此外, 通过MCScan (Python version)软件对与GksHSP成员复制事件相关的微共线关系进行可视化分析, 利用NCBI中CDD程序(https://www.ncbi.nlm.nih. gov/cdd)对微共线关系内的基因进行注释。另外, 使用TBtools软件[23]计算非同义替换率(Ka)、同义替换率(Ks)以及它们的比例(Ka/Ks)。
1.5 启动子区的顺式调控元件分析
从CottonGen网站中提取GksHSP成员启动子区域2000 bp的序列, 通过PlantCARE数据库(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)对其顺式调控元件进行识别。通过TBtools软件对GksHSP成员启动子区的顺式调控元件的分布图进行可视化分析[23]。
2 结果与分析
2.1 叉柱棉sHSP成员的识别和特征分析
本研究通过HMMER 3.0程序在叉柱棉基因组中共鉴定出39个叉柱棉sHSP成员(GksHSP), 并且每一个GksHSP成员均包含sHSP家族保守的PF00011结构域(表1)。依据其在染色体上的位置, 将鉴定出的GksHSP成员命名为~。
GksHSP成员编码氨基酸的长度在93~327 aa之间, 其分子量介于10.5039~36.8318 kD之间。编码长度最短(93 aa)和最小分子量(10.5039 kD)的氨基酸, 而编码长度最长(327 aa)和最大分子量(36.83181 kD)的氨基酸。GksHSP成员理论pI为4.37~9.22, 最低的pI为4.37 (GksHSP11), GksHSP22有最高的pI (9.22)。所有的GksHSP成员均具有典型的4种蛋白质二级结构(α-螺旋、延伸链、β-折叠和无规则卷曲)。在蛋白质二级结构中, 除了GksHSP31和GksHSP18包含最高比例的α-螺旋结构外, 其余GksHSP成员包含最高比例的无规则卷曲结构, 而所有的GksHSP成员均包含最低比例的β-折叠结构。
2.2 叉柱棉sHSP成员的系统发育分析
本研究利用IQ-tree软件对拟南芥和叉柱棉中sHSP成员进行系统发育分析(图1)。使用ModelFinder模式计算发现, JTT+I+G4模型为构建该系统发育关系中最合适的氨基酸替换模型。按照之前对sHSP亚家族的分类标准[6], 本研究可以将GksHSP成员分为10个亚家族, 并且每个亚家族包含不同数目的GksHSP成员。CI亚家族有18个GksHSP成员, CII亚家族有5个GksHSP成员, CP亚家族有3个GksHSP成员, CIV亚家族、CV亚家族、ER亚家族、MTI/CP亚家族和PX亚家族分别有2个GksHSP成员, CIII亚家族和MTII亚家族分别有1个GksHSP成员, 另外还有1个GksHSP成员不属于任何亚家族。
2.3 叉柱棉sHSP成员的保守基序分析
在GksHSP家族中, 通过MEME程序识别出20个潜在的保守基序(图2)。利用CDD程序对这20个保守基序进行注释发现, 只有3个基序(motif 1、motif 2和motif 3)注释为sHSP保守结构域, 其他的基序暂时没有发现任何注释信息(表2)。基于这20个保守基序的分布, 可以进一步将GksHSP家族分成类似于系统发育研究中10个亚家族。motif 1、motif 2和motif 3存在于大部分的GksHSP成员中, 而其他的基序存在于特定的GksHSP亚家族。例如motif 9和motif 12只存在来自CII亚家族的GksHSP成员, motif 10和motif 18只存在来自CIV亚家族的GksHSP成员, motif 11和motif 19只存在来自CV亚家族的GksHSP成员。
2.4 叉柱棉sHSP成员的基因结构分析
本研究对GksHSP成员的基因结构进行分析, 根据外显子和内含子的数量, 可以将GksHSP成员的基因结构分为4种不同的类型(图2)。第1种类型包括24个GksHSP成员, 它们均只含有1个外显子, 没有内含子。第2种类型包括2个外显子和1个内含子, 有12个GksHSP成员属于这种类型。除此以外,包括3个外显子和2个内含子,和包括4个外显子和3个内含子。不同亚家族的基因结构具有一定的保守性, 如CII亚家族和ER亚家族的GksHSP成员只含有第1种类型的基因结构, CIV亚家族和MTII亚家族的GksHSP成员只含有第2种类型的基因结构。
表2 通过MEME程序识别有关GksHSP成员的基序信息
表3 叉柱棉中复制的sHSP成员的Ka和Ks分析
2.5 叉柱棉sHSP成员的染色体定位分析
本研究鉴定的39个GksHSP成员定位在叉柱棉的11条染色体上, 但在叉柱棉的KI_01染色体上不存在任何GksHSP成员(图3)。39个GksHSP成员并非平均分布在这11条染色体上。其中KI_05染色上包含最多的GksHSP成员(11个), 其次是KI_07染色体(6个)以及KI_12染色体(4个)。KI_06、KI_09和KI_10染色体上各包含3个GksHSP成员, KI_2_4、KI_03、KI_08和KI_13染色体上各包含2个GksHSP成员, 而KI_11染色体上仅包括1个GksHSP成员。另外, 一些GksHSP成员在叉柱棉的染色体上集中存在, 例如KI_05染色体的上半部和下半部以及KI_07染色体的下半部。
2.6 叉柱棉sHSP成员的基因复制事件分析
在叉柱棉中通过MCScan软件共识别出7个与sHSP成员有关的基因复制事件(表3), 复制的GksHSP成员主要位于KI_05、KI_06、KI_07、KI_08以及KI_12染色体上(图4-A)。鉴于相同复制事件中复制基因位于不同的染色体上, 所以在叉柱棉中所有的与sHSP成员有关的复制事件均为片段复制事件, 而不是串联复制事件。在GksHSP家族中, 7个片段复制事件主要分布在CI亚家族、CII亚家族和CP亚家族中, 其中CII亚家族包含4个基因复制事件, CI亚家族包含2个基因复制事件, CP亚家族包含1个基因复制事件(图4-B)。本研究对这些基因复制事件的Ks值分布进行计算发现, 大部分的基因复制事件的Ks值集中分布在0.731左右, 仅有1对复制基因(/)的Ks值为1.04 (图4-C)。同时, 本研究对这些基因复制事件的Ka/Ks比值进行计算发现, 所有的基因复制事件的Ka/Ks比值均小于0.25。
在叉柱棉中, 7个基因复制事件主要与5个复制框(复制框1~复制框5)有关, 其中复制框1和2均包括2个基因复制事件, 另外3个复制框只包括1个基因复制事件(图5-A~E)。随后, 对这些复制框中的基因进行注释发现, 复制框中的基因除了包含11个sHSP成员(PF00011)外, 还主要包含15个蛋白激酶成员(PF00069)、8个线粒体载体蛋白(PF00153)以及6个植物生长素响应蛋白(PF02519) (图5-F)。其中复制框1主要包括6个线粒体载体蛋白、4个sHSP成员和4个蛋白激酶成员, 复制框2主要包括4个sHSP成员, 复制框3主要包括8个蛋白激酶成员和2个sHSP成员, 复制框4主要包括4个蛋白激酶成员、4个植物生长素响应蛋白和2个sHSP成员, 复制框5主要包括2个蛋白激酶成员、2个线粒体载体蛋白、2个sHSP成员和2个蛋白激酶成员。此外, 对这5个复制框的Ka值、Ks值和Ka/Ks比值进行计算发现, 这5个复制框的Ka值和Ka/Ks比值彼此相似, 但对于Ks值而言, 复制框1和复制框2的Ks值显著低于复制框4的Ks值, 其他复制框的Ks值类似(图5-G~I)。
A: 复制的成员分析, 与GksHSP家族有关的复制框使用不同的颜色在染色体上展示。B: 复制事件在不同亚家族的分布。C: 复制的同义替换率分布。
A: duplicated relationship ofmembers, the duplicated blocks were shown by the colors. B: the distribution of the duplication events in different subfamilies. C: the distribution of synonymous substation rate about duplicateds.
2.7 叉柱棉sHSP成员启动子区的顺式调控元件分析
本研究利用PlantCARE数据库对GksHSP成员启动子区的顺式调控元件进行分析发现, 所有的GksHSP成员除了包含真核生物共有的顺式调控元件(如TATA框和CAAT框)外, 还包括一些与胁迫响应相关的顺式调控元件(图6)。所有的GksHSP成员均包含至少一种与胁迫响应相关的顺式调控元件, 其中包含最多的与胁迫响应相关的顺式调控元件(13个), 其次为(11个)、(10个)、(10个)和(10个)。在GksHSP家族中, 最多的与胁迫响应相关的顺式调控元件为ABA响应元件(64个), 其次为茉莉酸甲酯响应元件(47个)、赤霉素响应元件(36个)、低温响应元件(27个)、水杨酸响应元件(24个)、MYB结合位点(22个)和生长素响应元件(21个), 最少的与胁迫响应相关的顺式调控元件为防御/胁迫响应元件(15个)。此外, 来自相同亚家族的GksHSP成员的启动子区通常包含类似的顺式调控元件。例如大部分CI亚家族的成员的启动子区包含ABA响应元件和茉莉酸甲酯响应元件, 大部分CII亚家族的成员的启动子区包含ABA响应元件, CP亚家族的成员的启动子区均包含低温响应元件。
A~E: 与GksHSP家族有关的复制框1 (A)、复制框2 (B)、复制框3 (C)、复制框4 (D)和复制框5 (E)的微共线分析。F: 与GksHSP家族有关的5个复制框的基因注释分布。G~I: 与GksHSP家族有关的5个复制框的Ka(G)、Ks(H)和Ka/Ks(I)分析。*表示在< 0.05水平上差异显著。
A–E: microsyntenic analysis of duplicated block 1 (A), duplicated block 2 (B), duplicated block 3 (C), duplicated block 4 (D), and duplicated block 5 (E). F: the distribution of gene annotation about the five duplicated blocks in the GkHSP family. G–I: Ka (G), Ks (H), and Ka/Ks (I) analysis of the five duplicated blocks in the GkHSP family. * represents significant difference at< 0.05.
2.8 陆地棉中GksHSP26的同源基因在高温、干旱和盐胁迫下的表达分析
本研究利用CottonFGD数据库对启动子中包含最多的与胁迫响应相关的顺式调控元件的在陆地棉中的同源基因进行识别发现, 在陆地棉中和是叉柱棉的同源基因(相似度均大于94%) (图7-A)。随后在高温、干旱和盐胁迫条件下对和的表达量进行分析发现, 在高温和盐胁迫下和的表达量均显著上调, 尤其是高温处理6 h和盐胁迫处理1 h其表达量达到最大值, 但对干旱胁迫响应并不明显(图7-B, C)。
GksHSP亚家族用不用的颜色和字母表示。每一个颜色的方框代表一种顺式调控元件。
The GksHSP subfamilies were denoted by using different colors and letters. Each colored box represents a-regulatory element.
3 讨论
本研究从叉柱棉中识别出39个GksHSP成员(表1), 低于许多双子叶植物中sHSP成员数量, 如番茄(43个)[11]、马铃薯(48个)[12]、棉花(94个)[13]以及小麦(109个)[24]等。叉柱棉中识别出较少的sHSP成员可能与该物种本身基因组(544 Mb)较小有关[19]。本研究识别的每一个GksHSP成员都具有sHSP家族保守的α-晶体结构域、分子量介于10.5039 kD到36.83181 kD之间、基因结构比较简单(大部分外显子数量少于2个)等特征(表1和图2), 这些特征也出现在其他植物的sHSP成员中[5-6]。GksHSP家族通过系统发育分析可以进一步分为10个亚家族(图1), 不同的亚家族含有不同数量的GksHSP成员, 其中CI亚家族和CII亚家族含有最多的GksHSP成员, CIII亚家族和MTII亚家族含有最少的GksHSP成员。在sHSP家族中, 相似的亚家族分布也出现在拟南芥[9]、水稻[10]、番茄[11]等植物中。在GksHSP家族中, 其保守基序、基因结构和启动子区的顺式调控元件等的分布也与系统发育分析中的分布相一致(图2和图6)。另外, GksHSP成员在KI_05染色体的上半部和下半部以及KI_07染色体的下半部中集中存在, 表明这些染色体区段可能是与GksHSP家族有关的热点区域(图3), 相似的现象也出现在玉米NAC家族[25]、棉花LTP家族[26]、木薯GRAS家族[27]等中。此外, 本研究在GksHSP家族中共发现7个基因复制事件, 而这些基因复制事件并非平均分布在整个亚家族中(表3和图4-B), 其中CII亚家族(4个)和CI亚家族(2个)包括大部分的基因复制事件。CI亚家族和CⅡ亚家族具有较多的基因复制事件, 这是导致这2个亚家族含有更多GksHSP成员的一个原因。类似的基因复制事件导致不同亚家族含有不同成员的现象也出现在叉柱棉的近缘物种棉花的NAC家族[28]、KUP家族[22]、PEL家族[29]等基因家族中。
A:与其在陆地棉中的同源基因和的氨基酸序列分析。B~C: 在高温、干旱和盐胁迫下(B)和(C)的表达分析。
A: alignment analysis ofand its corresponding orthologous genes in(and). B–C: heat map representation of(B) and(C) expression levels under heat, salt, and drought stresses.
在GksHSP家族中, 所有的复制事件均与片段复制事件有关, 并没有发生任何串联复制事件(表3、图3和图4-A), 这可能与叉柱棉中由转座子活性等导致基因组的片段化、基因丢失等现象有关[30-32]。本研究发现的7个片段复制事件均位于5个复制框中(图4-A和图5-A~E), 表明GksHSP家族的扩增主要与叉柱棉的全基因组复制事件有关[19]。通过Ks计算发现, 大部分的片段复制事件的Ks值集中位于0.731左右(表3和图4-C), 这个时间正好对应于棉属特有的全基因组复制事件所发生的时间[33]。因此, GksHSP成员的扩增主要发生在棉属特有的全基因组复制事件中。与此同时, 本研究对与GksHSP家族扩增有关的复制框区域进行详细的分析发现, 这5个复制框中含有较多的蛋白激酶成员、线粒体载体蛋白以及植物生长素响应蛋白(图5-F)。目前很多研究已发现蛋白激酶、线粒体载体蛋白以及植物生长素响应蛋白均与胁迫响应相关[34-36]。例如拟南芥的蛋白激酶CDPK27成员与植株的抗盐性有关[37], 南美杉的线粒体载体蛋白PUMP成员可以响应植株的冷害胁迫[38], 过表达小麦的生长素响应蛋白TaSAUR75可以提高拟南芥植株的干旱和盐渍抗性[39]。因此, 在叉柱棉中, GksHSP家族的进化可能与蛋白激酶家族、线粒体载体蛋白家族以及植物生长素响应蛋白家族有关。此外, 本研究发现, 复制框1和复制框2的Ks值显著低于复制框4的Ks值(图5-G~I), 并且不同的复制框中所包含的成员种类也是不一样的(图5-F), 表明在叉柱棉中与GksHSP家族有关的不同复制框的进化速率显著不同。
启动子区的顺式调控元件在生物学功能及其调控过程中具有非常关键的作用[40]。本研究发现, 在叉柱棉中GksHSP成员的启动子区包含大量的与胁迫响应相关顺式调控元件, 这表明GksHSP成员可能与植物的胁迫响应相关(图6)。在所有与胁迫响应相关的顺式调控元件中, 最多的顺式调控元件为ABA响应元件(64个), 其次为茉莉酸甲酯响应元件(47个), 表明大部分GksHSP成员可能与ABA和茉莉酸甲酯调控的胁迫响应相关, 目前已经在马铃薯[12]、小麦[12]、簸箕柳[15]等植物的sHSP成员的启动子区发现类似的顺式调控元件分布。此外, 在GksHSP家族中, 来自CⅠ亚家族的包含最多的与胁迫响应相关的顺式调控元件, 并且在陆地棉中识别了的同源基因和, 发现在高温和盐胁迫下这2个同源基因的表达量显著上调(图7), 其在拟南芥中的同源基因[41]和在水稻中的同源基因[42]也已经报道了可以响应多种胁迫。
4 结论
在叉柱棉中共鉴定了39个GksHSP成员, 并且可以将GksHSP成员根据系统发育关系进一步分为10个亚家族, 每个亚家族都具有保守的基序、类似的基因结构以及相似的启动子区的顺式调控元件分布。在叉柱棉中, 棉属特有的全基因组复制事件主要导致了GksHSP成员的扩增, 与此同时其扩增还与蛋白激酶家族、线粒体载体蛋白家族以及植物生长素响应蛋白家族有关。此外, GksHSP家族可能与ABA和茉莉酸甲酯调控的胁迫响应相关, 尤其是可以作为叉柱棉抗逆育种的一个重要候选基因。
[1] Eulgem T, Rushton P J, Robatzek S, Somssich I E. The WRKY superfamily of plant transcription factors.,2000, 5: 199–206.
[2] Schweighofer A, Hirt H, Meskiene I. Plant PP2C phosphatases: emerging functions in stress signaling., 2004, 9: 236–243.
[3] Pinheiro G L, Marques C S, Costa M D, Reis P A, Alves M S, Carvalho C M, Fietto L G, Fontes E P. Complete inventory of soybean NAC transcription factors: sequence conservation and expression analysis uncover their distinct roles in stress response., 2009, 444: 10–23.
[4] Jacob P, Hirt H, Bendahmane A. The heat-shock protein/ chaperone network and multiple stress resistance., 2017, 15: 405–414.
[5] 栗振义, 龙瑞才, 张铁军, 杨青川, 康俊梅. 植物热激蛋白研究进展. 生物技术通报, 2016, 32(2): 7–13
Li Z Y, Long R C, Zhang T J, Yang Q C, Kang J M. Research progress on plant heat shock protein., 2016, 32(2): 7–13 (in Chinese with English abstract).
[6] Waters E R, Vierling E. Plant small heat shock proteins-evolutionary and functional diversity., 2020, 227: 24–37.
[7] Bentley N J, Fitch I T, Tuite M F. The small heat-shock protein Hsp26 ofassembles into a high molecular weight aggregate., 2010, 8: 95–106.
[8] Elicker K S, Hutson L D. Genome-wide analysis and expression profiling of the small heat shock proteins in zebrafish., 2007, 403: 60–69.
[9] Scharf K, Siddique M, Vierling E. The expanding family ofsmall heat stress proteins and a new family of proteins containing α-crystallin domains (Acd proteins)., 2001, 6: 225–237.
[10] Sarkar N K, Kim Y, Grover A. Rice sHsp genes: genomic organization and expression profiling under stress and development., 2009, 10: 393.
[11] 张宁, 姜晶, 史洁玮. 番茄基因家族的全基因组鉴定、系统进化及表达分析. 沈阳农业大学学报, 2017, 48(2): 137–144.
Zhang N, Jiang J, Shi J W. Genome-wide identification, phyletic evolution and expression analysis of thegene family in tomato., 2017, 48(2): 137–144 (in Chinese with English abstract).
[12] Zhao P, Wang D, Wang R, Kong N, Zhang C, Yang C, Wu W, Ma H, Chen Q. Genome-wide analysis of the potatogene family: identification, genomic organization and expression profiles in response to heat stress., 2018, 19: 61.
[13] Ma W, Zhao T, Li J, Liu B, Fang L, Hu Y, Zhang T. Identification and characterization of thegene family in, 2016, 6: 1–13.
[14] 何福林, 张斌. 银杏() GbHsp20基因家族的鉴定及系统进化分析. 分子植物育种, 2019, 17: 7368–7376.
He F L, Zhang B. Identification and phylogenetic analysis of GbHsp20 gene family inL., 2019, 17: 7368–7376 (in Chinese with English abstract).
[15] Li J, Zhang J, Jia H, Yue Z, Lu M, Xin X, Hu J. Genome-wide characterization of thegene family in Sreveals its functions under different abiotic stresses., 2018, 19: 3246.
[16] Jung Y J, Nou I S, Kang K K. Overexpression ofgene encoding small heat shock protein enhances tolerance to abiotic stresses in rice., 2014, 2: 370–379.
[17] Li Z Y, Long R C, Zhang T J, Yang Q C, Kang J M. Molecular cloning and characterization of thegene fromL., 2016, 43: 815–826.
[18] Sun W, Bernard C, Cotte B V D, Montagu M V, Verbruggen N., encoding a small heat-shock protein in, can enhance osmotolerance upon overexpression., 2001, 27: 407–415.
[19] Udall J A, Long E, Ramaraj T, Conover J L, Yuan D, Grover C E, Gong L, Arick II M A, Masonbrink R E, Peterson D G, Wendel J F. The genome sequence ofillustrates a descending dysploidy in plants., 2019, 10: 1541.
[20] Elhady S.Isolation and Structural Elucidation of Natural Products fromOliver and(Mast.) Hutch J B. PhD Dissertation of Faculty of Agricultural and Applied Biological Sciences of Ghent University, Ghent, Belgium, 1999.
[21] Wendel J F, Cronn R C. Polyploidy and the evolutionary history of cotton., 2003, 78: 139–186.
[22] Fan K, Mao Z, Zheng J, Chen Y, Li Z, Lin W, Zhang Y, Huang J, Lin W. Molecular evolution and expansion of the KUP family in the allopolyploid cotton speciesand., 2020, 11: 1501.
[23] Chen C, Chen H, Zhang Y, Thomas H R, Frank M H, He Y, Xia R. TBtools: an integrative toolkit developed for interactive analyses of big biological data., 2020, 8: 1194–1202.
[24] Muthusamy S K, Dalal M, Chinnusamy V, Bansal K C. Genome-wide identification and analysis of biotic and abiotic stress regulation of small heat shock protein () family genes in bread wheat., 2017, 211: 100.
[25] Fan K, Wang M, Miao Y, Ni M, Bibi N, Yuan S, Li F, Wang X. Molecular evolution and expansion analysis of the NAC transcription factor in., 2014, 9: e111837.
[26] Li F, Fan K, Ma F, Yue E, Bibi N, Wang M, Shen H, Hasan M M, Wang X. Genomic identification and comparative expansion analysis of thegene family in., 2016, 6: 38948.
[27] Shan Z, Luo X, Wu M, Wei L, Zhu Y. Genome-wide identification and expression of GRAS gene family members in cassava., 2020, 20: 46.
[28] Fan K, Li F, Chen J, Li Z, Lin W, Cai S, Liu J, Lin W. Asymmetric evolution and expansion of the NAC transcription factor in polyploidized cotton., 2018, 9: 47.
[29] Sun H R, Hao P B, Ma Q, Zhang M, Qin Y, Wei H J, Su J J, Wang H T, Gu L J, Wang N H, Liu G Y, Yu S X. Genome-wide identification and expression analyses of the pectate lyase () gene family in cotton (L.)., 2018, 19: 661.
[30] Wang Y, Wang X, Tang H, Tan X, Ficklin S P, Feltus F A, Paterson A H. Modes of gene duplication contribute differently to genetic novelty and redundancy, but show parallels across divergent angiosperms., 2011, 6: e28150.
[31] Soltis D E, Visger C J, Marchant D B, Soltis P S. Polyploidy: pitfalls and paths to a paradigm., 2016, 103: 1146–1166.
[32] Albalat R, Cañestro C. Evolution by gene loss., 2016, 17: 379.
[33] Wang K, Wang Z, Li F, Ye W, Wang J, Song G, Yue Z, Cong L, Shang H, Zhu S, Zou C S, Li Q, Yuan Y L, Lu C R. The draft genome of a diploid cotton., 2012, 44: 1098–1103.
[34] Ray S, Agarwal P, Arora R, Kapoor S, Akhilesh K T. Expression analysis of calcium-dependent protein kinase gene family during reproductive development and abiotic stress conditions in rice (L. ssp.)., 2007, 278: 493–505.
[35] Haferkamp I, Schmitz-Esser S. The plant mitochondrial carrier family: functional and evolutionary aspects., 2012, 3: 2.
[36] 朱宇斌, 孔莹莹, 王君晖. 植物生长素响应基因的研究进展. 生命科学, 2014, 26: 407–413.
Zhu Y B, Kong Y Y, Wang J H. Research advances in auxin-responsivegenes., 2014, 26: 407–413 (in Chinese with English abstract).
[37] Zhao R, Sun H, Zhao N, Jing X, Shen X, Chen S. TheCa2+-dependent protein kinase CPK27 is required for plant response to salt-stress., 2015, 563: 203–214.
[38] Valente C, Pasqualim P, Jacomasso T, Maurer J B B, Souza E M D, Martinez G R, Rocha M E M, Carnieri E G S, Cadena S M S C. The involvement of PUMP from mitochondria ofembryogenic cells in response to cold stress., 2012, 197: 84–91.
[39] Guo Y, Jiang Q, Hu Z, Sun X, Zhang H. Function of the auxin-responsive geneunder salt and drought stress., 2018, 2: 181–190.
[40] 郭晋艳, 郑晓瑜, 邹翠霞, 李秋莉. 植物非生物胁迫诱导启动子顺式元件及转录因子研究进展. 生物技术通报, 2011, (4): 16–20.
Guo J Y, Zheng X Y, Zou C X, Li Q L. Research progress of-elements of abiotic stress inducible promoters and associated transcription factors., 2011, (4): 16–20 (in Chinese with English abstract).
[41] Sewelam N, Kazan K, Meike H, Maurino V G, Schenk P M. Thegene expression is mediated by diverse signals that link biotic and abiotic stress factors with ROS and can be a useful molecular marker for oxidative stress., 2019, 20: 3201.
[42] Zou J, Liu C, Liu A, Zou D, Chen X. Overexpression ofandenhances drought and salt tolerance in rice., 2012, 169: 628–635.
Identification and analysis ofgene family in
FAN Kai, PAN Xin-Feng, MAO Zhi-Jun, YE Fang-Ting, LI Zhao-Wei, LIN Wei-Wei, and LIN Wen-Xiong*
Key Laboratory of Ministry of Education for Genetics, Breeding and Multiple Utilization of Crops, College of Agriculture, Fujian Agriculture and Forestry University, Fuzhou 350002, Fuzhou, China
Small heat shock protein (sHSP) has the lowest molecular weight in heat shock protein and sHSP has the highly conserved α-crystallin domain. The sHSP family is very important in response to various stresses, but the identification and analysis of sHSP gene family inhave not been reported. In this study, we identified 39 GksHSPs with 10 subfamilies in. There were seven gene duplication events in GksHSP family and all of duplicated gene pairs were involved in segmental duplication events. The cotton-specific whole genome duplication event primarily resulted in the GksHSP expansion. The GksHSP expansion was also related to the protein kinase, mitochondrial carrier protein, and auxin responsive protein. Besides, GksHSP members might respond to various stresses by ABA/MeJA-mediated pathways, and GksHSP26 and its corresponding orthologous genes inwere very important in stress responses. These results could provide the theoretical basis of the breeding of stress tolerance inand cotton.
; sHSP; identification; expansion; function
10.3724/SP.J.1006.2021.04235
本研究由国家自然科学基金项目(31701470), 中国博士后科学基金项目(2017M610388, 2018T110637), 福建农林大学科技创新专项基金(CXZX2020007A)和福建农林大学杰出青年科研人才计划项目(xjq201917)资助。
This study was supported by the National Natural Science Foundation of China (31701470), the China Postdoctoral Science Foundation (2017M610388, 2018T110637), the Science and Technology Innovation Special Fund of Fujian Agriculture and Forestry University (CXZX2020007A), and the Outstanding Youth Scientific Fund of Fujian Agriculture and Forestry University (xjq201917).
林文雄, E-mail: lwx@fafu.edu.cn
E-mail: fankai@fafu.edu.cn
2020-10-29;
2021-03-19;
2021-03-31.
URL: https://kns.cnki.net/kcms/detail/11.1809.S.20210331.1316.004.html