APP下载

定位于鸡选择性清扫区域的SH3RF2基因生物信息学分析

2012-10-10耿立英王秀秀王秋悦潘素敏朱文进张传生尹春光

河北科技师范学院学报 2012年4期
关键词:信息学残基空间结构

耿立英,王秀秀,王秋悦,潘素敏,朱文进,张传生,尹春光

(1河北科技师范学院,河北秦皇岛,066600;2济宁学院)

畜禽品种的形成受到自然选择和人工选择共同作用,而种群在短期内受到特异高强度正选择作用,导致其基因组发生选择性清扫现象,使某些优势基因可在种群中相对较快地扩散,进而引起种群分化,形成生产性能和生产方向不同的品种或品系。因此,鉴定分析不同品种间特异的选择性清除基因、标记[1,2],可为揭示不同品种的表型差异的分子机理提供线索。

近期,Carl-Johan Rubin等[3]采用重测序技术在鸡基因组中发现了多个选择性清除(selective sweep)区域,其中就包括SH3RF2基因(SH3 domain containing ring finger 2)的插入/缺失位点。研究证实,SH3RF2基因在鸡的大脑和肌肉中表达,其插入/缺失突变是与体重相关的原因突变,固定于肉鸡的高长系中(HW),而在低长系中(LW)和商品肉鸡中(Broiler)以较低的频率存在;还发现,该缺失与肉鸡的生长与体重存在的密切的正相关。赵妤娟等[4]对SH3RF2基因的插入/缺失突变在15个中国地方鸡种的频率分布进行了研究,结果所检测地方鸡种均是非缺失的纯合子,没有发现缺失等位基因。除此之外,对SH3RF2基因其他信息尚缺乏深入了解。

鸡是一种重要的经济动物和模式生物,目前其全基因组测序工作的已经完成。在鸡后基因组时代,利用生物信息技术对其功能进行解读和研究已经引起国内外学者的重视,也已经取得诸多重要的研究成果[5,6]。这对鸡的SH3RF2生物信息分析提供了值得借鉴的方法和思路。因此,笔者主要运用生物信息学数据库和软件对鸡SH3RF2基因的进化关系[7]、调控元件以及蛋白质结构等进行生物信息学的分析,以期为下一步研究该基因功能及其插入/缺失影响肉鸡生长和体质量的分子机制奠定基础。

1 材料与方法

1.1 不同物种间SH3RF2系统进化树的构建

从NCBI数据库(http://www.ncbi.nlm.nih.gov/)中检索已发表的所有动物SH3RF2基因的蛋白质序列及cDNA序列,将获得的不同动物SH3RF2蛋白质序列以FASTA格式保存为文本文件,所获得的蛋白质及cDNA序列用于下一步分析。利用程序DNAMAN6.0.3.48和MEGA4对不同动物SH3RF2的蛋白质序列进行比对,并通过邻近归并法(Neighbor-Joining)构建种间系统发生树。

1.2 鸡SH3RF2基因MicroRNA靶标及启动子序列的预测

网站和工具软件:由美国国家生物技术信息中心(NCBI,http://www.ncbi.nlm.nih.gov/)下载鸡SH3RF2基因的mRNA数据信息;利用NCBI/Blast软件进行序列分析、同源性比对确定鸡SH3RF2基因的3'UTR区序列;利用miRanda(1.0)软件,装载鸡microRNA序列数据库与CDS区序列和3'UTR区序列,在默认参数条件下,预测microRNA靶标,进而选出与“种子”序列严格碱基互补配对的位点作为候选microRNA靶标。

将鸡 SH3RF2基因上游2 000 bp序列提交网站,http://www.fruitfly.org/seq_tools/promoter.html,http://www-bimas.cit.nih.gov/cgi-bin/molbio/proscan预测启动子序列,预测鸡 SH3RF2 基因的启动子序列[8]。

1.3 鸡SH3RF2基因表达蛋白的生物信息学相关预测

利用Protparam工具(http://www.expasy.org/tools/protparam.html)预测蛋白的基本理化性质。利用ProtScale(http://expasy.org/tools/protscale.html)进行疏水性预测。

将鸡SH3RF2的蛋白质序列提交到伦敦大学学院计算机科学系生物信息学部PSIPRED网站(http://bioinf.cs.ucl.ac.uk/psipred/)进行蛋白质二级结构预测。

利用基于同源建模的分析工具 SWISS-MODEL(http://www.expasy.ch/swissmod/SWISS-MODEL.html)进行空间结构预测。

2 结果与分析

2.1 不同物种SH3RF2同源性比较及进化分析

本次研究共获得9种动物SH3RF2基因的编码蛋白质序列及cDNA序列,其物种、序列号等信息见表1。

表1 9种动物SH3RF2基因和cDNA序列

根据获得9种动物SH3RF2基因的编码蛋白质序列构建无根(Un-rooted)系统发生树(图1)。可见:(1)9个动物种可以明显的分为A,B两大类。A大类包括人、黑猩猩、猕猴、牛、犬、小鼠、褐家鼠等哺乳动物,B大类只包括鸡和珍珠鸟2个动物种;(2)A大类的哺乳动物间关系紧密,其中人、黑猩猩和猕猴,牛和犬,小鼠和褐家鼠等哺乳动物亲缘关系均非常接近。B大类的鸡和珍珠鸟属于鸟类,它们与其它哺乳动物亲缘关系较远。

2.2 鸡SH3RF2基因MicroRNA靶标及启动子序列的预测分析

本次研究预测到的鸡在SH3RF2基因的CDS区发现48个候选MicroRNA靶标,在3'UTR区发现10个候选MicroRNA靶标(表2)。上述microRNA的“Seed”序列与CDS区和3'UTR区靶序列均严格的碱基互补配对。

2.3 鸡SH3RF2基因的启动子序列的预测分析

本次研究利用在线工具预测鸡SH3RF2基因上游2 000 bp序列可能的启动子,共发现2个,分别在120~170和1 724~1 774。

2.4 鸡SH3RF2基因表达蛋白的生物信息学分析

本次研究预测到该蛋白质的分子量为69 248.4,分子式为C3041H4939N9150O893S20,理论等电点为10.15,含有20种基本氨基酸,其中含量最高的是Leu(占组成该蛋白的氨基酸总数的12.4%),Ser(占氨基酸总数的11.6%)和Pro(占氨基酸总数的11.3%),含量最低的是Trp(占氨基酸总数的0.6%)和Met(占氨基酸总数的0.9%);含有带负电荷的残基(Asp,Glu)44个,带正电荷残基(Arg,Lys)80个,其水溶液在280 nm处的消光系数约37 775。该蛋白的不稳定系数(instability index,II)为62.99,不稳定。脂肪系数(Aliphatic index)为83.68。

用ProtScale程序预测鸡SH3RF2蛋白质疏水性分析最大值为2.722,最小值为-3.167,其疏水性平均值(Grand average of hydropathicity,GRAVY)为 -0.343。

图1 9个动物种SH3RF2蛋白的无根系统分化树

表2 SH3RF2基因的CDS区域和3'UTR microRNA预测及其位置

2.5 空间结构预测分析

利用基于同源建模的分析工具SWISS-MODEL对鸡SH3RF2蛋白进行空间结构预测的结果表明,只有部分残基序列空间结构可以在数据库中找到匹配的模板,预测到的空间结构如图2所示。其中第6~56位氨基酸残基与数据库中已有模板匹配度为35.185%;第126~180位氨基酸残基匹配度为78.182%;第188~249位氨基酸残基匹配度为43.548%;第124~242位氨基酸残基匹配度为24.675%;第405~461位氨基酸残基匹配度为7.018%。

图2 氨基酸残基序列的空间结构

3 讨论与结论

首先,通过对9种不同物种SH3RF2蛋白同源性比较及进化分析,构建了无根系统发生树。9个动物种中A大类的哺乳动物间关系紧密,其中人、黑猩猩和猕猴,牛和犬,小鼠和褐家鼠等哺乳动物亲缘关系均非常接近。B大类的鸡和珍珠鸟属于鸟类,它们与其它哺乳动物亲缘关系较远。这可能是因为鸡SH3RF2基因插入/缺失位点与肉鸡生长和体重密切相关,可以作为分子育种标记应用于中国肉鸡的遗传改良中,而在其它哺乳动物中未见相关报导,所以推测可能在鸡的驯化过程中受到了较多的人为选择作用而导致与其它哺乳动物关系较远。

其次,通过网站和miRanda(1.0)等软件对SH3RF2基因CDS区和3'UTR区域顺式调控元件MicroRNA靶标进行了预测分析,分别预测到48个和10个候选靶标。MicroRNA是一种内源性的非编码单链小分子RNA,可通过与mRNA3'非编码区的结合,抑制蛋白合成,在翻译水平调节基因的表达。这些蛋白表达水平的变化可引起生物的表型变异。上述调控机制对于禽类3'UTR区域SNP的功能研究具有重要意义[9]。目前已鉴定的鸡microRNA近150种,这些miRNA的功能主要是调节与鸡胚生长、发育等过程有关的基因的表达。研究人员推测,鸡中三分之一的基因都受到miRNA的调控[10~13]。Lancman等[14]证实,lin-4,let-7等可调控lin-41的表达在鸡胚肢芽的发育中发挥作用。目前,所预测到这些MicroRNA是否可以调控SH3RF2表达,还需进一步研究。

另外,利用启动子预测的分析网站对鸡SH3RF2基因上游2 000 bp序列进行了启动子序列预测。分别在120~170 bp 1 466~1 716 bp处发现启动子序列。两种方法所得的序列位置不同,这可能是由于数据库还不是很完善,但是通过网上搜索和查阅文献没有能够找到一个更好、更权威的预测方法,这可能需要通过实验等其它方法进行进一步研究,来最终确定该基因的启动子序列。

最后,为了更好、更全面的了解这个基因,笔者又进一步利用生物信息学相关数据库对其蛋白理化性质和一级结构进行了分析,模拟了其二级结构和空间结构。由得到的空间结构图更加验证了本次研究预测的二级结构的正确性,但是如果需要了解其精确的空间结构可以进一步通过X射线衍射实验或进行核磁共振等方法来确定。

[1]赵献芝.分子标记在肉鸡育种中的应用[C]//中国畜牧业协会禽业分会、国家肉鸡产业技术体系.全球肉鸡产业论坛暨第二届中国白羽肉鸡产业发展大会会刊,北京:2010:209-212.

[2]孔登,巴彩凤,苏玉虹.分子标记在鸡遗传基础研究中的应用[J].中国农学通报,2006,22(1):12-15.

[3]CARL-JOHAN Rubin,MICHAEL C Zody,JONAS Eriksson.Whole-genome resequencing reveals loci under selection during chicken domestication[J].Nature,2010,464:587-591.

[4]赵妤娟,张代喜,曲鲁江.鸡SH3RF2基因插入/缺失等位基因在中国地方鸡种中频率分布研究[C]//中国畜牧兽医学会家禽学分会.第十五次全国家禽学术讨论会论文集,广州:2011:50-54.

[5]张成岗,贺福初.生物信息学在新基因全长cDNA序列分析及功能预测中的应用[J].生物化学与生物物理进展,2003,30(1):159-163.

[6]LANCMAN J J,CARUCCIO N C,HARFE B D,et al.Analysis of the regulation of lin-41 during chick and mouse limb devel-opment[J].Dev Dyn,2005,234(4):948-960.

[7]聂庆华,刘清神,方梅霞.犬MC1R基因的分子进化分析[J].遗传HEREDITAS(Beijing),2008,30(4):469-474.

[8]SAUNDERS M A,LIANG H,LI W H.Human polymorphism at microRNAs and microRNA target sites[J].Proc Natl Acad Sci USA,2007,104(9):3 300-3 305.

[9]GRIFFITHS-JONES S,SAINI H K,VAN DONGEN S,et al.miRBase:tools for microRNA genomics[J].Nucleic Acids Res,2008,36(Database issue):D154-D158.

[10]DARNELL D K,KAUR S,STANISLAW S,et al.MicroRNA expression during chick embryo development[J].Dev Dyn,2006,235(11):3 156-3 165.

[11]SWEETMAN D,RATHJEN T,JEFFERSON M,et al.FGF-4 signaling is involved in mir-206 expression in developing somites of chicken embryos[J].Dev Dyn,2006,235(8):2 185-2 191.

[12]耿立英,张传生,杜立新.鸡6个功能基因microRNA靶标区域SNP的生物信息学预测[J].遗传HEREDITAS(Beijing),2008,30(8):1 026-1 032.

[13]张传生,耿立英,杜立新.鸡cENS-2基因U3-R序列的克隆分析与表达载体的构建[J].畜牧兽医学报,2005,36(10):987-990.

[14]KUMAR S,TAMURA K,NEI M.MEGA3:Integrated software for molecular evolutionary genetics analysis and sequence alignment[J].Brief Bioinform,2004,5(2):150-163.

猜你喜欢

信息学残基空间结构
基于各向异性网络模型研究δ阿片受体的动力学与关键残基*
鸡NRF1基因启动子区生物信息学分析
“残基片段和排列组合法”在书写限制条件的同分异构体中的应用
格绒追美小说叙事的空间结构
初论博物馆信息学的形成
徐州安美固建筑空间结构有限公司
基于社会空间结构流变的统战工作组织策略研究
蛋白质二级结构序列与残基种类间关联的分析
基于支持向量机的蛋白质相互作用界面热点残基预测
miRNA-148a在膀胱癌组织中的表达及生物信息学分析