针叶树基因组资源及其在遗传育种中的作用
2012-01-21许晨璐张守攻孙晓梅
许晨璐,张守攻,孙晓梅
(中国林业科学研究院 林业研究所 林木遗传育种国家重点实验室,北京 100091)
林木遗传育种是在研究林木遗传变异的基础上开展的遵循其遗传变异规律来改良林木的遗传组成,进而培育林木新品种的一项活动。随着全球木材供需矛盾和能源、生态压力的增加,加速林木育种进程,提高林木生产力是当前面临的重要的世界性研究课题。与农作物育种不同,林木遗传育种不仅起步较晚,而且有其自身的特点。首先,林木育种周期长,如美国南部的松树育种,尽管历时近百年时间,现在也才进行到第3轮选育和子代测定,而同样的进展在许多农作物中可能1 a内就能完成;其次,林木育种需营建大型子代测定林,而营建以及后期的管护费用都很高;再次,林木许多重要经济性状仅在轮伐期才能得以完全有效地评定。这些特点决定林木遗传育种不能仅靠常规育种的表型选择策略,更需借助现代育种新技术来辅助常规育种,加速育种进程。基因组资源(genomic resources)包括全基因组序列、转录组序列[表达序列标签(EST)、全长-cDNA(FL-cDNA)和单一基因(UniGene等)]和DNA分子标记等。EST,FL-cDNA和UniGene来自表达基因,是基因序列的一部分,避免了内含子和基因间区域对数据分析的干扰[1],对应于功能已知或未知基因,所含基因功能信息丰富[2]。DNA分子标记是DNA水平上遗传变异的直接反映,与其他遗传标记相比,具有多态性高、数量丰富和重复性好等许多优点[3]。由EST数据库和DNA分子标记等可构建遗传连锁图谱、数量性状位点(QTL)图谱和物理图谱等新的基因组资源,大量的基因组资源使得结构基因组学、功能基因组学、比较基因组学、群体基因组学和进化基因组学发展迅速,对基因多态性、遗传定位、表达、调控和功能的研究也更加深入全面,这些资源及其各种基因组学研究成果已转化成新的研究工具运用到林木遗传育种领域。本文主要针对针叶树基因组资源研究进展及其在林木遗传育种中的应用作简要综述。
1 针叶树基因组资源研究进展
1.1 针叶树基因组资源开发滞后于作物和阔叶树种
针叶树是高等植物进化过程中一支古老而多变的分支,也是裸子植物中最大和最重要的一支,共包含6个科601个树种[4],虽然树种数量不多,但陆地生态系统的重要树种大部分出自于此。针叶树和被子植物至少在3亿年前就已经分离[5],并由此逐渐进化出不同的形态特征和生活周期。过去20 a中,林木基因组学,特别是针叶树基因组学研究滞后于模式植物和作物。相对于其他植物基因组学研究,如拟南芥 Arabidopsis thaliana,水稻 Oryza sativa,玉米 Zea mays,小麦 Triticum aestivum和番茄 Solanum lycopersicum,数百甚至数千名研究人员研究某一单一物种而言,全世界参与林木基因组学研究不超过1000人,并只针对数十个树种。虽然林木至少有10万个树种,但基因组学研究被限制在少数温带和高度驯化的树种,这些树种主要来自4个科:裸子植物的松科Pinaceae和被子植物的杨柳科Salicaceae,桃金娘科Myrtaceae,壳斗科Fagaceae和其下的7个属,即松属Pinus,云杉属Picea,黄杉属Pseudotsuga, 杨属 Populus, 桉属 Eucalyptus, 栎属 Quercus 和栗属 Castanea[6]。
毛果杨Populus trichocarpa以其相对较小的基因组(约为拟南芥的4倍)和作为生物燃料原料的潜力,首次被美国能源部联合基因组研究所(JGI)选中用于全基因组测序[7],杨树全基因组序列的获得[8]使得杨树高通量基因组学技术得到广泛应用并促进了比较和进化基因组学研究[9],由此进一步巩固了杨树作为树木生物学模式植物的地位[10];鉴于桉树在林木中的重要地位,美国能源部也开展了巨桉Eucalyptus grandis的全基因组测序工作,并于2010年公布了其8倍覆盖度的基因组草图[11];美洲栗Castanea dentata的全基因组测序计划也已经展开[12]。相比阔叶树种和经济林,针叶树由于基因组巨大(10000~40000 Mb,相对于杨树的485 Mb)[13],等位基因间变异丰富,世代周期更长,遗传转化体系缺乏,正向遗传学(如突变技术)和反向遗传学(如基因敲除或过表达技术)等研究手段有限,加之研究经费相对不足,其基因组学研究远远落后于已处于后基因组时代的阔叶树种。
1.2 针叶树基因组资源研究发展迅速
尽管全基因组测序落后于阔叶树种,但木本植物中首例公开的高通量EST测序项目却是在针叶树中开展的。早在1998年,北卡州立大学的研究人员就获得了超过70000条与火炬松 Pinus taeda木材形成相关的 EST 序列[14]。 此后, 主要针叶树种如火炬松[15-17],海岸松 Pinus pinaster[18], 辐射松 Pinus radiata[19], 白云杉 Picea glauca[20],北美云杉 Picea sitchensis[21]和日本柳杉 Cryptomeria japonica[22]等相继开展了大规模EST测序项目。
近年来,在遗传改良项目和林木在生态系统中作用越发受到关注的驱动下[23],林业发达国家启动了更大规模的针叶树基因组学相关研究项目,如美国国家科学基金会植物基因组研究计划(PGRP)资助的“Accelerating Pine Genomics”项目[24],美国加州大学戴维斯分校尼尔实验室(Neale Lab)联合多家科研机构开展的“Pine Reference Sequences”[25], “Allele Discovery of Economic Pine Traits”[26]和“Conifer Comparative Genetics”等项目[27], 加拿大拉瓦尔大学开展的 Arborea 项目[28]和哥伦比亚大学开展的“Treenomix”项目[29],澳大利亚和新西兰联合开展的“Monterey Pine Genome”项目等。在此背景下,某些针叶树种全基因组测序计划已经启动, 如火炬松[30], 花旗松 Pseudotsuga menziesii[31],欧洲云杉 Picea abies[32]和北美乔松Pinus strobus[33]等,其中火炬松被认为是针叶树全基因组测序的模式树种,研究也最为深入。与毛果杨全基因组测序一样,针叶树种的全基因组测序仍然主要采用全基因组鸟枪法和传统的Sanger测序,但研究期间不断有新的思路提出,如Krutovsky等[34]提出了用单倍体组织(雌配子体)测序的策略来减少杂合性,以减少巨大的基因组和丰富的等位基因间变异对于序列拼接和组装的干扰;新一代测序技术(next generation sequencing,简称 NGS)也被引进到测序项目中[35]。
截至目前,包含针叶树基因组资源的公共数据库有美国国立生物技术信息中心(NCBI)创立的Gen-Bank[36], 欧洲生物信息研究所(EBI)创立的 EMBL Nucleotide Sequence Database[37], 日本信息技术中心(CIB)创立的 DDBJ[38], DFCI(Dana Farber Cancer Institute, 目前已取代由 Craig Venter创建的 TIGR)的The Gene Index database(TGI)[39], 美国国家科学基金会资助的 PlantGDB[40], NCBI 的 Gene Expression Omnibus[41]和 UniGene[42], 其中 NCBI的 UniGene 只包含 3 个松柏纲 Coniferopsida 树种, 分别是白云杉、北美云杉和火炬松。
除公共数据库外,专门收录针叶树基因组资源数据库有Gymnosperm Database[4],迈阿密大学牛津分校创办的 Conifer GDB(含 ConiferEST)[43-44], 加州大学戴维斯分校 Neale Lab 创办的 TreeGenes[45]等, 其中TreeGenes数据库是包含有各种类型数据的面向对象的数据库,允许复杂的检索和查询操作。分树种所建的数据库有EuroPineDB[46](包含海岸松、欧洲赤松Pinus sylvestris和意大利松Pinus pinea等3个树种,但主要针对海岸松)和 SpruceDB[47](主要包含白云杉)等。
随着基因序列不断获得,针叶树DNA分子标记的发展亦非常迅速。早期的遗传标记为限制性片段长度多态性(RFLP),第2代标记为随机扩增多态性DNA标记(RAPD)技术和扩增片段长度多态性(AFLP)标记,但作为显性标记,它们的应用具有一定的局限性。简单序列重复(SSR)标记是分散在全基因组上的成簇的短串联重复核苷酸,但由于传统的SSR标记开发包括构建富集SSR的文库、克隆和测序等步骤,开发成本较高。被称为第3代遗传标记的单核苷酸多态性(SNP)位点丰富,遗传稳定性高,已成为医学研究中的重要工具,虽然在针叶树中的应用起步较晚[48],但发展非常迅速。目前,收录针叶树分子标记的数据库有PlantMarkers[49],美国加州大学戴维斯分校Neale Lab创建的PineSAP[50]和加拿大拉瓦尔大学创建的TreeSNPs[51]。它们分别是针对松属和云杉属开发的SNP标记为主的数据库;法国农科院林木遗传育种实验室创建了包含来自海岸松和欧洲云杉的SSR和SNP标记的数据库[52-53],EuroPineDB也含有海岸松的SSR和SNP标记的信息[46]。
2 针叶树基因组资源在遗传育种中的应用
基因组学是遗传学的重要分支,作物育种学家提出了“基因组学辅助育种”(genomics-assisted breeding)的策略来强调基因组资源对育种的重要作用[54],其核心内容是用各种基因组学工具和策略实现由基因型预测表型的目的[55],这一策略使基因组资源在提高作物育种效率和精度方面发挥了重要作用[56-57]。历史上,数量遗传学被认为是指导林木育种的唯一有效工具,基因组资源并不受重视。然而传统的数量遗传学方法用于指导林木育种的实践并不是完美无缺的[58],伴随着林木基因组学的不断发展,日益丰富的林木基因组资源也改变着林木遗传育种的思路、策略和实践。
2.1 分子标记在遗传育种中的应用
由于林木世代周期长,幼-成期变化大,有些性状(如抗病、产量以及与环境存在很强互作的性状)很难从表型入手进行选择,亦或选择成本很高,寻求有效的早期(或间接)选择方法一直是林木遗传育种学家努力的目标。以遗传标记信息为基础的间接选择(首先建立分子标记与性状的关联,通过选择分子标记达到筛选具有优良表型性状基因型的目的),即分子标记辅助选择(marker-assisted selection,简称MAS)在缩短育种周期,降低育种成本,提高选择强度和效率中开始逐渐发挥重要作用。
由于林木中由单基因控制的重要性状不多,林木遗传学家和育种学家更关注数量性状,因此,在“基因组学辅助育种”应用之前,需要把数量性状剖分到各个单个基因组分,进而弄清单个基因对复杂性状的作用,像研究质量性状一样对控制数量性状的多个基因分别进行研究。林木分子性状解析开始于20世纪90年代,普遍采用的方法是在构建高密度遗传连锁图谱的基础上进行数量性状位点定位(QTL mapping),这一方法可以确定控制数量性状的基因数目、在染色体上的位置、各位点作用贡献的大小以及基因间相互关系。eQTL(expression QTL)将分离群体中每个基因的表达量作为数量性状[59],是研究复杂性状分子机制和调控网络的新手段,QTL定位和eQTL定位都可以获得与性状关联的候选基因信息,借助与QTLs紧密连锁的分子标记,就能够在育种群体中对有关QTLs的遗传行为进行动态跟踪,从而加强育种工作者对数量性状的遗传操作能力,提高育种中对数量性状优良基因型选择的准确性和预见性。 目前, 针叶树 QTL 定位研究已在火炬松[60]、 海岸松[61]、 辐射松[62]、 欧洲赤松[63]、 白云杉[64]和花旗松[65]等树种中开展,研究的性状集中在生长、材性和抗逆等方面。
以往林木遗传育种工作者很少留意建立并保存高世代的育种群体,缺少合适的群体成为林木图谱构建进而开展QTL定位研究的最大障碍。而且林木基因组巨大,连锁不平衡(linkage disequilibrium)水平较低,数量性状的表达在不同环境下会出现波动,而普遍采用的分离群体不大(大约100个),导致QTL区间太大,以至于可能包含数以千计的基因,QTL作用贡献普遍被高估;加之只能进行家系内选择,不能进行家系间选择,这一方法很难直接应用到林木育种实践中[66-67]。此外,QTL作图面临的一个致命缺陷是缺少验证,因此很难知道已经报道的QTLs假阳性有多少。进行QTL验证的方法之一是在不同群体中进行比较作图,随着基因组全测序及高密度遗传图谱的构建,这种方法将变得越来越重要。如要弄清单个基因对复杂性状的作用,还需要对QTL进行图位克隆和互补测验(complementation test),QTL的图位克隆也将因高密度的遗传连锁图谱及宏基因组平台的建立而变得容易。
关联分析(association analysis)能揭示天然群体中表型变化的分子基础,是有效的林木分子育种策略[66]。在关联分析研究中,分子标记被认为与复杂的数量性状之间有很强的连锁,通过检测群体内连锁位点间等位基因的非随机关联来解析复杂性状,阐明与表型性状有关的候选基因及其等位基因,挖掘出优异的等位基因。关联分析利用的是自然群体,不需要构建特殊的作图群体,避免了QTL定位对作图群体要求的限制。由于针叶树基本上处于半野生状态,大多数树种具有理想的自然群体材料,核酸多样性水平丰富(基因编码区域的SNP频率大概是在1/50的数量级水平),连锁不平衡下降快速(R2经常在1~2 kb的区间内就下降到≤0.20[66])。这意味着一旦经关联分析发现并证实了标记/性状之间的连锁,很可能标记与功能变异体(functional variant)的物理距离非常近,甚至可能其本身就是功能变异体,这就为目的基因的精细定位提供了可能;结合SNP检测技术,科学家甚至可以直接将效应位点与单个核苷酸突变关联起来,进行数量性状寡核苷酸(quantitative trait nucleotide,简称QTN)作图,因此,此方法也被称作基因辅助选择(gene-assisted selection)[68]。
与QTL定位这种正向基因组学方法(forward genomics approaches)不同,关联分析属于反向基因组学方法(reverse genomics approaches),它的成功应用需要大量的基因组信息来对同一群体内的多个个体进行基因分型(genotyping)实验。开展关联研究有2种策略[69-70]:在无法获得高密度分子标记的阶段,只能采用基于候选基因的关联分析(gandidate-gene association)策略。所谓候选基因为与某种性状相关联的基因,它包括位置关联型和功能关联型2种类型。目前,此策略已在火炬松[71]、白云杉[72]和花旗松[73]等针叶树种中开展。然而这是一种只对候选基因进行SNP基因分型的单个标记/性状之间的关联分析,只能解释部分遗传变异(很少超过10%);比其更有效的是全基因组关联研究(genome-wide association studies,简称GWAS),但由于针叶树中连锁不平衡下降快速,需开发高密度的(如至少100万)SNP用于基因分型才能开展GWAS,这显然限制了在针叶树中开展[6]。虽然关联分析研究弥补了QTL定位中的许多固有缺陷,但是目前的关联研究也存在着种种不足,如只开发了基因的编码区域,忽视了调控区域;只能分析中高频率的等位基因,稀有等位基因在现有的群体规模(一般几百个个体)和统计方法中无法分析,而稀有等位基因被认为是重要的育种资源。
2.2 转录本在遗传育种中的应用
作物育种学家把“分子标记辅助育种”的概念外延到“基因组学辅助育种”,实际上是在强调基因组学对作物育种的巨大潜力和越来越重要的作用。转录本(包括EST,FL-cDNA和UniGene)除了作为一种分子标记类型外,其本身及其功能注释作为计算基因组学(computational genomics)的产物,对育种来说就是一笔宝贵的资源。现在已经获得了一些模式植物的全基因组序列,而且一些基因的功能已被注释,如拟南芥、水稻和杨树等,通过与模式植物基因组的同源性比较,可以获得未知基因的功能并可查找到其基因序列。研究发现,林木特别是针叶树,种间基因的同线性和共线性很强,基因组保守性较高,遗传信息可以在亲缘关系比较近的树种间转移,这使同源比对的可行性大幅增加。而在蛋白质数据库中的同源搜索(如BlastX))则有望获得功能关联型的候选基因。除了能为关联分析研究提供候选基因外,还可以作为基因工程的基因试剂(genetic reagents)[74]。由于某些重要性状(如抗松疱锈病Cronartium ribicola)被认为主要受1~2个主效基因所控制,因此,根据注释信息可以筛选出对改良性状起重要作用的基因,通过在自然群体中进行等位基因开发,或者借助基因工程手段实现性状的定向改良[75];借助堆垛转基因(stacking transgenes)策略,针对一个基因型还可以同时进行多个性状的遗传改良[76]。
随着针叶树基因组资源的不断积累,功能基因组学研究也已经进入了高通量分析阶段。目前,基因组学信息为在基因组水平上全面系统分析某一生命活动过程提供了强大工具,林木功能基因组研究在林木遗传育种和研究领域具有广阔的应用前景和发展空间。借助功能基因组学研究工具如DNA微阵列及最近发展起来的数字表达谱技术,针叶树育种中的许多关键问题如杂种优势[77]、木材形成[78-82]、生长与休眠期的转换[83]、 扦插生根[84]、 抗旱[85-87]和抗寒[88-89]等可以在鉴定基因并通过反向遗传学的手段揭示基因功能的基础上得以阐述。
由已经获得功能注释的EST或基因序列开发出来的SNP和SSR很可能与基因功能直接相关,因此也被称为功能标记(functional marker)[2]。由于一个分子标记位点来自一个特定的等位基因,并与该基因控制的性状相联系,这些标记要比随机标记(random marker)有优势,因为它们完全与某一特定性状的等位基因相连锁,不需要借助QTL定位等方法获得性状与分子标记的关联就能在不同遗传背景下进行选择,且功能标记在物种间的转移能力很强,甚至可以被用作比较作图的锚定标记 (anchor markers)[90],由此也获得了“完美标记”(perfect marker)的称谓。完美标记使得育种工作者能够在家系或群体内追踪特定的等位基因,减小感兴趣基因两翼的连锁累赘(linkage drag),通过对分子标记的筛选即能对性状进行筛选,提高了分子标记辅助育种的效率。
3 基因组资源研究趋势及其对针叶树育种的影响
传统的开发基因资源的实验室方法包括克隆、构建cDNA文库和文库扩增等许多劳动力密集型的Sanger测序步骤[91], 既耗时又成本高昂[1,92]。 正因如此, 最初的酵母 Saccharomyces cerevisiae, 拟南芥和人类基因组测序及高通量EST测序项目都为多个实验室联合完成。尽管如此,这种方法所获得的EST质量也不高,如杨树基因组计划所预测的大部分(约75%)基因不为EST序列信息所支持[93];低丰度的基因容易丢失,即使是包含数个植物组织数以万计cDNA克隆所得序列的覆盖度也很有限,仅仅为40%[94-95]。
在Sanger技术统治DNA测序领域近30 a之后,新一代测序技术,包括Roche/454的Genome Sequencer FLX Instrument,Illumina Solexa公司的Illumina Hiseq 2000和Applied Biosystem公司的SOLiD系统,自2004年开始逐渐推出并面向市场[96-97]。它们省去了很多Sanger测序法耗时的步骤,通过大规模平行测序(massively parallel sequencing)技术使测序速度大幅提升,并使成本至少下降2个数量级[98-99]。随着后基因组时代的到来,新一代测序技术已向从事生命科学研究的工作者展示了其巨大的潜力,单个实验室就可以开展基因组学研究[100]。Roche/454技术凭借较长的阅读长度(read length),已被广泛应用到许多树种的基因组资源开发,如美国能源部联合基因组研究组(JGI)开展的conifer EST project对包括火炬松在内的 12 个针叶树种进行转录组测序[101], 美国黑松 Pinus contorta[102], 白云杉[103], 巨桉[104], 橡树 Quercus[105]和板栗 Castanea mollissima[74]等树种也应用了这一技术;Solexa技术也在桉树的从头测序中得以应用[106]。
随着新一代测序技术(NGS)和表达序列标签-简单序列重复(EST-SSR)标记技术的出现,SSR标记的开发成本已大幅下降,应用日渐增多[102,107-108],用新一代测序技术挖掘的SNP标记,包括对候选基因重测序挖掘 SNP, 亦已得到广泛应用[102,104,109-111]。
新一代测序技术的出现使得获得基因组资源的时间缩短,成本大幅下降。目前,单个实验室开展全基因组重测序已成为可能[98,112-113]。正如David B.Neale[6]所预言,针叶树基因组学研究将进入一个重要和多产的时期。对于林木这种驯化时间不长、杂合度高的物种来说,如果没有足够多的参考序列,等位基因和直系同源基因变异将很难找出,进而会影响基因组信息的准确性;新一代测序技术的出现使得对同一树种成百上千个基因型的转录组测序成为可能,由基因型预测表型的准确度和效率大大提升,基因组学辅助育种已经迎来新的发展势头[56,112]。前文提到的GWAS策略的实施需要高密度分子标记,而高通量转录组测序获得的分子标记也是高密度的,这无疑有助于全基因组关联研究的开展。而均匀覆盖整个基因组的高密度分子标记的获得也将使基因组选择(genomic selection,简称GS)成为可能,它将比传统的BLUP选择更准确、有效[114]。随着更准确及全面的表型数据的获得,基因组辅助育种的方法有望由分子标记辅助选择育种将扩大到“理想型”育种的领域[115]。
随着基因组资源获取速度的加快,国际间合作交流也将变得更频繁。受美国农业部资助,旨在为林木育种工作者提供基于基因组的工具以提升传统林木育种效率和效果的“针叶树翻译基因组网络”(conifer translational genomics network,简称CTGN))计划已于2007年9月开展。基因组学的快速发展也使得树种之间遗传改良的差距逐渐缩小,对于非主要改良树种来说,优良基因的快速获得将加快这些树种的改良步伐。
[1]BOUCK A, VISION T.The molecular ecologist’s guide to expressed sequence tags [J].Mol Ecol, 2007, 16 (5):907-924.
[2]ANDERSEN JR, LUBBERSTEDT T.Functional markers in plants [J].Trends Plant Sci, 2003, 8 (11): 554-560.
[3]PHILIPS R L, VASIL I K.DNA-Based Markers in Plants [M].Dordrecht; Kluwer Academic Publishers, 2001.
[4]EARLE C J.The gymnosperm database [ED/OL].2010-10-14[2011-08-25].http://www.conifers.org/zz/pinales.htm.
[5]TROITSKY A V, MELEKHOVETS Y F, RAKHIMOVA G M, et al.Angiosperm origin and early stages of seed plant evolution deduced from rRNA sequence comparisons [J].J Mol Evol, 1991, 32: 253-261.
[6]NEALE D B, KREMER A.Forest tree genomics: growing resources and applications [J].Nat Rev Genet, 2011, 12:111-122.
[7]WULLSCHLEGER S D, JANSSON S, TAYLOR G.Genomics and forest biology: Populus emerges as the perennial favorite [J].Plant Cell, 2002, 14: 2651-2655.
[8]TUSKAN G A, DIFAZIO S, JANSSON S, et al.The genome of black cottonwood, Populus trichocarpa (Torr&Gray)[J].Science, 2006, 313: 1596-1604.
[9]YANG Xiaohan, KALLURI U C, DIFAZIO S P, et al.Poplar genomics: state of the science [J].Crit Rev Plant Sci,2009, 28: 285-308.
[10]JANSSON S, DOUGLAS CJ.Populus: a model system for plant biology [J].Annu Rev Plant Biol, 2007, 58: 435-458.
[11]DOE J G I.Eucalyptus DB [ED/OL].2010-07-01[2011-08-25].http://eucalyptusdb.bi.up.ac.za/.
[12]FAGACEAE PROJECT.Fagaceae genomics web [EB/OL].[2011-08-25].http://fagaceae.org/node/23730.
[13]AHUJA M R, NEALE D B.Evolution of genome size in conifers [J].Silv Genet, 2005, 54: 126-137.
[14]ALLONA I, QUINN M, SHOOP E, et al.Analysis of xylem formation in pine by cDNA sequencing [J].Proc Nat Acad Sci USA, 1998, 95 (16): 9693-9698.
[15]ZHANG Yi, SEDEROFF R R, ALLONA I.Differential expression of genes encoding cell wall proteins in vascular tissues from vertical and bent loblolly pine trees [J].Tree Physiol, 2000, 20 (7): 457-466.
[16]KIRST M, JOHNSON A F, BAUCOM C, et al.Apparent homology of expressed genes from wood-forming tissues of loblolly pine (Pinus taeda, L.) with Arabidopsis thaliana [J].Proc Natl Acad Sci USA, 2003, 100: 7383-7388.
[17]LORENZ W W, SUN Feng, LIANG Chun, et al.Identification of drought response genes in loblolly pine (Pinus taeda L.) by analysis of expressed sequence tag libraries [C]//Town&Country Convention Center.Plant&Animal Genomes XIII Conference.San Diego: Town&Country Convention Center, 2005.
[18]DUBOS C, PLOMION C.Identification of water-deficit responsive genes in maritime pine (Pinus pinaster Ait.) roots[J].Plant Mol Biol, 2003, 51: 249-262.
[19]LI Xingguo, WU H X., DILLON S K, et al.Generation and analysis of expressed sequence tags from six developing xylem libraries in Pinus radiata, D.Don [J].BMC Genomics, 2009, 10: 41.doi: 10.1186/1471-2164-10-41.
[20]PAVY N, PAULE C, PARSONS L, et al.Generation, annotation, analysis and database integration of 16500 white spruce EST clusters [J].BMC Genomics, 2005, 6: 144.doi: 10.1186/1471-2164-6-144.
[21]RALPH S G, CHUN H J, KOLOSOVA N, et al.A conifer genomics resource of 200000 spruce (Picea spp.) ESTs and 6, 464 high-quality, sequence-finished full-length cDNAs for Sitka spruce (Picea sitchensis) [J].BMC Genomics,2008, 9: 484.doi:10.1186/1471-2164-9-484.
[22]FUTAMURA N, TOTOKI Y, TOYODA A, et al.Characterization of expressed sequence tags from a full-length enriched cDNA library of Cryptomeria japonica male strobili[J].BMC Genomics, 2008, 9: 383.doi: 10.1186/1471-2164-9-383.
[23]DOE J G I.Why sequence conifers? [EB/OL].2008-03-11 [2011-08-25].http://www.jgi.doe.gov/sequencing/why/99195.html.
[24]PETERSON D G.Accelerating pine genomics [EB/OL].2009-04-14[2011-08-25].http://www.pine.msstate.edu/.
[25]USDA/NIFA.Pine reference sequences [EB/OL].2012-01-14[2012-01-16].http://www.pinegenome.org/pinerefseq/.
[26]NEALE L A B.Allele discovery of economic pine traits [EB/OL].2002-08-01[2011-08-25].http://dendrome.ucdavis.edu/NealeLab/adept/.
[27]KRUTOVSKY K V, TROGGIO M, BROWN G R, et al.Comparative mapping in the Pinaceae [J].Genetics, 2004,168:447-461.
[28]LAVAL UNIVERSITY.Arborea project[EB/OL].[2011-08-25].http://www.arborea.ulaval.ca/.
[29]UNIVERSITY OF BRITISH COLUMBIA.TREENOMIX: Conifer forest health project. [2011-08-25].http: //www.treenomix.ca/.
[30]NEALE L A B.Loblolly pine genome project[EB/OL].[2011-08-25].http://dendrome.ucdavis.edu/NealeLab/lpgp/.
[31]NEALE L A B.Douglas-fir genome project[EB/OL].[2011-08-25].http://dendrome.ucdavis.edu/NealeLab/dfgp/.
[32]UPSC.Spruce genome project[EB/OL].[2011-08-25].http://www.congenie.org/.
[33]NEALE L A B.White pine genome project[EB/OL].[2011-08-25].http://dendrome.ucdavis.edu/NealeLab/wpgp/.
[34]KRUTOVSKY K V, TRETYAKOVA I N, CHUBUGINA I V, et al.“Shrinking” the giants: an innovative approach for de novo sequencing of conifer genomes[R].Town&Country Convention Center.Plant&Animal GenomesⅩⅩConference.San Diego: Town&Country Convention Center, 2012.
[35]WETTERBOM A L.The repetitive DNA of conifers-lessons from the Norway spruce (Picea abies) genome and resequencing of 5 other conifers[C]//Town&Country Convention Center.Plant&Animal GenomesⅩⅩ Conference.San Diego:Town&Country Convention Center,2012.
[36]NCBI.GenBank [ED/OL].[2011-08-25].http://www.ncbi.nlm.nih.gov/genbank/.
[37]EMBL Nucleotide sequence database [ED/OL].[2011-08-25].http://www.ebi.ac.uk/embl/.
[38]DDJB.DNA data bank of Japan [ED/OL].[2011-08-25].http://www.ddbj.nig.ac.jp/index-e.html.
[39]DFCI.The gene index database [ED/OL].[2011-08-25].http://compbio.dfci.harvard.edu/tgi/plant.html.
[40]DUVICK J P.PlantGDB [ED/OL].[2011-08-25].http://www.plantgdb.org/.
[41]NCBI.Gene expression omnibus [ED/OL].[2011-08-25].http://www.ncbi.nlm.nih.gov/geo/.
[42]NCBI.UniGene [ED/OL].[2011-08-25].http://www.ncbi.nlm.nih.gov/sites/entrez? db=unigene.
[43]MIAMI UNIVERSITY, OHIO.Conifer genome database (ConiferGDB) [ED/OL].[2011-08-25].http://www.conifergdb.org/cgdb3p1/tiki-index.php.
[44]LIANG Chun, WANG Gang, LIU Guoli, et al.ConiferEST: an integrated bioinformatics system for data reprocessing and mining of conifer expressed sequence tags (ESTs) [J].BMC Genomics, 2007, 8: 134.doi: 10.1186/1471-2164-8-134.
[45]NEALE L A B.TreeGenes [ED/OL].[2011-08-25].http://dendrome.ucdavis.edu/treegenes/.
[46]UNIVERSIDAD DE MáLAGA.EuroPine DataBase [ED/OL].[2011-12-25]..http://www.scbi.uma.es/pindb/.
[47]CCGB, UNIVERSITY OF MINNESOTA.SpruceDB [ED/OL].[2011-08-25].http://ccgb.umn.edu/Pub_SpruceDB/.
[48]SAVOLAINEN O, PYHAJARVI T.Genomic diversity in forest trees [J].Curr Opin Plant Biol, 2007, 10: 162-167.
[49]RUDD S, SCHOOF H, MAYER K.PlantMarkers-a database of predicted molecular markers from plants [J].Nucl Acids Res, 2005, 33: 628-632.
[50]WEGRZYN J L, LEE J M, LIECHTY J, et al.PineSAP-sequence alignment and SNP identification pipeline [J].Bioinformatics, 2009, 25 (19): 2609-2610.
[51]CLÉMENT S, FILLON J, BOUSQUET J, et al.TreeSNPs: a laboratory information management system (LIMS)dedicated to SNP discovery in trees [J].Tree Genetics&Genomics, 2010, 6 (3): 435-438.
[52]CHAGNE D, CHAUMEIL P, RAMBOER A, et al.Cross-species transferability and mapping of genomic and cDNA SSRs in pines [J].Theoret Appl Gens, 2004, 109: 1204-1214.
[53]DANTEC L L, CHAGNE D, POT D, O, et al.Automated SNP detection in expressed sequence tags: statistical considerations and application to maritime pine sequences [J].Plant Mol Biol, 2004, 54: 461-470.
[54]VARSHNEY R K, GRANER A, SORRELLS M E.Genomics-assisted breeding for crop improvement [J].Trends Plant Sci, 2005, 10: 621-630.
[55]VARSHNEY R K, HOISINGTON D A, TYAGI A K.Advances in cereal genomics and applications in crop breeding[J].Trends Biotechnol, 2006, 24: 490-499.
[56]VARSHNEY R K, NAYAK S N, MAY G D, et al.Next-generation sequencing technologies and their implications for crop genetics and breeding [J].Trends Biotechnol, 2009, 27: 522-530.
[57]CATTIVELLI L, RIZZA F, BADECK F W, et al.Drought tolerance improvement in crop plants: an integrated view from breeding to genomics [J].Field Crop Res, 2008, 115: 1-14.
[58]WU Rongling, YIN Tongming, HUANG Minren, et al.The application of marker-assisted selection to tree breeding[J].Sci Silv Sin, 2000, 36 (1): 103-113.
[59]DARVASI A.Genomics: gene expression meets genetics [J].Nature, 2003, 422: 269-270.
[60]KAYA Z, SEWELL M M, NEALE D B.Identification of quantitative trait loci influencing annual height-and diameter-increment growth in loblolly pine (Pinus taeda, L.) [J].Theor Appl Genet, 1999, 98: 586-592.
[61]MARKUSSEN T, FLADUNG M, ACHERE V, et al.Identification of QTLs controlling growth, chemical and physical wood property traits in Pinus pinaster (Ait.) [J].Silv Gen, 2003, 52: 8-15.
[62]EMEBIRI L C, DEVEY M E, MATHESON A C, et al.Interval mapping of quantitative trait loci affecting NESTUR, a stem growth efficiency index of radiata pine seedlings [J].Theor Appl Genet, 1998, 97: 1062-1068.
[63]HURME P, SILLANPA¨A¨M J, ARJAS E, et al.Genetic basis of climatic adaptation in Scots pine by Bayesian quantitative trait locus analysis [J].Genetics, 2000, 156: 1309-1322.
[64]PELGAS B, BOUSQUET J, MEIRMANS P G, et al.QTL mapping in white spruce: gene maps and genomic regions underlying adaptive traits across pedigrees, years and environments[J].BMC Genomics, 2011, 12: 145.doi: 10.1186/1471-2164-12-145.
[65]JERMSTAD K D, BASSONI D L, JECH K S, et al.Mapping of quantitative trait loci controlling adaptive traits in coastal Douglas fir(Ⅲ) Quantitative trait loci-by-environment interactions [J].Genetics, 2003, 165: 1489-1506.
[66]NEALE D B, SAVOLAINEN O.Association genetics of complex traits in conifers [J].Trends Plant Sci, 2004, 9:325-330.
[67]CERVERA M T, GUEVARA M A, GONZáLEZ-MARTíNEZ S C, et al.Genomics applied to the study of adaptation in pine species [J].Invest Agrar Sist Recur For, 2005, 14 (3): 292-306.
[68]WILCOX P L, ECHT C E , BURDON R D.Gene-assisted selection: applications of association genetics for forest tree breeding [G]//ORAGUZIE N C, RIKKERINK E H A, GARDINER S E, et al.Association Mapping in Plants.New York: Springer, 2007: 211-247.
[69]TABOR H K, RISCH N J, MYERS R M.Candidate gene approaches for studying complex genetic traits: practical considerations [J].Nat Rev Genet, 2002, 3: 391-396.
[70]HIRSCHORN J N, DALY M J.Genome-wide association studies for common disease and complex traits [J].Nat Rev Genet, 2005, 6: 95-108.
[71]GONZALEZ-MARTINEZ S C, HUBER D, ERSOZ E, et al.Association genetics in Pinus taeda, L.(Ⅱ) carbon isotope discrimination [J].Heredity, 2008, 101: 19-26.
[72]BEAULIEU J, DOERKSEN T, BOYLE B, et al.Association genetics of wood physical traits in the conifer white spruce and relationships with gene expression [J].Genetics, 2011, 188: 197-214.
[73]ECKERT A J, BOWER A D, WEGRZYN J L, et al.Association genetics of coastal Douglas fir (Pseudotsuga menziesu var.menziesii, Pinaceae) (Ⅰ) cold-hardiness related traits [J].Genetics, 2009, 182: 1289-1302.
[74]BARAKAT A, DILORETO D S, ZHANG Yi, et al.Comparison of the transcriptomes of American chestnut (Castanea dentata) and Chinese chestnut (Castanea mollissima) in response to the chestnut blight infection [J].BMC Plant Bioly, 2009, 9: 51.doi: 10.1186/1471-2229-9-51.
[75]BOERJAN W.Biotechnology and the domestication of forest trees [J].Curr Opin Biotechnol, 2005, 16: 159-166.
[76]HALPIN C, BOERJAN W.Stacking transgenes in forest trees [J].Trends Plant Sci, 2003, 8: 363-365.
[77]LI Ai, FANG Mengdie, SONG Wenqin, et al.Gene expression profiles of two intraspecific Larix lines and their reciprocal hybrids [J].Mol Boil Rep, 2011, 39 (4): 3773-3784.
[78]EGERTSDOTTER U, ZYL L M, MACKAY J, et al.Gene expression during formation of early wood and latewood in loblolly pine: expression profiles of 350 genes [J].Plant Biol, 2004, 6: 654-663.
[79]PAIVA J A, GARNIER-GERE P H, RODRIGUES J C, et al.Plasticity of maritime pine (Pinus pinaster)wood-forming tissues during a growing season [J].New Phytol, 2009, 179: 1180-1194.
[80]PAIVA J A, GRACéS M, ALVES A, et al.Molecular and phenotypic profiling from the base to the crown in maritime pine wood-forming tissue [J].New Phytol, 2008, 178: 283-301.
[81]YANG S H, van ZYL L, NO E G, et al.Microarray analysis of genes preferentially expressed in differentiating xylem of loblolly pine (Pinus taeda) [J].Plant Sci, 2004, 166: 1185-1195.
[82]PAVY N, BOYLE B, NELSON C, et al.Identification of conserved core xylem gene sets: conifer cDNA microarray development, transcript profiling and computational analyses [J].New Phytol, 2008, 180: 766-786.
[83]KNAUS B J, DOLAN P C, DENVER D, et al.Transcriptome Dynamics in the Dormancy-spring Growth Transition of Douglas-fir Needles[R].San Diego: Forest Tree workshop, PAG XX, 2012.
[84]BRINKER M, van ZYL L, LIU Wenbin, et al.Microarray analyses of gene expression during adventitious root development in Pinus contorta [J].Plant Physiol, 2004, 135: 1526-1539.
[85]HEATH L S, RAMAKRISHNAN N, SEDEROFF R R, et al.Studying the functional genomics of stress responses in loblolly pine with the Expresso microarray experiment management system [J].Comp Func Gen, 2002, 3: 226-243.
[86]FOSSDAL C G, NAGY N E, JOHNSEN,et al.Local and systemic stress responses in Norway spruce:similarities in gene expression between a compatible pathogen interaction and drought stress [J].Physiol Mol Plant Pathol,2007, 70: 161-173.
[87]LORENZ W W, ALBA R, YU Y S, et al.Microarray analysis and scale-free gene networks identify candidate regulators in drought-stressed roots of loblolly pine (P.taeda L.) [J].BMC Genomics, 2011, 12: 264.doi: 10.1186/1471-2164-12-264.
[88]JOOSEN R V L, LAMMERS M, BALK P A, et al.Correlating gene expression to physiological parameters and environmental conditions during cold acclimation of Pinus sylvestris,identification of molecular markers using cDNA microarrays [J].Tree Physiol, 2006, 26: 1297-1313.
[89]HOLLIDAY J A, RALPH S G, WHITE R, et al.Global monitoring of autumn gene expression within and among phenotypically divergent populations of Sitka spruce (Picea sitchensis) [J].New Phytol, 2008, 178: 103-122.
[90]VARSHNEY R K, GRANER A, SORRELLS M E.Genic microsatellite markers in plants: features and applications[J].Trends Biotechnol, 2005, 23: 48-55.
[91]SANGER F, NICKLEN S, COULSON A R.DNA sequencing with chain-terminating inhibitors [J].Proc Natl Acad Sci USA, 1977, 74: 5463-5467.
[92]MARIONI J, MASON C, MANE S, et al.RNA-Seq: an assessment of technical reproducibility and comparison with gene expression arrays [J].Genome Res, 2008, 18: 1509-1517.
[93]PLOMION C, RICHARDSON T, MACKAY J.Advances in forest tree genomics [J].New Phytol, 2005, 166: 713-717.
[94]SUN Miao, ZHOU Guolin, LEE S, et al.SAGE is far more sensitive than EST for detecting low-abundance transcripts [J].BMC Genomics, 2004, 5: 1.doi: 10.1186/1471-2164-5-1.
[95]GOWDA M, LI H, ALESSI J, et al.Robust analysis of 5’-transcript ends (5’-RATE): a novel technique for transcriptome analysis and genome annotation [J].Nucl Acid Res, 2006, 34: e126.
[96]SHENDURE J, MITRA R D, VARMA C, et al.Advanced sequencing technologies: methods and goals[J].Nat Genet,2004, 5: 335-344.
[97]MARGULIES M, EGHOLM M, ALTMAN W E, et al.Genome sequencing in microfabricated high-density picolitre reactors [J].Nature, 2005, 437: 376-380.
[98]HUDSON M.Sequencing breakthroughs for genomic ecology and evolutionary biology [J].Mol Ecol Resour, 2008, 8:3-17.
[99]MOROZOVA O, HIRST M, MARRA M A.Applications of new sequencing technologies for transcriptome analysis[J].Annu Rev Genomics Hum Genet, 2009, 10: 135-151.
[100]SCHUSTER S C.Next-generation sequencing transforms today’s biology [J].Nature Method, 2008, 5: 16-18.
[101]LORENZ W W, JOHNSON V E, AYYAMPALAYM S, et al.Progress on enhanced EST resources for loblolly pine(Pinus taeda L.) and other conifers [C]//BRUNNER A.Proceeding of the 30th Southern Forest Tree Improvement Conference.Blacksburg: Southern Forest Tree Improvement Conference, 2009.
[102]PARCHMAN T L, GEIST K S, GRAHNEN J A, et al.Transcriptome sequencing in an ecologically important tree species: assembly, annotation, and marker discovery [J].BMC Genomics, 2010, 11: 180.doi: 10.1186/1471-2164-11-180.
[103]RIGAULT P, BOYLE B, LEPAGE P, et al.A white spruce gene catalog for conifer genome analyses [J].Plant Physiol, 2011, 157: 14-28.
[104]NOVAES E, DROST D R, FARMERIE W G, et al.High-throughput gene and SNP discovery in Eucalyptus grandis, an uncharacterized genome [J].BMC Genomics, 2008, 9: 312.doi: 10.1186/1471-2164-9-312.
[105]UENO S, PROVOST G L, LéGER V, et al.Bioinformatic analysis of ESTs collected by Sanger and pyrosequencing methods for a keystone forest tree species: oak [J].BMC Genomics, 2010, 11: 650.doi: 10.1186/1471-2164-11-650.
[106]MIZRACHI E, HEFER C A, RANIK M, et al.De novo assembled expressed gene catalog of a fast-growing Eucalyptus tree produced by Illumina mRNA-Seq [J].BMC Genomics, 2010, 11: 681.doi: 10.1186/1471-2164-11-681.
[107]FERNáNDEZ-POZO N, CANALES J, GUERRERO-FERNáNDEZ D, et al.EuroPineDB: a high-coverage web database for maritime pine transcriptome [J].BMC Genomics, 2011, 12: 366.doi: 10.1186/1471-2164-12-366.
[108]KAUR S, COGAN N O, PEMBLETON L W, et al.Transcriptome sequencing of lentil based on second-generation technology permits large-scale unigene assembly and SSR marker discovery [J].BMC Genomics, 2011, 12: 265.doi:10.1186/1471-2164-12-265.
[109]BARBAZUK W B, EMRICH S J, CHEN H D, et al.SNP discovery via 454 transcriptome sequencing [J].Plant J,2007, 51 (5): 910-918.
[110]IMELFORT M, DURAN C, BATLEY J, et al.Discovering genetic polymorphisms in next-generation sequencing data [J].Plant Biotechnol J, 2009, 7: 312-317.
[111]VERA J C, WHEAT C W, FESCEMYER H W, et al.Rapid transcriptome characterization for a nonmodel organism using 454 pyrosequencing [J].Mol Ecol, 2008, 17: 1636-1647.
[112]MARDIS E R.The impact of next-generation sequencing technology on genetics [J].Trends Genet, 2008, 24: 133-141.
[113]GUPTA P K.Ultrafast and low-cost DNA sequencing methods for applied genomics research [J].Proc Natl Acad Sci India, 2008, 78: 91-102.
[114]GRATTAPAGLIA D, RESENDE M D V.Genomic selection in forest tree breeding [J].Tree Genetics&Genomes,2011, 7: 241-255.
[115]NELSON C D, JOHNSEN K H.Genomic and physiological approaches to advancing forest tree improvement [J].Tree Physiol, 2008, 28: 1135-1143.