黔西南汉族人群表皮生长因子前体蛋白编码序列第14和16外显子中单核苷酸多态性研究
2015-09-14周白玉张兵陈海明王兴林刘祖明李方明刘金伟杨绍华
周白玉,张兵,陈海明,王兴林,刘祖明,李方明,刘金伟,杨绍华
黔西南汉族人群表皮生长因子前体蛋白编码序列第14和16外显子中单核苷酸多态性研究
周白玉,张兵,陈海明,王兴林,刘祖明,李方明,刘金伟,杨绍华
背景与目的单核苷酸多态性(SNPs)在蛋白编码序列中多以富集成簇的方式分布,并提示其可能有民族区域和人种之间的差异性,然而SNPs在黔西南汉族人群表皮生长因子前体蛋白(preproEGF)编码序列第14和16外显子中的分布状况迄今尚未见报道,本研究拟对35例黔西南汉族受试者进行研究,旨在分析SNPs在preproEGF编码序列第14和16外显子中的分布特征。方法设计合成4条引物,分别对35例汉族受试者preproEGF编码序列第14和16外显子区段进行PCR扩增和产物的DNA测序;检索单核苷酸多态性资料库(dbSNP)获取资料并与测序结果进行对比分析。结果35例黔西南汉族受试者中13例(37.1%)在preproEGF编码序列的2 525 bp位点出现SNPs,基因型为AG和GG,频率分别为69.2%和30.8%,其等位基因频率分别为A 34.6%和G 65.4%;27例(77.1%)在2 576 bp位点有SNPs,基因型为AA和AG,频率分别为66.7%和33.3%,等位基因频率分别为A 83.3%和G 16.7%。相比之下,北京汉族受试者较黔西南汉族受试者在preproEGF编码序列第14外显子内多了1个单核苷酸多态位点,即2 619 bp位点;欧美等其他民族不仅在preproEGF编码序列第14外显子内分布有rs199935855等7个SNPs,而且在其第16外显子内也分布有rs149396988等6个SNPs;黔西南汉族和北京汉族受试者在preproEGF编码序列的第16外显子内均未见有SNPs分布。结论在黔西南汉族、北京汉族和欧美等民族的preproEGF编码序列第14和16外显子中,SNPs分别具有各民族、各种族的特征性分布,据此可区分不同地域的种族和人群,甚至进行个体识别。也可将这些呈特征性分布的SNPs视为遗传标记进而深入研究SNPs与疾病发生的关系。
汉族;贵州;多态性,单核苷酸;表皮生长因子前体蛋白;多位点测序分型
周白玉,张兵,陈海明,等.黔西南汉族人群表皮生长因子前体蛋白编码序列第14和16外显子中单核苷酸多态性研究[J].中国全科医学,2015,18(29):3587-3591.[www.chinagp.net]
Zhou BY,Zhang B,Chen HM,et al.Single nucleotide polymorphisms in exon 14 and 16 in the coding sequence of prepro-epidermal growth factor in Han people of Qianxi'nan Prefecture[J].Chinese General Practice,2015,18(29): 3587-3591.
单核苷酸多态性(single nucleotide polymorphisms,SNPs)广泛分布于全球各色人种的染色体及其基因序列中[1]。表皮生长因子前体蛋白(prepro-epidermal growth factor,preproEGF)基因具有SNPs分布的代表性或典型性[2]。
preproEGF基因位于染色体4q25,序列全长约110 kb,含有24个外显子;其表达转录的mRNA序列长约5 kb,编码一条含1 207个氨基酸的蛋白多肽链,即preproEGF,其中的表皮生长因子(53个氨基酸)对人体表皮细胞的生长、分化和代谢发挥十分重要的作用;此外,该蛋白还含有数段重复的低密度脂蛋白受体和类表皮生长因子结构域并且兼具潜在的Ca2+结合位点,这表明preproEGF蛋白除了具有表皮生长因子的功能外,还兼具低密度脂蛋白受体组成细胞膜结构和参与出凝血机制的生物学功能,对机体细胞的生长代谢和生理功能发挥多方面的重要作用[3]。另一方面,有研究显示preproEGF基因的遗传变体或多态,特别是其SNPs可能与冠心病、智力发育障碍和肿瘤发生等临床疾病具有相关性。研究表明preproEGF基因序列第61 bp位点的SNPs(A/G)与欧美人群发生黑色素瘤密切相关[4]。由此可见,探索鉴定SNPs在preproEGF基因和编码序列中的分布情况不仅对于人类分子遗传学,而且对医学研究皆具重大意义。
在对SNPs探究早期,有研究认为从概率上讲SNPs以平均1/1 000个单核苷酸的概率分布于DNA序列中,但之后有研究显示SNPs也会以富集成簇的方式间隔分布[5]。随着研究的不断深入和扩展,迄今已发现了数以千万计的SNPs分布在人类基因组序列中。与此同时,美国生物技术信息中心(National Center for Biotechnology Information,NCBI)的单核苷酸多态性资料库(single nucleotide polymorphism database,dbSNP)汇总并向全球公开了这些SNPs[1]。目前已有研究凭借NCBI平台对dbSNP的SNPs进行检索,表明相关SNPs多以密集丛簇的方式间隔分布于编码preproEGF的mRNA/cDNA序列中,其中尤以SNPs较多地集中分布在以外显子11~12和16~19区段为间隔的第13~15外显子区段颇具典型特征[1,6]。dbSNP相关SNPs在我国除北京地区以外的汉民族群体preproEGF编码序列中的分布情况尚不清楚[1]。为弥补此项不足,本研究拟对贵州省黔西南州汉族人群preproEGF编码或mRNA/cDNA序列中具有SNPs分布特征的上述典型区段进行实验研究和资料分析,以探明SNPs的分布特征及其与不同国家、地区、民族和种群之间是否存在差异性,为进一步的群体遗传学和分子医学的诊疗应用提供基础的和有价值的参考。
1 资料与方法
1.1 研究对象2009-05-22至2010-04-29选取35例彼此互无血缘关系且其父母双亲均是汉族的健康个体,来源于贵州省黔西南州人民医院体检中心。年龄18~59岁,平均年龄(35.3±14.7)岁;男19例,女16例。
1.2 方法
1.2.1 主要试剂与仪器DNA提取试剂盒(美国QiaGen公司),PCR扩增试剂盒(日本TaKaRa公司),50×TAE;电泳缓冲液(上海生物工程公司)。核酸测定仪(德国Eppendorf公司),PCR-2400扩增仪(美国PE公司),Mastercycler梯度PCR扩增仪(德国Eppendorf公司),平板电泳仪(美国Bio-Rad公司),凝胶成像仪(美国SYNGENE公司)。PCR扩增及DNA测序引物的合成(上海赛百盛公司)。
1.2.2 DNA样本的制备和引物设计按照DNA提取试剂盒操作程序从受试者外周血样本提取DNA。
对比参照NCBIBlast程序选出的引物序列,分别在preproEGF基因的第14和16外显子所属区段内设计了4条用于PCR和DNA测序的引物(见表1)。
1.2.3 目标区段的PCR扩增配制PCR反应液:10× PCR Buffer 5.0μl,dNTPMixture(各2.5 mmol/L)4.0 μl,受试者DNA模板8.0μl,正、反向引物各0.5μl,灭菌纯水31.5μl,充分混匀后再加入浓度为5.0 U/μl的TaKaRa Taq酶0.5μl至反应总体积为50.0μl,轻轻混匀后置于PCR仪进行DNA扩增。其有效扩增条件为:先94℃3 min预变性,后于94℃30 s变性,63.8℃35 s引物复性和72℃1 min 30 s延伸,进行29个循环,然后72℃7 min后降温至4℃保持恒温。
表1 4条测序引物序列表Table 1 Sequence of4 primers
1.2.4 PCR产物的DNA测序及其序列分析PCR扩增的目标DNA片段送上海英骏生物技术有限公司和宝生物(大连)工程有限公司进行DNA序列测定。应用ABI3130、ABI3700和ABI3730等DNA测序仪对PCR产物进行测序。同时根据研究的需要,对PCR扩增的DNA片段进行必要的双向和重复测序。测序结果以NCBI的GenBank数据库进行对比分析。
1.3 统计学方法计算汉族SNPs的等位基因和基因型频率。通过检索dbSNP,对比黔西南、北京汉族群体和其他种族之间的异同,列表并进行统计学分析。以P<0.05为差异有统计学意义。
2 结果
2.1 PCR扩增产物采用10 g/L琼脂糖凝胶电泳分别检测受试者DNA的PCR产物,于紫外光灯下可见两条分别长约0.64 kb和0.59 kb的DNA扩增带(见图1),其中1~7泳道为第14外显子区段,8~11泳道为第16外显子区的PCR扩增产物。
图1 黔西南汉族受试者DNA的PCR扩增产物Figure 1 PCR amplification products of DNA in Han subjects of Qianxinan Prefecture
2.2 DNA序列测定和dbSNP资料对比分析
2.2.1 对PCR扩增产物进行DNA序列测定测序图谱显示受试者编码preproEGF的第14外显子序列内有两个位点出现了单核苷酸替换改变,即2 525 bp(G/A)和2 576 bp(A/G),且在这两个位点还呈现有SNPs杂合套峰的现象(见图2)。
图2 黔西南汉族受试者DNA测序图谱和dbSNP对照图谱Figure 2 Sequencing chromatogram of DNA in Han subjects of Qianxinan prefecture and the dbSNP tonrol
对测序结果进行计数统计,有13例受试者在2 525 bp位点有SNPs,占37.1%,其基因型有AG和GG两种;有27例受试者在2 576 bp有SNPs,占77.1%,其基因型也有两种,即AA和AG(见表2)。
表2 黔西南汉族受试者preproEGF编码序列第14外显子两个位点的SNPs〔n(%)〕Table2 SNPs of two sites in exon 14 in the coding sequence of preproEGF in Han subjects of Qianxinan
2.2.2 与北京汉族受试者SNPs分布情况相比结果显示35例黔西南汉族受试者在2 525 bp和2 576 bp两个位点的SNPs基因频率与43例北京汉族受试者比较,差异无统计学意义(P>0.05,见表3、4)。
表3 不同地区汉族受试者preproEGF编码序列第14外显子2 525 bp位点基因型和等位基因频率比较〔n(%)〕Table 3 Comparison of genotype and alleles frequency of 2 525 bp site in exon 14 in the coding sequence of preproEGF among Han subjects of different regions
表4 不同地区汉族受试者preproEGF编码序列第14外显子2 576 bp位点基因型和等位基因频率比较〔n(%)〕Table 4 Comparison of genotype and alleles frequency of 2 576 bp site in exon 14 in the coding sequence of preproEGF among Han subjects of different regions
2.2.3 计算黔西南汉族受试者的基因频率并与dbSNP的资料比较本研究在第14外显子序列内未检测到2 619 bp位点有SNP发生;与其他地区种族(例如美欧人群)的SNPs分布情况相比,本研究在第16外显子序列内未检测到任何单核苷酸改变即SNPs发生(见表5)。
表5 在不同地区民族和种族preproEGF编码序列中SNPsTable 5 Comparison of SNPs in the coding sequence of preproEGF among people of different nationality regions and races
3 讨论
3.1 鉴于SNPs与黑色素瘤等疾病相关,因而探究其在preproEGF基因序列中的分布状况已引起广泛关注[2,7]。现已有研究表明,SNPs在preproEGF基因组序列中多以平均1/1 000个单核苷酸概率或密度分布,在内含子中的分布亦是如此;而在编码preproEGF的24个外显子中则多以富集丛簇间隔分布为特征,这在第14和16外显子最为典型[1-2,6]。然而,SNPs在本地区汉民族preproEGF编码序列中的分布是否也具同样的特征尚不清楚。为此,本研究采用PCR、DNA测序并数量分析等技术从定性与定量两个方面探究了SNPs在35例黔西南汉族受试者preproEGF编码序列第14和16外显子中的分布状况。在定性方面,首先可观察到有两个SNPs (rs2302135和rs2237051,2 525 bp和2 576 bp位点)彼此间仅相隔51 bp而分布于第14外显子中,提示这是一个SNPs富集分布的热点外显子;与之相反,在序列长度为122 bp的第16外显子中未见到有任何SNPs,提示该外显子可能系保守序列,可视为SNPs分布的间隔外显子。这一结果与之前有关SNPs在人preproEGF编码序列第14外显子内富集成簇而在第16外显子内却是零分布的报道[6]基本上可相互印证。其次,在数量方面,有13例SNPs分布在2 525 bp位点,27例SNPs分布在2 576 bp位点。同时,这2个SNPs位点各自独具其特征性的基因型和等位基因频率,具体在2 525 bp位点其基因型是AG和GG,频率分别为69.2%和30.8%,等位基因频率分别为A(34.6%)和G(65.4%);而在2 576 bp位点其基因型则为AA和AG,频率分别为66.7%和33.3%,等位基因频率分别为A(83.3%)和G(16.7%)。黔西南汉族特有的这些SNPs基因型和等位基因频率将有助于区域群体的区分和鉴定,对群体遗传学的研究显然具有参考价值和意义[8]。
3.2 参考dbSNP中SNPs的资料,本研究对比分析了北京和黔西南的汉族受试者,结果显示preproEGF编码序列第14外显子中的2个SNPs即rs2302135和rs2237051在两个群体中均可见到;在北京汉族受试者preproEGF编码序列第14外显子中还可见到1个位于2 619 bp的SNPs即rs6413481[1,6,9]。因此,在北京汉族受试者preproEGF编码序列第14外显子中有3个SNPs位点分布,而黔西南汉族受试者中仅只有2个SNPs位点。这既是北京汉族的SNPs分布特征之一,同时也是区别于黔西南汉族的一个明确的SNPs标志,提示虽然同为居住在国内的汉族,却可能因地处南北区域的不同而出现其SNPs分布的差异性。另一方面,比较分析北京和黔西南汉族受试者2 525 bp和2 576 bp位点的基因频率虽未见其差别有统计学意义,但并不意味着二者的SNPs基因频率也是如此,尚待进一步的研究予以解答。
3.3 作为SNPs富集成簇分布间隔区段的第16外显子,在本研究中并未见到任何SNPs分布于其中,这一结果与有关研究报道相一致[6]。然而,通过检索dbSNP并观察其SNPs在全球各民族/种族中的分布,本研究结果与之相比,分布在preproEGF编码序列中的SNPs明显增多,不仅第14外显子有SNPs分布,而且本来是零分布的第16外显子也有SNPs分布其中;计数在这两个外显子内的SNPs共有13个,其中7个分布于包括汉族在内的全球多个民族/种族的preproEGF编码序列第14外显子,而余下的6个则分布在除汉族以外的其他民族/族的preproEGF编码序列第16外显子中[1];进一步观察发现,除了在汉族preproEGF编码序列第14外显子中的3个SNPs为全球多民族/种族共有分布外,其余10个SNPs,即rs375886742、rs370234235、rs199935855、rs148000061、rs140133196、rs375314388、rs369597497、rs190681731、rs149396988和rs372992676皆为其他民族/种族所拥有,因此这些SNPs可望作为标志性或标签SNPs用来区分是汉族抑或是其他种族,SNPs在 preproEGF编码序列第14和16外显子中的分布特征表现出了不同民族之间或种族之间具有差异性。
总而言之,本研究表明SNPs在黔西南汉族、北京汉族和欧美等其他民族的preproEGF编码序列第14和16外显子的分布存在着不同程度的差异性。
[1]Acland A,Aqarwala R,Barrett T,et al.Database resources of the National Center for Biotechnology Information[J].Nucleic Acids Res,2013,41(Database issue):D8-20.
[2]Wang M,Li FM,Liu ZM,et al.Characterization of single nucleotide polymorphisms in human epidermal growth factor precursor gene[J].Journal of Zunyi Medical University,2012,35(2): 104-110.(in Chinese)
王敏,李方明,刘祖明,等.SNPs在人preproEGF基因内的分布特征初探[J].遵义医学院学报,2012,35(2):104-110.
[3]Bell GI,Fong NM,Stempien MM,et al.Human epidermal growth factor precursor:cDNA sequence,expression in vitro and gene organization[J].Nucleic Acids Res,1986,14(21):8427-8446.
[4]Shahbazi M,Pravica V,Nasreen N,et al.Association between functional polymorphism in EGF gene and malignantmelanoma[J].Lancet,2002,359(934):397-401.
[5]Koboldt DC,Miller RD,Kwok PY.Distribution of human SNPs and its effect on high-throughput genotyping[J].Hum Mutat,2006,27(3):249-254.
[6]Chen HM,Li FM,Zhang B,et al.Bioinformatics distribution of single nucleotide polymorphisms in mRNA∕cDNA of human epidermal growth factor precursor[J].China Medical Guides,2014,11(1):14-17.(in Chinese)
陈海明,李方明,张兵,等.人preproEGF的mRNA/cDNA序列中SNPs及生物信息学分布探究[J].中国医药导报,2014,11 (1):14-17.
[7]Lozano-Santos C,Martinez-Velasquez J,Fernandez-Cuevas B,et al.Vascular endothelial growth factor A(VEGFA)gene polymorphisms have an impact on survival in a subgroup of indolent patients with chronic lymphocytic leukemia[J].PLoS One,2014,9(6):e101063.
[8]Deng L,Hoh BP,Lu D,etal.The population genomic landscape of human genetic structure,admixture history and local adaptation in Peninsular Malaysia[J].Hum Genet,2014,133(9):1169-1185.
[9]Marth GT,Korf I,Yandell MD,et al.A general approach to single-nucleotide polymorphism discovery[J].Nat Genet,1999,23 (4):452-456.
Single Nucleotide Polymorphisms in Exon 14 and 16 in the Coding Sequence of Prepro-epidermalGrow th Factor in Han People of Qianxi'nan Prefecture
ZHOU Bai-yu,ZHANG Bi
ng,CHEN Hai-ming,et al.Department of Clinical Laboratory,Qianxi'nan State Hospital,the7th Affiliated Hospital of ZunyiMedical College,Xingyi562400,China
Background and Objective The distribution of single nucleotide polymorphisms(SNPs)in protein coding sequence ismainly in clustered integration and may varieswith differentnationality regions and races.However,there are few reports about the distribution of SNPs in exon 14 and 16 in the coding sequence of prepro-epidermal growth factor (preproEGF)in Han People of Qianxinan Prefecture.In this study,we conducted researches on 35 Han people of Qianxinan Prefecture to investigate the distribution features of SNPs in exon 14 and 16 in the coding sequence of preproEGF.MethodsFour primerswere designed and synthesized,and PCR amplification and DNA sequencing of the productswere conducted on the sections of exon 14 and 16 in the coding sequence of preproEGF in 35 Han subjects;comparison was made between the sequencing results and data retrieved from dbSNP.Results Among the 35 Han subjects of Qinxinan Prefecture,13(37.1%) subjects had SNPs shown at 2 525 bp site in the coding sequence of preproEGF,and the genotypes were AG and GG,withfrequencies of 69.2%and 30.8%respectively and allele frequencies of A 34.6%and G 65.4%respectively;27(77.1%) subjects had SNPs shown at 2 576 bp site,and the genotypes were AG and AG,with frequencies being 66.7%and 33.3% respectively and allele frequencies being A 83.3%and G 16.7%respectively.In comparison,Han subjects of Beijing had an extra site of SNPs in exon 14,which was 2 619 bp site;subjects of Europe,the U.S.and some other nationalities had 7 extra sites of SNPs in exon 14,such as rs199935855,and they also had 6 extra sites of SNPs in exon 16;Han subjects of Qianxinan prefecture and Beijing had no SNPs in exon 16.Conclusion Among Han people of Qianxinan prefecture and Beijing and people of Europe,the U.S.and some other nationalities,the distribution of SNPs in exon 14 and 16 in the coding sequence of preproEGF varieswith differentethnic groups and races,which could be served as a reference for distinguishing different races or populations from different regions and even individual identification.The SNPswith featured distribution could be taken as genetic markers for further research of the relation between SNPs and diseases.
Han nationality;Guizhou;Polymorphism,single nucleotide;preproEGF;Multilocus sequence typing
R 394.5
A
10.3969/j.issn.1007-9572.2015.29.020
2015-03-20;
2015-08-20)
(本文编辑:赵跃翠)
贵州省黔西南州医院科研基金[(2009)84]
562400贵州省兴义市,黔西南州人民医院遵义医学院第七附院检验科(周白玉,张兵,陈海明,王兴林,刘祖明,李方明);遵义医学院附属医院贵州省细胞工程重点实验室(刘金伟);海口保税区远兮细胞分子技术应用研发有限公司(杨绍华)
周白玉,562400贵州省兴义市,黔西南州人民医院遵义医学院第七附院检验科;E-mail:2578629971@qq.com