APP下载

高个体识别力通用单核苷酸多态性位点筛选及检测*

2010-08-30曾昭书,王黎,方宇

郑州大学学报(医学版) 2010年3期
关键词:汉族等位基因多态性

高个体识别力通用单核苷酸多态性位点筛选及检测*

曾昭书1)△,王 黎2),方 宇3),张书红1),张广政1),郭克民1)
1)郑州大学基础医学院法医学教研室郑州 450001 2)郑州大学基础医学院寄生虫学教研室郑州 450001 3)郑州大学第一附属医院急诊科郑州 450052
△男,1973年 5月生,博士,副教授,研究方向:法医物证学,E-Mail:zzs@zzu.edu.cn

个体识别;单核苷酸多态性;rs4607417;rs749305;焦磷酸测序

目的: 在全基因组中查找能够在世界各大人群中通用的高个体识别力单核苷酸多态性(SNPs)位点,以期为 SNPs应用于法医学个体识别奠定基础。方法:从国际人类基因组单体型图计划 (HapMap)数据库下载 270名个体各约 4 000 000个全基因组 SNPs分型数据,运用自主编写的计算机程序,按照较小等位基因频率 (MAF)≥0.45的原则提取在中国北京汉族人群、日本东京人群、尼日利亚约鲁巴人群以及美国白人人群中同时存在的 SNPs,以焦磷酸测序技术对其中的 rs4607417和 rs749305在河南汉族人群 (n=144)中进行群体遗传学调查,计算 Hardy-W einberg平衡概率 (HW P)、杂合度(Het)、多态信息含量 (PI C)和个体识别力 (DP),并与 HapMap的数据 (n=45)进行比较。结果:共找到 1 439个通用的 SNPs。在河南汉族人群中,rs4607417和 rs749305的 HW P分别为 0.872和0.423,Het分别为 0.476和 0.524,PI C分别为 0.384和 0.388,DP分别为 0.616和 0.612。与 4个人群相比,仅在rs4607417上其等位基因频率与日本东京人群差异有统计学意义 (χ2=5.068,P=0.024)。结论:rs4607417和rs749305是通用的高个体识别力 SNPs;前述筛选获得的 1 439个 SNPs具有高度可靠性和可信度,可用作在世界各人群中通用的个体识别核心 SNPs。

单核苷酸多态性 (single nuc leotide po lymorphis Ms,SNPs)是一种重要的基因多态性,约占人基因多态性的 80%。与法医学领域广泛应用的短串联重复序列(STRs)相比,SNPs突变率更低,等位基因更少,且扩增产物长度更短[1],其在个体识别、祖先信息推断、宗系信息推断和表型信息推断等方面有重要的应用价值[2]。个体识别 SNPs(ind ividual identification SNPs,IISNPs)是指那些可用于个体识别的 SNPs。SNPs能够应用于个体识别的原理在于对大量非连锁的 SNPs而言,不同个体间能在这些位点上拥有完全一致的基因型的几率极低[2]。目前这方面的研究较多[3-4],但仍缺乏一套能在多人群中通用的 IISNPs,阻碍了实际应用。该研究依托国际人类基因组单体型图计划(HapMap)数据库,运用自主开发的计算机程序筛选在中国北京汉族人(HCB)、日本东京人 (JPT)、尼日利亚约鲁巴人(YR I)以及有欧洲血统的美国白人(CEU)中通用的IISNPs,并对其中的 2个 IISNPs在大样本量河南汉族人中进行群体遗传学调查,以验证其个体识别力和筛选结果的可信度。

1 材料与方法

1.1 数据发掘与 SNPs筛选 HCB(n=45)、JPT (n=45)、YR I(n=60)和 CEU(n=60)各人群的全基因组 SNPs分型数据下载自 HapMap数据库(版本r21a,http://hapMap.ncbi.nlm.nih.gov/)。以应用程序可视化语言编写一套程序,自动提取 4个人群中所有较小等位基因频率(MAF)≥0.45的 SNPs及在MAF≥0.45限定下 4个人群共享的 SNPs。用Pow erstats软件包计算杂合度 (Het),用 Genepop 4.0软件包计算族群间遗传分化指数 (Fst)。进一步考察软件提取结果,以彼此间无连锁不平衡、Hardy-W einberg平衡概率 (HW P)及侧翼序列 GC含量居中等指标筛选出 rs4607417和 rs749305 2个 IISNPs供实验验证。

1.2 实验样品 收集 144份无血缘关系的健康河南汉族个体外周血(每份 2 ML),男女各半,以酚-氯仿法提取DNA。对照DNA为 9947A和 K562,分别购自美国AB公司和 ProMega公司。

1.3 PCR扩增 以 Pyrosequencing AB公司提供的软件设计引物分别扩增 rs4607417和 rs749305,序列见表 1。引物由上海生工生物工程技术有限公司合成与纯化。使用 AB I 9700型 PCR仪,总反应体系50μL,含 Ho tstart Taq DNA聚合酶 2 U,模板 DNA 10~20 ng,引物各 0.20μmo l/L。反应条件:95℃预变性 3 Min;94℃20 s,60℃20 s,72℃30 s,共45个循环;72℃延伸 5 Min;4℃保存。

1.4 焦磷酸测序[5-7]PCR引物中 1条的 5’端标记生物素,用于制备测序反应的单链DNA模板 (表1)。采用 Pyrosequencing AB公司试剂盒,参照说明书制备单链DNA模板和进行实时焦磷酸测序。测序反应在 PSQ96全自动焦磷酸测序仪上进行,主要步骤包括测序引物扩增和喷射测序。测序反应结果由 PSQ96MA软件自动分析处理和判定基因型。

表1 相关序列

1.5 观测指标 直接计数法计算基因频率。用Pow erstats软件包计算 HW P、Het、多态信息含量(PIC)、个人识别力 (DP)、偶合概率 (MP)、非父排除率(PE)及典型父权指数 (TPI)等指标。以 Genepop 4.0软件包计算北京汉族与河南汉族间的亚群近交系数 (Fis)。以 SNPSTATS软件在线计算 (http://bioinfo.iconco logia.net/snp stats/start.htm)各位点之间的连锁不平衡。

1.6 统计学处理 采用χ2检验比较河南汉族与HapMap各人群在 2个 IISNPs上的等位基因频率分布的差异,检验水准α=0.05。

2 结果

2.1 SNPs筛选结果 在CEU、HCB、JPT和 YR I人群中筛选出 MAF≥0.45的 SNPs各 218 883、203 302、204 444和 209467个;其中 1 439个 IISNPs同时存在于 4个人群中。该 1 439个 IISNPs的平均Het为 0.500,平均 Fst值为 -0.006 18。

2.2 2个 IISNPs的分型结果及其在河南汉族人群中的群体遗传学参数 144例样品中各有 143例测序结果明确,各有 1例测序结果不肯定。rs4607417 和 rs749305在河南汉族人群中的群体遗传学参数见表 2。河南汉族人(n=143)和 HapMap北京汉族人 (n=45)的 Fis值见表 3。2个位点之间连锁分析结果:D’或 r2值均小于 0.30,2个位点间未见连锁不平衡。

表2 rs4607417和 rs749305在河南汉族人群中的群体遗传学参数(n=143)

表3 河南汉族人和北京汉族人的 F is值

2.3 河南汉族与 HapMap各人群在 2个 IISNPs上的等位基因频率分布比较 见表 4、5。

表4 河南汉族与 HapMap各人群在 rs4607417上的等位基因频率分布比较

表5 河南汉族与 HapMap各人群在 rs749305上的等位基因频率分布比较

3 讨论

运用 SNPs进行法医学个人识别的原理在于:假设 1个 IISNP有 2个等位基因A、G,那么在人群中将存在3种基因型AA、AG和 GG;如同时检测20个这样的互不连锁的 S NPs,那么 2个无关个体拥有完全相同的 20个基因型的几率极低,借此可用于个体识别。

SNPs应用于个体识别时必须拥有较高的 Het和较低的 Fst[2]。既往国内外研究[4,8]或者未能同时获得低 Fst和高 Het,或者未能完成全基因组筛选。该研究由于利用计算机程序进行筛选,因而能够克服全基因组 SNPs量大的困难,并保证候选SNPs的等位基因频率在各人群中一致,接近 0.50/ 0.50,既获得了极低的 Fst,又获得了极高的 Het。如此大量的高 Het和低 Fst的通用 SNPs的发现,为该课题组在世界范围内首次报道[9]。作者已将该1 439个通用 IISNPs及其Het和 Fst值全部公布在公共网页 http://legal-Med.b log.sohu.com上,供免费查询和下载。

焦磷酸测序技术是新一代DNA序列分析技术,该技术对 DNA的序列分析不需要进行电泳,DNA片段不需要荧光标记,PCR结束后转入该测序仪即可读出序列结果,其最大的特点是对短距离 (几十个 bp)测序具有非常精确和快速的优势,适合于SNPs分型[5-7]。该研究应用了这一精确方法,因而分型结果极为可靠。

作者对 2个 IISNPs的检测结果表明,在样本量扩大 3倍以上的情况下,等位基因频率与 HapMap数据相比,波动不大 (rs4607417在 HapMap 4个人群中的平均等位基因频率为 0.467/0.533,rs749305 在 HapMap 4个人群中的平均等位基因频率为0.489/0.511),说明筛选所获得的 1 439个 IISNPs 是 HapMap样品人群中通用的个体识别遗传标记。

该研究结果还显示,所检测的 2个 IISNPs的 Het值高,DP值高,且 Fis绝对值较小,表明该次取样稳定。另外,作者发现仅在 rs4607417上其等位基因频率与JPT人群有差异,证明了该2个 IISNPs完全可用于个体识别,为其投入实际应用提供了参考。

致谢 感谢基因科技(上海)有限公司舒畅在焦磷酸测序方面提供的协助。

[1]AmoriMA,Pereira L.Pros and cons in the use of SNPs in forensic kinship investigation:a comparative analysis w ith STRs[J].Forensic Sci Int,2005,150(1):17

[2]Budow le B,van Daal A.Forensically relevant SNP c lasses [J].B ioTechniques,2008,44(5):603

[3]李莉,李荣宇,李成涛,等.31个 SNP位点多重 PCR扩增和芯片分型技术的建立及其法医学应用[J].法医学杂志,2005,21(2):90

[4]Bφrsting C,Sanchez JJ,Hansen HE,et al.Perfor Mance of the SNPfo r ID 52 SNP-p lex assay in paternity testing[J]. Fo rensic Sci Int Genet,2008,2(4):292

[5]Ahmadian A,Ehn M,Hober S.Pyrosequencing:history, biocheMistry and future[J].C linica ChiMica Acta,2006, 363(1/2):83

[6]Gréen H,Söderkvist P,Rosenberg P,et al.Mdr-1 single nucleotide po lymorphis Ms in ovarian cancer tissue:G2677T/A co rrelates w ith response to pac litaxel chemotherapy[J].C lin Cancer Res,2006,12(3):854

[7]袁建林,薛丽,白玉杰,等.高分辨率 HLA-DRB基因型分析方法的研究 [J].中华泌尿外科杂志,2005,26 (11):739

[8]Pakstis AJ,Speed WC,Kidd JR,et al.Candidate SNPs for a universal individual identification panel[J].HuMGenet,2007,121(3/4):305

[9]Zeng ZS,Yan HT,W ang L,et al.Genome-w ide screen for

individual identification S NPs and the confir mation of 6 of theMamong Han Chinese w ith pyrosequencing technology [J].J Forensic Sci,2010,Ap r 16,[Epub ahead of Print]

(2009-03-17收稿 责任编辑徐春燕)

Screening and genotyp ingof highly infor mative and universally app licable single nucleotide polymorphis Ms for individual identification

ZENG Zhaoshu1),WANG L i2),FANG Yu3),ZHANG Shuhong1),ZHANG Guangzheng1),1)1)D epartMen t of Lega l Med icine,College of Basic Med ica l Sciences,Zhengzhou University,Zhengzhou

ind ividual iden tification;single nuc leo tide po lymo rphis m;rs4607417;rs749305;pyrosequencing

A im:To genoMe-w idely search for high ly info r Mative single nucleotide po lymorphis Ms(SNPs)siMultaneously existing among the world’s Major populations and to lay a basis for SNPs’app lications on individual identification. Me thods:The genotyp ing data of 270 individuals(about 4 000 000 SNPs per genome)were down loaded froMthe HapMap database.A set of coMputer p rograMswas self-edited and perfo rMed to extract SNPsw ith Mino r allele frequency(MAF)≥0.45 among the four popu lations:U.S.residents w ith northern and w estern European ancestry by the Centre d’Etude du po lymorphis Me HuMain(CEPH orCEU),Han Chinese in Beijing(HCB),Japanese froMTokyo(JPT)and Yo ruba peop le of Ibadan,N igeria(YR I).Subsequently,a fo llow ing-on assess Menton two of the extracted SNPs,rs4607417 and rs749305, was carried outw ith increased samp le size(Han Chinese in Henan,n=144)by pyrosequencing techno logy to confirMwhether theywere as info rMative as their HapMap HCB reco rds(n=45)when samp le size becaMe larger.Resu lts:A totalof 1 439SNPswere found to be shared by the four populationsw ithMAF≥0.45.The genotyp ing of rs4607417 and rs749305 showed that their HW P were 0.872 and 0.423,their Het were 0.476 and 0.524,their PI C were 0.384 and 0.388,their DP were 0.616 and 0.612 among Han Chinese in Henan,respectively.No significant difference was found between our samp ling and the HapMap HCB reco rdson the allele frequenciesof the two tested SNPs excep t for rs4607417 in JPT population(χ2=5.068, P=0.024).Conc lus ion:Rs4607417 and rs749305 are highly infor Mative.These 1 439SNPs are highly reliable and credible for the development of a core identity-testing SNP panel among the world populations.

DF795.2

*国家自然科学基金资助项目 30700966;中国博士后科学基金资助项目 20070420812;郑州大学引进人才专项基金资助项目 2005450001 2)D epartMen t of Parasito logy,Co llege of BasicMed ica l Sciences,Zhengzhou University,Zhengzhou 450001 3)D epartMen t of EMergency Med icine,the First Affilia ted Hospita l,Zhengzhou University, Zhengzhou 450052

猜你喜欢

汉族等位基因多态性
单核苷酸多态性与中医证候相关性研究进展
亲子鉴定中Penta E稀有等位基因28的确认1例
MTHFR C677T基因多态性与颈动脉狭窄及其侧支循环形成的关系
RANTES及其受体CCR5基因多态性及环境因素在昆明汉族T2DM发生中的交互作用
亲子鉴定中男性个体Amelogenin基因座异常1例
广东汉族人群Penta D基因座off-ladder稀有等位基因分析
贵州汉族人群23个STR基因座的OL等位基因研究
Study on Local Financial Supervision Right and Regulation Countermeasures
改成汉族的满族人
汉族和维吾尔族心肌梗塞患者心肌酶活性测定的比较