单核苷酸多态性理论及应用SNP1Contents•1.SNP概述•2.常用SNP检测技术•3.SNP的应用•4.科研进展•5.存在的问题2SNP概述SNP概述有的人吸烟喝酒却长寿,也有人自幼就病痛缠身;同一种治疗肿瘤的药物对一些人非常有效,对另一些人则完全无效。这是为什么?答案是他们基因组中存在的差异。这种差异很多表现为单个碱基上的变异,也就是单核苷酸的多态性(SNP)。3SNP的发展历史•生命世界存在着极其丰富的多样性,这是人类早就认识到但迄今仍在试图解释的现象。•如今,随着分子生物学的不断发展,来自分子水平的信息,尤其是海量的DNA序列数据为人们进一步认识和解释生命多样性提供了前所未有的机会。通常,基因组DNA序列存在三种类型的天然变异:单个核苷酸替换、一段核苷酸的插入或缺失以及卫星DNA重复次数的差异。1994年,单核苷酸多态性(SingleNucleotidePolymorphisms简称SNP)这个术语第一次出现在人类分子遗传杂志上,随后Lander(1996)第一次正式提出SNPs为新一代分子标记。1998-2002年,每年召开一次““SNPs与复杂基因组”国际会议,其宗旨是探讨SNPs在复杂基因组研究中应用的可能性,其内容包括方法、应用与伦理。4什么是SNPSNP全称SingleNucleotidePolymorphisms,是指在基因组上单个核苷酸的变异,包括置换、颠换、缺失和插入。一般而言,SNP是指变异频率大于1%的单核苷酸变异。在人类基因组中大概每1000个碱基就有一个SNP,人类基因组上的SNP总量大概是3×106个。从理论上来看每一个SNP位点都可以有4种不同的变异形式,但实际上发生的只有两种,即转换(为主):以一种嘧啶置换另一种嘧啶CT或一种嘌呤置换另一种嘌呤AG和颠换:嘌呤与嘧啶互换CG,CG,AT。SNP在CG序列上出现最为频繁,而且多是C转换为T,原因是CG中的C常为甲基化的,自发地脱氨后即成为胸腺嘧啶。5SNP的分类•根据SNP在基因组中的分布位置可将其分为基因编码区SNP(cSNP),基因调控区SNP(pSNP),基因间随机非编码区SNP(rSNP)等三类。因为编码区内的变异率仅占周围序列的1/5,SNP的总量显著小于其他两类SNP。•从对生物遗传性状影响上看,cSNP又可以分为2种,一种是同义cSNP(synonymouscSNP),即SNP所导致的编码序列改变并不影响其所翻译的蛋白质的氨基酸序列,突变碱基与未突变碱基含义相同;另一种是非同义cSNP(non-synonymouscSNP),指碱基序列的改变可使以其为蓝本翻译的但标准序列发生改变,从而影响蛋白质的功能。这种改变通常是导致生物性状发生改变的直接原因。•位于基因调控区的SNP则会影响基因表达量的多少。6单倍型(Haplotype)•在描述SNP时,当前的一致意见是用术语“haplotype”(单倍型)代替术语“allele”(等位基因)。•单倍型的定义为在给定的一条染色体的紧密连锁的位点上多个等位基因的集合,通常3-4个相邻等位基因彼此靠近而构成的单倍型可作为一个整体而遗传(称为单倍型块,haploblock)(Edwardsetal.,2001;Rafaski,2002),见表1。7常用SNP检测技术常用SNP检测技术8常用非凝胶SNP检测技术1.基因芯片技术2.Taqman技术3.分子信标技术4.焦磷酸测序法SNP的分型技术可分为两个时代,一为凝胶时代,二为高通量时代。凝胶时代的主要技术和方法包括限制性酶切片段长度多态性分析(RFLP)、寡核苷酸连接分析(OLA)、等位基因特异聚合酶链反应分析(AS2PCR)、单链构象多态性分析(SSCP)、变性梯度凝胶电泳分析(DGGE),虽然这些技术与高通量时代的技术原理大致一样,但是由于它不能进行自动化,只能进行小规模的SNP分型测试,所以必然会被淘汰。9基因芯片技术•基因芯片技术是在固相支持介质上进行分子杂交和原位荧光检测的一种高通量SNP分析方法。10Taqman技术•这种方法也称为核酸外切酶法(5’-nucleaseassay),是在PCR过程中实现等位特异性杂交,而不需以往等位特异性杂交中样品PCR后分离及洗涤等步骤。11分子信标技术•分子信标是一种新型的发卡结构的寡核苷酸探针,是在样品PCR过程中因和样品DNA杂交后而使自身荧光构象改变从而实现对SNP的检测。12焦磷酸测序法•四种酶催化同一反应体系中的酶级联反应,包括DNA聚合酶、ATP硫酸化酶(ATPsulfurylase)、荧光素酶(luciferase)和三磷酸腺苷双磷酸酶(apyrase)。•原理:DNA聚合酶在一种dNTP的存在下进行引物延伸反应,而引物的成功延伸将伴随焦磷酸的释放,焦磷酸在荧光素酶的存在下能引一种发化学发光反应,通过发光计的实时监测来达到检测的目的。13SNP的应用SNP的应用14遗传图谱的构建•CereonGinomics公司(2001)公开的信息指出,在拟南芥的两个生态型序列中,平均每3.3kb有1个SNP,对这个拥有130Mb的基因组而言,这种碱基转换的变异大约为40,000个SNPs。Choetal.(1999)用一种抗真菌病基因Eds16序列中的237个SNPs标记在拟南芥中构建了分辨率为3.5cm的二等位基因遗传图谱。这是第一次在二倍体植物中构建的二等位基因标记的遗传图谱,它所确立的一系列方法也可用于其他植物的SNPs遗传图谱构建。在F2代收获以后,这个二等位基因图谱构建的整个过程花了不到两天的时间,而要用ONF8标记得到同样的结果须花几个月时间。15DNA指纹的确立•SNPs指纹在区分近缘种的研究中非常有效。例如:红云杉和黑云杉在形态上难以区分,它们和白云杉在北美地区又是分布区重叠的种。为了鉴定3个近缘种之间的多态性,Germano(1999)从每个种代表不同地理群体的3个个体取样,对叶绿体trnK的内含子、trnK、rpl33-psaJ-trnK区域以及核DNA的ITS区域进行测序,结果发现了13个叶绿体的和12个核DNA的种间SNPs,其分布如图所示。•这些方法简单而灵敏,通常比等位酶、RELP和RAPD等分子标记更为有效。16其他应用•SNPs还在•人类基因单体型图谱的绘制;•疾病易感的相关性分析;•指导用药和用药分析等方面•有诸多应用。17科研进展科研进展18ViviYuskianti,SusumuShiraishi.DevelopingSNPmarkersandDNAtypingusingmultiplexedsinglenucleotideprimerextension(SNuPE)inParaserianthesfalcataria.BreedingScienceVol.60(2010),No.187-92•通过在南洋楹上采用多路复用的单核苷酸引物延伸技术开发SNP标记和DNA分型。•WedevelopedSNPsinParaserianthesfalcatariaandarrangedthemformultiplexedDNAtypingusingsinglenucleotideprimerextension(SNuPE).Seventeensequencecharacterizedamplifiedregions(SCARs)weredevelopedfromrandomamplifiedpolymorphicDNA(RAPD).In12SCARsofthem,aSNPwhichpossessedhighheterozygositywasselected,andthreesetsofmultiplexedSNuPEanalysissystemwith4SNPswereconstructed.Estimatingthediscriminationpower(DP)revealedthatsetAhadthehighestDP(0.968),followedbysetBandsetC.Theabilitytodiscriminatecouldbealmost100%(1.000ofDP)whenallsetswereused.ThisSNuPEsystemprovidesapracticablemethodforindividualidentificationofthisforesttreespecies.19VonholdtBM,PollingerJP.Genome-wideSNPandhaplotypeanalysesrevealarichhistoryunderlyingdogdomestication.Nature.2010464(7290):898-902.•犬类的全基因组SNP和单体型分析•Tounderstandtheprocessofdogdiversificationbetter,weconductedanextensivegenome-widesurveyofmorethan48,000singlenucleotidepolymorphismsindogsandtheirwildprogenitor,thegreywolf.Hereweshowthatdogbreedsshareahigherproportionofmulti-locushaplotypesuniquetogreywolvesfromtheMiddleEast,indicatingthattheyareadominantsourceofgeneticdiversityfordogsratherthanwolvesfromeastAsia,assuggestedbymitochondrialDNAsequencedata.Furthermore,wefindasurprisingcorrespondencebetweengeneticandphenotypic/functionalbreedgroupingsbutthereareexceptionsthatsuggestphenotypicdiversificationdependedinpartontherepeatedcrossingofindividualswithnovelphenotypes.OurresultsshowthatMiddleEasternwolveswereacriticalsourceofgenomediversity,althoughinterbreedingwithlocalwolfpopulationsclearlyoccurredelsewhereintheearlyhistoryofspecificlineages.Morerecently,theevolutionofmoderndogbreedsseemstohavebeenaniterativeprocessthatdrewonalimitedgenetictoolkittocreateremarkablephenotypicdiversity.20存在的问题存在的问题21复杂疾病相关分析中的问题•在国际SNP及复杂基因分析会议上透露出许多问题,利用SNP寻找致病基因的工作并不象最初想象的那样简单。•研究者除需要大量的SNPs,有时需要弄清被研究人群的历史,如他们的迁移模式等,在对心脏病危险因素LPL基因的研究中,由于减数分裂中的基因重组,使SNP的关联分析很困难;科学家们用SNPs研究镰刀细胞贫血的B球蛋白基因时也遇到了困难,他们认为研究者除依靠SNP外,还需知道疾病的模式及被研究人群的历史。22技术问题•目前虽然有大量检测SNP的方法,但大都价格昂贵,速度较慢,这限制了其在法庭科学中的应用,所以迫切需要有低成本,高生产率的新方法涌现。23SNP命名问题•目前没有一个统一标准的命名方法,这对于Y2SNP来说尤为紧迫,由于不同SNP由不同实验室测定,现在至少存在6种不同的命名系统。24参考文献•[1].