遗传多态性知识汇总

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

遗传多态性知识一、SNP,LD,HaplotypeandTaggerSNP1.遗传/基因多态性(genetic/genepolymorphism)在一随机婚配的群体中,染色体同一基因座位点上有两种或两种以上的基因型,且各个等位基因在群体中的出现频率皆高于1%。它是决定人体对疾病易感性、临床表现多样性及药物治疗反应差异性的重要因素。而种群中频率等于或小于1%的碱基变异称为突变。染色体同一DNA位置上的每个碱基类型叫做一个等位位点。如某些人的染色体上某一位置的碱基是A,而另一些人的染色体上相同位置上的碱基是G,除性染色体外,每个人体内的染色体都有两份,所以,一个人所拥有的一对等位位点的类型被称作基因型(genotype),如GA、GG、AA;检定一个人的基因型,被称作基因分型(genotyping)。由不同基因型与环境共同作用所产生的生物体(人类)可观测的物理或生理性状称为表现型(phenotype)。限制性片段长度多态性(restrictionfragmentlengthpolymorphism.RFLP)是第一代的遗传标记;可变数目的串联重复(variablenumberoftandemrepeat.VNTR)是第二代遗传标记;其中重复单位为2-6个核苷酸称为微卫星或短串联重复;6-12个核苷酸称为小卫星。Polymorphismsaredefinedasfrequent(occurringingreaterthan1%ofthepopulation)variationsinthehumanDNAsequence.Mostinvolveasinglebasepairsubstitution,knownassinglenucleotidepolymorphisms(1),althoughmorecomplexvariationsarealsorecognised.SNPsaresinglebasepairpositionsingenomicDNAatwhichdifferentsequencealternatives(alleles)existinnormalindividualsinsomepopulation(s),whereintheleastfrequentallelehasanabundanceof1%orgreater.Inprinciple,SNPscouldbebi-,tri-,ortetra-alleticpolymorphisms.Howere,inhumans,tri-alleticandtetra-alleticSNPsarerarealmosttothepointofnon-existence,andsoSNPsaresometimessimplyreferredtoasbi-allelicmarkers.单核苷酸多态性(singlenucleotidepolymorphism.SNP):最早由美国麻省理工学院的人类基因组研究中心Lander于1996年提出,是不同个体基因组DNA序列内特定核苷酸位置上单个碱基的不同.是第三代遗传标记,任一SNP在群体中出现的频率应不小于1%,原则上SNP可以是双、三、四等位基因多态,在人类三、四等位基因的SNP很少甚至几乎不存在,因此SNP简单指双等位标记,双等位基因的SNP替换包括1个转换C\T(G\A)和3个颠换C\A(G\T)、C\G(G\C)、T\A(A\T),由于核苷酸的5-甲基胞嘧啶脱氢基反应相对比较频繁,使得四种SNPs在基因组中出现的频率不同,在生物体内约2/3是C/T(G/A)转换,并且多存在于非转录序列中。据统计,人类基因组中3*109碱基中至少存在着1000万个SNPs位点,平均约1个SNP/1000bp。与其他遗传标记(如限制性片段长度多态,短串联重复)的主要不同是不再以“长度”的差异作为检测的手段,而直接以序列的变异作为标记,具有高丰度、高度稳定性和易于自动化分析等独特的优势。英文描述:SNPmarkersarepreferredovermicrosatellitemarkersforassociationstudies,becauseoftheirhighabundancealongthehumangenome(SNPswithminorallelefrequency0.1occuronceevery600kb)(Wangetal.1998),theirlowmutationrate,andtheaccessibilityofhigh-throughputgenotyping.ThepowerofassociationstudiesbasedonSNPsdependsnotonlyonthesamplesizeanddensityofthemarkermapbutalsoonmanyotherfactors,suchastheageandfrequencyofthediseasemutationsandSNPsandtheextentoflinkagedisequilibrium(LD)intheregion.(2)根据SNP在基因序列中所处的位置的不同,SNP位点可以分为几个大类。大多数对基因的功能没有影响的SNPs,称为anonymousSNPs;存在于基因内部的SNP位点则称为gene-basedSNPs,包括内含子、外显子和启动子中的单核苷酸多态性位点。其中,存在于蛋白质编码序列中的SNP位点称为cSNPs或codingSNPs。在cSNPs中,如果不改变所编码的氨基酸序列,这样的单核苷酸多态性称为synonymousSNPs;如果SNP导致了氨基酸序列的改变,则称为non-synonymousSNPs。发生在基因蛋白编码区的SNP,可能引起编码氨基酸的置换,导致蛋白功能的改变;大多数SNPs发生在非编码区,启动子区域的SNP也许影响转录因子结合的能力,改变基因转录的速率或水平;发生在5’上游区或3’下游区域的SNPs可能改变转录的mRNA的稳定性或增强子活性;而内含子区域的SNPs的功能效应有待于进一步研究(3)。检测SNP的方法多种多样,有直接测序法、PCR-RFLP法、单链构型多态分析法(singlestrandconformationpolymorphismanalysis,SSCP)、异源双链分析法(heteroduplexanalysis,HA)、变性梯度凝胶电泳分析法(denaturinggradientgelelectrophoresis,DGGE)、固相化学断裂法(solidphasechemicalcleavagemethod,spCCM)、等位基因特异性聚合酶链反应法(allele-specificPCR)、DNA芯片检测法和实时荧光定量PCR法等,均具有较高的特异性和敏感性,不同实验室可以根据研究目的和经费选择合适的检测方法。2.单倍型(haplotype)位于染色体上特定区域、相互关联、倾向于以整体模式遗传给后代的SNPs组合称作单倍型(haplotype),比拟为人类进化历史的“分子化石”。在一段DNA内若存在n个SNP位点,则群体内理论上可能存在2n种单倍型,但针对每一个体来说只有2种单倍型。单倍型构建方法:实验方法目前有单分子稀释法(single-specificdilution)、AP-PCR(allele-specificPCR)、长插入克隆法(Long-insertcloning)与双倍型-单体型转化(diploid-to-haploidconversion)等;统计算法有Clark算法、最大似然算法、贝叶斯算法。3.单倍域(haplotypeblock)根据基因组大范围内SNPs之间的连锁不平衡,能够用一个相对简单的模型来描述人类基因组的单倍型结构,即染色体上存在的连续的、稳定的、几乎没有被重组所打断的单倍型区域,称为单倍域(haplotypeblockorhaploblocks)。Severalneighboring,tightlylinkedSNPsareinheritedtogetherandformahaplotypeblock.单倍域可能是遗传的最小单位,在极端情况下,它可以是一个单独的SNP或者是一整条染色体,重组事件频发的区域可将相邻的单倍域间隔开来。3.1单倍域的定义:①ahaplotypeblockisacontiguoussetofmarkersinwhichtheaverageD’(thestandardizedcoefficientofLD(4))isgreaterthansomepredeterminedthreshold.②Gabrieletal(5)describedhumangenomecanbeparsedobjectivelyintohaplotypeblocks:sizableregionsoverwhichthereislittleevidenceforhistoricalrecombinationandwithinwhichonlyafewcommonhaplotypesareobserved.basedonlinkagedisequilibrium(LD),thatislargepairwise|D’|valuesbetweenthoseSNPpairswithinonehaploblock.③Patiletal(6)definedhaplotypeblocksasaregionwithalargeproportion(80%)ofinferredcommonhaplotypes.basedontheconceptof“chromosomecoverage”,withahaplotypeblockcontainingaminimumnumberofSNPsthataccountforamajorityofcommonhaplotypesorareducedlevelofhaplotypediversity.④Wangetal(7)furtherproposedexplicit“nohistoricalrecombination”asadefinitionforhaplotypeblocks,whichcanbetestedusingafour-gametetest.⑤DingKetal(8)choosetodefinehaplotypeblocksbasedonLDwhenhaplotype-block-basedtSNPsselectionmethodswereemployed.TheLD-basedhaplotype-blockdefinitionrequiresthattheproportionofSNPpairswithstrongD’(absoluteD’≥0.70)mustaccountforatleast95%ofpairsofSNPs3.2单倍域的算法及划分标准:3.2.1基于连锁不平衡:①GabrielCriteria(5)ofhaplotypeblockpartitioning:ExcludeMAFofSNPsbelow0.05“strongLD”isdefinedthatiftheone-sidedupper95%confidenceboundonD’is0.98(thatis,consistentwithnohistoricalrecombination)andthelowerboundisabove0.7.“strongevidenceforhistoricalrecombination”pairsforwhichtheupperconfidenceboundonD’islessthan0.9.Wedefinedahaplotypeblockasaregionoverwhichaverysmallproportion(5%)ofcomparisonsamonginformativeSNPpai

1 / 20
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功