Snp技术SNP概念•SNP,singlenucleotidepolymorphism,单核苷酸多态性。是指基因组水平上由单个核苷酸的变异所引起的DNA序列多态性,在群体中的发生频率不小于1%。•包括单个碱基的转换、颠换、插入和缺失等•转换是指同型碱基之间G-A,T-C•颠换是指发生在嘌呤与嘧啶之间A-T、A-C、C-G、G-T•依据排列组合原理一共可以有6种替换情况•A/G、A/T、A/C、C/G、C/T和G/T•但事实上,转换的发生频率占多数,而且是C-T转换为主•其原因是CpG的C是甲基化的,容易自发脱氨基形成T•SNP发生频率在动物基因组中分布广泛如果随即抽取两个人的基因组对比,大概1000个碱基就会出现一个SNP如果样本数增加,SNP会继续增加300-600bp即会出现一个SNPSNP是继微卫星之后的第三代遗传标记。•与限制性片段长度多态性(RestrictionFragmentLengthPolymorphism,RFLP)和简单重复序列(SimpleSequenceRepeat,SSR)等常用分子标记相比,SNP具有分布密度高、遗传稳定、与表型性状相关性强、检测简便、易于实现自动化分析等诸多优点,被称为第三代分子标记。SNP的特点•在遗传学分析中,SNP作为一类遗传标记得以广泛应用,主要源于这几个特点:(1)密度高SNP在人类基因组的平均密度估计为1\1000bp,在整个基因组的分布达3×106个,遗传距离为2~3cM,密度比微卫星标记更高,可以在任何一个待研究基因的内部或附近提供一系列标记。(2)富有代表性某些位于基因内部的SNP有可能直接影响蛋白质结构或表达水平,因此,它们可能代表疾病遗传机理中的某些作用因素。SNP的特点(3)遗传稳定性与微卫星等重复序列多态性标记相比,SNP具有更高的遗传稳定性。(4)易实现分析的自动化SNP标记在人群中只有两种等位型(allele)。这样在检测时只需一个“+\-”或“全\无”的方式,而无须象检测限制性片段长度多态性,微卫星那样对片段的长度作出测量,这使得基于SNP的检测分析方法易实现自动化。•SNP的分型例如:某些人染色体上某个位置的碱基是A,而另一些人染色体的相同位置上的碱基则是G。同一位置上的每个碱基类型叫做一个等位位点。除性染色体外,每个人体内的染色体都有两份。一个人所拥有的一对等位位点的类型被称作基因型(genotype)。对上述SNP位点而言,一个人的基因型有3种可能性,分别是AA、AG或GG。基因型这一名称既可以指个体的某个SNP的等位位点,也可以指基因组中很多SNPs的等位位点。关于单体型haplotype•人类基因组中,相邻近的SNPs等位位点倾向于以一个整体遗传给后代。•位于一条染色体上或某一区域的一组相关联的SNP等位位点被称作单体型(haplotype)。•如果一个单体型有N个变异位点,理论上就可能有n的4次方种可能的单体型。实际上,大多数染色体区域只有少数几个常见的单体型(它们代表了一个群体中人与人之间的大部分多态性。一个染色体区域可以有很多SNP位点,但是只用少数几个标签SNPs,就能够提供该区域内大多数的遗传多态模式,这样将大大减少用于基因型与疾病关联分析中的SNPs—基于板块理论。SNP的意义(微观)•绝大多数位于非转录区,非编码区。•少数位于编码区。•编码区的意义,同义,错义,移码。•非转录区和非编码区的调控功能。SNP的应用(宏观意义)•基因组制图中的应用•在种族遗传学和连锁不平衡性分析中的应用•医学中疾病易感性研究中的应用•药物基因组学研究中的应用•临床耐药研究中的应用•遗传育种的应用一、SNPs经典检测方法•一大类是以凝胶电泳为基础的传统经典的检测方法,如:1.限制性片段长度多态性法PCR-RFLP;2.单链构象多态性法PCR-SSCP;3.变性梯度凝胶电泳(denaturinggradientgeleletrophoresisDGGE);4.等位基因特异性PCR(allelespecificPCR,ASPCR)等等PCR-RFLP方法原理:利用限制性内切酶的酶切位点的特异性,用两种或两种以上的限制性内切酶作用于同一DNA片断,如果存在SNP位点,酶切片断的长度和数量则会出现差异,根据电泳的结果就可以判断是否SNP位点。特点:该技术应用的前提是SNP的位点必须含有该限制内切酶的识别位点,它是SNP筛查中最经典的方法之一.PCR-RFLP原理图单链构象多态性(SSCP)原理:单链DNA在中性条件下会形成二级结构,不同的二级结构在电泳中会出现不同的迁移率。这种二级结构依赖于碱基的组成,单个碱基的改变也会影响其构象,最终会导致在凝胶上迁移速度的改变。在非变性聚丙烯酰胺凝胶上,短的单链DNA和RNA分子依其单碱基序列的不同而形成不同的构象,这样在凝胶上的迁移速率不同,出现不同的条带,检测SNP。特点:由于该方法简单快速,因而被广泛运用于未知基因突变的检测。这种方法的弊端在于不能确定突变类型和具体位置。变性梯度凝胶电泳(DGGE)•原理:是利用长度相同的双链DNA片段解链温度不同的原理,通过梯度变性胶将DNA片段分开的电泳技术。电泳开始时,DNA在胶中的迁移速率仅与分子大小有关,而一旦DNA泳动到某一点时,即到达该DNA变性浓度位置时,使得DNA双链开始分开,从而大大降低了迁移速率。当迁移阻力与电场力平衡时,DNA片段在凝胶中基本停止迁移。由于不同的DNA片段的碱基组成有差异,使得其变性条件产生差异,从而在凝胶上形成不同的条带。等位基因特异PCR(AS-PCR)原理:根据SNP位点设计特异引物,其中一条链(特异链)的3′末端与SNP位点的碱基互补(或相同),另一条链(普通链)按常规方法进行设计,因此,AS-PCR技术是一种基于SNP的PCR标记。因为特异引物在一种基因型中有扩增产物,在另一种基因型中没有扩增产物,用凝胶电泳就能够很容易地分辨出扩增产物的有无,从而确定基因型的SNP。SNPs高通量的检测方法另一大类检测方法是近些年来发展起来的,高通量、自动化程度较高的检测SNPs的方法,较为常用的有:1.DNA测序法;2.DNA芯片检测;3.飞行质谱仪(MALDI-TOFMS)检测;4.变性高效液相色谱(DHPLC)法等等5.Realtime-pcr法(taqman)DNA测序法•直接测序是最容易实施的SNP检测方法。原理:通过对不同个体同一基因或基因片段进行测序和序列比较,以确定所研究的碱基是否变异,其检出率可达100%。特点:可以得到SNP的类型及其准确位置等SNP分型所需要的重要参数。基因芯片技术(Genechips)原理:是将具有特定碱基序列的探针固定在特殊的载体上,待测基因经提取、荧光标记后,与固定好的探针进行杂交,最后根据荧光的强度和种类测出待测序列的碱基类别。特点:基因芯片具有信息量大和自动化程度高的突出优点。但它也存在若干问题:芯片造价高昂,所需设备贵重,不利于普及应用。MALDI-TOF原理:是将变性的单链PCR产物通过与硅芯片上的化合物共价结合后,在硅芯片上进行引物的退火,延伸反应,突变部位配对的碱基与正常配对的碱基不相同。根据引物在延伸反应中所结合的不同碱基的不同质量在质谱仪上显示不同峰而检测SNP。变性高效液相色谱(DHPLC)原理:目标核酸片段PCR扩增,部分加热变性后,含有突变碱基的DNA序列由于错配碱基与正常碱基不能配对而形成异源双链。因包含错配碱基的杂合异源双链区比完全配对的同源配对区和固定相的亲和力弱,更易被从分离柱上洗脱下来,从而达到分离的目的。SNPs的有无最终表现为色谱峰的峰形或数目差异,依据此现象可很容易从色谱图中判断出突变的碱基。特点:使用高效液相色谱检测SNPs具有检测效率高,便于自动化的优点,对未知SNPs的准确率可达95%以上。但DHPLC检测对所用试剂和环境要求较高,容易产生误差,不能检测出纯合突变。MassARRAY•SNP分型的方法多种多样,MassARRAY分子量阵列技术是Sequenom公司推出的世界上领先的基因分析工具,通过引物延伸或切割反应与灵敏、可靠的MALDITOF质谱技术相结合,实现基因分型检测。•基于MassARRAY®分子量阵列平台的iPLEXGOLD技术可以设计最高多达40重PCR反应和基因型检测,实验设计非常灵活,分型结果准确性高。特别适合于对全基因组研究发现的结果进行验证,或者是有限数量的研究位点已经确定的情况。MassARRAY技术原理:•先通过PCR扩增目标序列,然后加入SNP序列特异延伸引物,在SNP位点上,延伸1个碱基。将制备的样品分析物与芯片基质共结晶后在质谱仪的真空管经强激光激发,核酸分子解吸附为单电荷离子,电场中离子飞行时间与离子质量成反比,通过检测核酸分子在真空管中的飞行时间而获得样品分析物的精确分子量,从而检测出SNP位点信息。MassARRAY技术原理:•MassEXTEND单碱基延伸反应,紧挨SNP位点设计一段探针,在反应体系中以ddNTP替代dNTP,使探针仅在SNP位点处延伸一个碱基即终止。根据SNP位点的不同,探针将结合不同的ddNTP,从而具有不同的分子量,质谱仪即可检测出这种分子量差异,从而实现SNP分型的目的。用Taqman进行snp分析测序技术的发展•双脱氧末端终止法(Sanger测序法)–1970s同位素标记,手工–1980s荧光标记,自动–1990s毛细管电泳•合成测序法(第二代测序)–焦磷酸测序(Pyrosequencing,Roche/454)–合成测序(Sequencing-By-Synthesis,Illumina/Solexa)–连接测序(Sequencing-By-Ligation,ABI/SOLiD)•单分子测序技术(第三代测序)–Helicos–PacificBiosciences–OxfordNanoporeIonTorrent技术(半导体测序,非光学)32厂商RocheIlluminaABI技术454SolexaGASOLiD测序仪GS20FLXTiIIIIIx123序列数目(百万)0.50.51.252810025040115320单末端测序(Single-end)读长(bp)1002004003550100253550运行时间(天)0.250.30.4335658通量(Gb)0.050.10.515251416配对末端测序(Paired-end)读长(bp)2004002×352×502×1002×252×352×50库序列长度(kb)3.53.50.20.20.2332运行时间(天)0.30.461010121016通量(Gb)0.10.529502832Solexa和SOLiD配对末端测序所需时间和产出是单末端的两倍,454的配对末端和单末端差异在于建库方法,所需时间和测序量不变。ABISOLiD包含两张芯片,这里的数据是一张芯片的量。表1.1目前使用最广泛的三大第二代测序平台测序能力统计信息(2010年年初数据)个水稻基因组/天12个水稻基因组/天10个水稻基因组/天1994:3亿美元测定一个人类基因组(1:10)1984:30亿美元测定一个人类基因组未来目标:1000/100美元测定一个人类基因组2004:3千万美元测定一个人类基因组(1:100)2006:1百50万美元测定一个人类基因组(1:2000)2008:50万美元测定一个人类基因组(1:6000)遗传育种的应用•水稻遗传育种中的应用检测水稻SNP,研究优良性状与SNPs的关联关系,指导育种。•测序技术的发展为snp的发展提供了一个契机。•尤其是第三代测序技术的发展,特点:高通量,价格降低。•中种和大北农已经开始布局snp研究。谢谢!