微卫星DNA标记技术及其在遗传多样性研究中的应用摘要微卫星DNA的高突变率、中性、共显性及其在真核基因组中的普遍性,使其成为居群遗传学研究、种质资源鉴定、亲缘关系分析和图谱构建的优越的分子标记。本研究系统介绍了微卫星DNA在结构和功能上的特点,并对微卫星DNA标记技术应用的遗传学机理和一般方法进行了扼要的阐述。另外,本研究还探讨了微卫星DNA标记技术在遗传多样性研究中的应用现状,并进一步提出其发展前景。关键词:微卫星DNA;微卫星DNA标记;遗传多样性大量重复序列的存在是真核生物基因组的主要特点之一,而且这些重复序列的拷贝数可高达百万份以上。真核生物的基因组中,重复序列占有很大比重(>50%)。按照重复序列在染色体上的分布方式,分为散布重复和串联重复(VNTR)两种类型。散布重复序列的拷贝数很多,在重复单位之间彼此常有序列的变化,难以用做分子标记。串联重复序列根据重复单元数目的大小又分为卫星序列(satellites)、小卫星序列(mini-satellites)和微卫星序列(microsatellites)3种类型。其中,卫星序列的重复单元大,一般分布在染色体的异染色质区,采用分子标记系统来揭示其多态性有一定的困难;小卫星序列主要存在于染色体近端粒处,通常以15~75个核苷酸为核心序列,长度从几十到几千个碱基不等;微卫星序列一般较短,属于以1~6个核苷酸为基本单元的简单串联重复。微卫星DNA是真核生物基因组重复序列中的主要组成部分。微卫星DNA也称简单串联重复序列(SSRs)或简单串联重复序列多态性(STRP)。这些位点由非常短的串联重复DNA片段(1-5个碱基)组成。微卫星DNA最早是在人类基因组研究中发现的,它极其丰富,分布在整个基因组中[1]。人类基因组最普遍的微卫星是那些含有A、AC、AAAN、AAN或AG(这里N代表G、C或T)的序列。这5组重复序列大约占到人类基因组微卫星总量的75%。微卫星DNA序列在大多数的其它动、植物基因组中也先后被发现,并且通过聚合酶链式反应可以确定其类型[2]。(AT)n和(ATT)n是首先于大豆中发现的在不同的株系中长度有所不同的重复序列,它们也是第一个被定位的植物微卫星座位。Wang等[3]发现微卫星序列中所有的单、双和四核苷酸重复序列都分布在DNA非编码区,而含G-C碱基对的三核苷酸重复序列有57%位于编码区。微卫星重复序列在植物中出现的几率比动物中少得多。在植物中,约29kb中有20bp的微卫星序列[4],例如鹰嘴豆中(TAA)n、(GA)n和(CA)n序列在平均60kb的长度中出现于12000个位点上[5];而动物中,约每6kb中就有20bp的微卫星重复序列。另外,研究还发现植物中最丰富的微卫星是(A)n,其次是(AT)n,再次是(GA)n。Weber[6]将微卫星分为3类:完全重复(无间隔)、不完全重复(有非重复单位的碱基间隔)和复合重复(2个或更多重复单位彼此毗邻连续出现)。这些小的、串联排列的重复序列经常是通过核苷酸链的滑动错配或者其他未知的过程来改变它们的长度,从而导致微卫星在数量上的差异[7]。微卫星的突变率高:每代每个配子的每个位点有2.5×10-5~1×10-2突变,因此造成了它们的多态性。但微卫星周围的单拷贝序列一般不受其影响。Davierwala等对水稻及其近缘种利用(GATA)n和(AC)n微卫星两侧的序列合成的引物进行PCR扩增,再通过克隆、测序获得了大小不等的8个等位基因。测序分析的结果表明,不同等位基因的大小变异是由于微卫星重复数目的变异和微卫星两侧区域的序列的变异。尽管目前对这些重复序列的功能和起源还不清楚,但许多研究已经证明,重复序列可以作为种或基因组水平的遗传标记,是分子水平上研究遗传多样性的一个有力工具。微卫星序列的重复单位小,而且这些重复单位的序列差异和数目变化能够形成丰富的多态性,因此得到了广泛的应用。微卫星通常是复等位的,代表每个微卫星位点的等位基因数目高度可变。微卫星寡聚核苷酸的重复次数在同一物种的不同基因型间差异很大。另一方面,在每个微卫星DNA两端的序列多是相对保守的单拷贝序列,尤其在亲缘关系相近的物种间是保守的,因此可根据两端的序列设计一对特异的引物,然后利用PCR扩增每个位点的微卫星序列,经电泳比较扩增产物的长短变化,即可显示不同基因型的个体在每个微卫星DNA位点的多态性。进一步研究还发现,微卫星DNA是中性的,而且微卫星DNA标记呈共显性的孟德尔式遗传。它具有比其它分子标记(如等位酶、RFLP、RAPD等)更多的可检测等位基因,能够提供更细致的基因变化分析范围。该方法在居群遗传学研究中表现出很大的潜力。微卫星DNA具有高度多态性,同一遗传位点数目变化很大,并能在群体中形成多达几十种的等位基因,这是其他遗传标记所不能比拟的;此外,PCR技术的利用使微卫星标记技术实现操作自动化。微卫星作为遗传标记已使人类基因组的遗传制图和连锁分析发生了革命性的变化。至今,所建立的遗传图谱中已含有6000多个以微卫星DNA为主体的遗传标记,其平均分辨率为0.7cmol/L(里摩尔根),即2个位点之间有0.7%的几率可以重组。目前,微卫星标记系统是基因定位中研究最多的标记系统。2微卫星标记DNA技术的实践方法及发展通过PCR扩增并使用凝胶电泳分离产生大量含有微卫星DNA片段的方法有3种:(1)用在3’端或5’端被放射性标记的微卫星DNA引物做PCR;(2)用微卫星DNA两端的保守序列做PCR;(3)用被放射性标记的微卫星DNA引物和RAPD随机引物共同扩增含微卫星DNA的序列和随机序列。其中第2种方法最为普遍,它一般可分成4个步骤。①微卫星序列通常有2种途径:一是从基因组文库中获得含有微卫星的阳性克隆;一是通过检索Genbank、EMBL和DDBJ等DNA序列数据库,从互联网上获得含有微卫星的序列。前者获得微卫星DNA标记需要建立、筛选基因组文库和克隆测序等一系列实验,消耗大,工作量也大。而通过后者可以直接快速的获得微卫星标记,是对上一种途径的有效补充。②微卫星引物微卫星两侧的序列对于同一物种高度保守,因此可以使用与两侧保守的DNA序列相互补的方式设计特定的寡聚核苷酸引物。实验室中通常采用两种方式得到所需微卫星引物:可以通过检索所研究物种GeneBank等数据库查找带简单重复的DNA序列,用Primer0.5及MacVector6.0等软件设计引物;另外,也可以直接应用若干已发表的微卫星标记引物。在基因组内具有高度专一性的微卫星引物一般为18-24个核苷酸,(G+C)%含量接近50%-60%(Tm值为60℃左右),退火温度常在55℃-72℃下进行。研究表明提高退火温度可以增加引物与模板结合的特异性。特别在最初几次循环中采用严谨的退火温度,有助于PCR特异性扩增。其次,为了避免引物内二级结构的产生及某个核苷酸的连续出现,3’末端最好富含GC。③微卫星PCR扩增由于是特异性扩增,所以其重现性和稳定性相对较好。但是随着每对引物(G+C)%含量的不同和扩增片段长度的不同,与每对引物相对应的合适的扩增条件也不同。通常采用改变退火温度、缓冲液中Mg2+浓度及循环数等来获得清晰可靠的条带。④微卫星扩增产物检测微卫星经过PCR扩增所得产物在100~300bps之间,而且基因型间的差异仅为几个bps。因此一般采用3种方法进行分离:(1)高浓度(3%-4%)的琼脂糖凝胶电泳,利用溴化乙锭染色;(2)非变性聚丙烯酰胺凝胶电泳,利用银染法来检测,分辨率较高;(3)将PCR产物进行荧光标记(如FAM、TET、HEX等),然后经高温变性,在PEAppliedBiosystems310等遗传分析仪上利用毛细管电泳分离,并通过GeneScan和GenoTyper等软件进行分析。3微卫星DNA标记在遗传多样性研究中的应用保护生物多样性的核心内容就是保护生物的遗传多样性。遗传多样性是一个需要用种、变种、亚种或品种的遗传变异来衡量其内部变异性的概念。遗传多样性为物种和个体的适应及进化提供原材料。遗传多样性的保护实质上就是在基因和基因组水平上的保护。如果动植物的遗传多样性得不到应有的保护,一个物种的灭绝就意味着将有难以数计的遗传多样性的消失。伴着人类对自然资源的开发利用,自然生态系统被大面积破坏,加之环境污染等,使得物种灭绝的速度加快。物种多样性是人类赖以生存和发展的基础,评估物种受威胁程度以及是否已摆脱受威胁的状态必须建立在遗传多样性研究的基础上。建立濒危物种有效保护策略的一个首要条件就是在未受到广泛干扰前获得有关其遗传结构的知识。DNA是生物体内的遗传物质,因而它能更加直接的反映群体内及群体间的相关性。利用DNA分子标记技术可以有助于从本质上揭示物种遗传变异及其变异规律,预测物种的命运,从而制定相应的管理措施。Wyman和White于1980年提出了DNA指纹的概念,自此,DNA指纹分析成为遗传分子标记中的主要方法。而微卫星DNA标记技术是DNA指纹技术中极具潜力的分子标记,是目前最为先进的遗传标记系统之一。同时,对于植物种以下水平的研究,一方面要了解其中的遗传多样性水平和居群间的相互关系,另一方面还要统计分析居群的遗传结构、等位基因频率以及居群间的遗传分化等。因此,必须选择灵敏的分子标记,从而能够提供足够多的遗传信息,更重要的是所获得的信息要重复性好、可比性高、稳定可靠,且结果便于分析。微卫星DNA标记即是符合了这些要求的分子标记之一。由于微卫星DNA在1个位点上重复单位的数量在居群内和居群间可以产生有意义的改变,所以微卫星DNA标记技术受到居群遗传学家的普遍关注。在缺乏其它自然变异的特征时,微卫星等位基因频率的数据可以用来探讨解决亲缘关系、同源概率和居群结构等问题。微卫星标记在遗传多样性研究中,特别是在居群遗传学中的广泛使用已经形成了一个较为完整的体系。然而对于微卫星遗传分化的量化方法目前具有争议。在遗传多样性研究中通常使用统计学方法如遗传距离、聚类分析、PIC值、基因多样性等来做进一步分析和讨论。同时,为了提高对微卫星DNA标记量化分析的效率,还可以采用多对引物反应或多次点样的办法。参考文献:1TAUTZD.HypervariabilityofsimplesequencesasageneralsourceforpolymorphicDNAmarkers[J].NucleicAcidResearch,1989,17;6463-64712HAMADAH,PETRINOMG,KAKUNAGAT.AnovelrepeatedelementwithZ-DNA-formingpotentialiswidelyfoundinevolutionarilydiverseeukaryoticgenomes[J].Proc.Natl.Acad.Sci.USA.,1982,79:6465-64693WANGZ,WEBERJL,ZHONGG,etal.SurveyofplantshorttandemDNArepeats[J].Nature,1994,359:794-8014MORGANTEM,OLIVIERIAM.PCR-amplifiedmicrosatellitesasmarkersinplantgenetics[J].PlantJ.,1993,3:175-1825HUETTELB,WINTERP,WEISINGK,etal.Sequence-taggedmicrosatellitesitemarkersforchickpea(CicerarietinumL.)[J].Genome,1999,42:1-86WEBERJL.Informationofhuman(dC-dA)n(dG-dT)npolymorphisms[J].Genomics.,1990,7:524-5307LEVINSONG,GUTMANGA.Slipped-strandmispairing:amajormechanismforDNAsequenceevolution[J].Mol.Biol.Evol.,1987,4: