基因组学课程论文题目:植物基因组学的的研究进展姓名:秦冉学号:113160401植物基因组学的的研究进展摘要:随着模式植物——拟南芥和水稻基因组测序的完成,近年来关于植物基因组学的研究越来越多。本文主要对拟南芥、水稻2种重要的模式植物在结构基因组学、比较基因组学、功能基因组学等领域的研究进展以及研究所使用的技术方法进行简单介绍。关键词:植物;基因组学;研究进展TherecentprogressinplantgenomicsresearchAbstract:Withthecompletionofgenomesequencingofthemodelplant--Arabidopsisandrice,moreandmoreresearchesonplantgenomicsemergeinrecentyears.Theresearchprogressofthe2importantmodelplant--Arabidopsisandriceinstructuralgenomics,comparativegenomics,functionalgenomicsandtechnologymethodsusedinthisresearchareintroducedbrieflyinthispaper.Keywords:plant;genomics;researchadvances前言基因组是1924年提出用于描述生物的全部基因和染色体组成的概念。1986年由美国科学家ThomasRoderick提出的基因组学是指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录本图谱)、核苷酸序列分析、基因定位和基因功能分析的一门科学。自从1990年人类基因组计划实施以来,基因组学发生了翻天覆地的变化,已发展成了一门生命科学的前沿和热点领域。而植物基因组研究与其他真核生物和人类基因组研究有很大的不同。首先,不同植物的基因组大小即使在亲缘关系非常近的种类之间差别也很大;其次,很多植物是异源多倍体,即便是二倍体植物中有些种类也存在较为广泛的体细胞内多倍化(endopolyploidy)现象[1]。基因组研究主要包括三个层次:①结构基因组学,以全序列测序为目标,构建高分辨率的以染色体重组交换为基础的遗传图谱和以DNA的核苷酸序列为基础的物理图谱。②功能基因组学,即“后基因组计划”,是结构基因组研究的延伸,利用结构基因组提供的遗传信息,利用表达序列标签,建立以转录图谱为基础的功能图谱(基因组表达图谱),系统研究基因的功能,植物功能基因组学是当前植物学最前沿的领域之一。③蛋白质组学,是功能基因组学的深入,因为基因的功能最终将以蛋白质的形式体现。近来,以水稻(Oryzasativa)和拟南芥(Arabadopsisthaliana)为代表的植物基因组研究取得了很大进展,如植物分子连锁遗传图谱的构建,在此基础上,已经在植物基因组的组织结构和基因组进化等方面得到了有重要价值的结论;植物基因组物理作图和序列测定的研究集中于拟南芥和水稻上;植物比较基因组作图证实在许多近缘植物甚至整个植物界的部分染色体区段或整个基因组中都存在着广泛的基因共线性,使得我们可以利用同源性对各种植物的基因组结构进行研究、分析和利用。本文主要对拟南芥、水稻2种重要的模2式植物在结构基因组学、功能基因组学、比较基因组学等研究领域的研究进展进行归纳总结。1拟南芥基因组学的研究1.1拟南芥结构基因组学研究美国自1990年启动“植物基因组学”计划,2000年底公布了模式植物拟南芥的全部序列。通过分析基因组序列能够获得基因结构的完整信息,如基因在染色体上的排列顺序,基因间的间隔区结构,启动子的结构以及内含子的分布等。Bevan[2]对拟南芥第四染色体上1.9Mb的片段进行了全序列测定.结果发现:平均每4.8Kb就有一个基因存在;54%的基因与GenBank中的基因具有同源性;约20%的基因在该染色体片段上以基因家族的形式存在;该染色体片段上共发现五种重复序列成分,约占所测序列的19%左右:分别为:非编码区中的重复序列、逆转座子成分、叶绿体DNA片段、散布重复的基因家族成员和串联重复的基因家族成员。高等植物中,拟南芥的基因组最小且具有很少的重复DNA序列,快速复性序列仅占整个基因组的10%左右.两种相关的串联重复序列(180bp和500bp)都定位于拟南芥染色体的中心粒异染区.另一类串联重复序列(160bp)定位于染色体的中部.第四种高度重复序列是端粒序列.在拟南芥的1号染色体中心粒区的一个串联重复中发现了一个退化的端粒序列,紧接该序列是一个在遗传作图时有五个位点的重复单元,rDNA的重复单位大小约为10Kb,约占整个核基因组的8%左右。5SrRNA的编码基因是以497bp为重复单位的串联重复序列,约占基因组的0.7%[3]。在拟南芥中还鉴定出了类似逆转座子的成分)Ta1和其相关家族以及转座因子Tat1和Tag1,它们都相对具有较低的拷贝数。在拟南芥的突变体中已经鉴定出了多个遗传标记位点,包括RFLP、PAPD、SSR等标记。已经发展了两套重组近交系作图群体,利用这些作图群体,已经构建了高密度的拟南芥分子标记遗传连锁图谱。拟南芥物理作图利用粘粒载体,YAC(YeastArtificialChromosome)载体进行,已经完成了拟南芥高密度物理图谱的构建。在拟南芥中已利用图位克隆的方法克隆了许多基因[4-5]。1.2拟南芥功能基因组学研究2001年开始,美国全面启动2010年计划,目标是到2010年确定拟南芥中所有基因的功能。中国国家自然科学基金委员会已于2001年快速启动“拟南芥全部转录调控因子蛋白组学研究”重大国际合作研究项目,2004年3月,研究取得了重要进展:共克隆了44个拟南芥转录调控因子家族中的1282个基因,获得了拟南芥所有已知和预测的1864个转录因子的序列,利用cDNA(互补DNA)微阵列芯片,检测了拟南芥幼苗的转录因子在光调控下的表达,所有表达的基因占整个转录因子的84%,并通过蛋白质表达实验验证已克隆的拟南芥转录调控因子融合基因中85%以上有一定量的蛋白质表达。与基因组的全序列测定同时进行的拟南芥表达序列标签(expressedsequencetags)计划也已取得巨3大进展。据网站发布的信息表明,至2002年中期拟南芥的ESTs标记数已达174625个。EST计划的不足在于随机测序难以得到那些低丰度表达的基因和在特殊环境条件下(如生物胁迫或非生物胁迫)诱导表达的基因。为了弥补不足,进行基因组全序列测定。通过分析基因组序列能够获得基因结构的完整信息,如基因在染色体上的排列顺序,基因间的间隔区结构,启动子的结构以及内含子的分布等。拟南芥基因组全序列测定的完成对整个植物科学具有重要的意义,例如:可以用于比较分析真核生物中的转录调节因子。拟南芥中约有超过5%的序列编码1500多种转录调节因子,其中45%是植物特有的。拟南芥中属于所有真核生物共有的转录调节因子,在其保守的DNA结合结构域上并不完全与其它真核生物相同,大多数以其特异的线型组合排列。2水稻基因组学的研究2.1遗传图谱水稻是已知的单子叶植物中基因组最小的植物之一,基因组大小为450Mb,共有12条染色体。自1988年MeCoueh等[6]利用IR34583(籼)×BuluDalam(爪哇)的F2群体构建了第一张水稻分子连锁图谱(含135RFLP标记)以来,高密度的图谱相继产生。近年来,随着分子遗传学的迅速发展,国际水稻基因组测序计划(InternationalRiceGenomeSequencingProject,IRGSP)成员国以Nipponbare、Kasalath、IR64和Azucena等水稻品种为材料,构建了10个饱和的遗传图谱并与表型的标记进行了整合,以创造新的遗传资源。1998年,Harushima等[7]构建了一张高密度水稻遗传连锁图,包含2275个遗传标记,覆盖水稻基因组1521.6cM。2001年RiceGenomeProgram(RGP)公布了包含3267个RFLP分子标记的水稻分子连锁图。还利用次级三体和终级三体(telotrisomics)将经典遗传图和分子遗传图中的着丝粒位置确定,修正了分子图谱的方向,把RFLP标记定位到特定的染色体臂上;Wu等[8]构建了水稻第11和第12染色体短臂末端重复基因组区域的图谱,重复基因组区域大小是2.5Mb,表明水稻也存在大染色体片段的重复区域。上述遗传图谱在基因定位、物理图谱的构建和基因测序中发挥了或即将发挥巨大作用。2.2物理图谱由于遗传图的精确性较低、分辨率有限,而物理图是对遗传图的进一步深化,并能直接应用于图位克隆技术分离目的基因[9-10]。1998年,Umehara等[11]构建了水稻第一张物理图谱,共筛选到5701个YAC,其中2117个单一YAC分配到12条染色体上,跨度216Mb,覆盖水稻基因组的50%。接着日本水稻基因组计划(RGP)开始将YAC重叠群(contig)分解成粘粒(cosmid)DNA克隆,构建更精细的物理图谱。2001年,RGP还构建了一个覆盖270Mb(全基因组的63%的YAC文库的物理图,由6934个YAC组成,插入片段平均长度为350kb。由于YAC克隆不太稳定、插入DNA难以分离、转化效率低等原因,美国Clemson4大学基因组研究(ClemsonUniversityGenomicsInstitute,CUGI)又建成了两个BAC库,一个是由37000个Hindm酶切的BAC文库,插入片段平均长度为128.5kb;另一个是有56000个克隆的EcoR工BAC库,插入片段平均大小为120kb,两者覆盖水稻基因组的26倍。2001年,RGP为了克服YAC克隆的局限性,又以PAC为载体构建了水稻Nipponbare基因组文库,此文库由72000个Sau3AI酶切克隆组成,平均插入片段长120kb,覆盖水稻基因组的16倍。,国际水稻基因组测序计划(IRGSP)已于2002年12月宣布,利用克隆连克隆(逐步克隆)测定法(clonebyclonesequencing),提前3年完成了水稻12条染色体的碱基测序工作。日本在其中发挥着主导作用,并最先以99.99%的精度完成了最长的第1条染色体的测序工作。另外,中国12家单位,于1998年至2001年利用全基因组霰弹法(whole-genomeshotgunsequencing,WGS),构建了籼稻93—11基因组工作框架图和低覆盖率的培矮64S草图,并最先向全世界公布了水稻93—11全基因组框架图。随后,美国先正达(Syngenta)公司也完成了日本晴基因组工作框架图的测序。两个框架图同时发表在2002年4月的《Science》第296期第79~99页,它们都是对IRGSP的补充。水稻基因组框架图和全长序列的精确测定虽已基本完成,但片段之间或重叠群之间仍存在一些缺口或空隙(gap),如籼、粳两个亚种的基因组工作框架图分别覆盖了水稻全基因组的95.29%和93%,碱基准确率约99%。当前基于物理图精确测序的图谱研究表明[12-13],水稻“日本晴”全基因组己获得372.1Mb的高质量精确序列,余下的5%分布于12条染色体上的38个间隙(gaps)、10个着丝粒和10个端粒处;水稻全基因组预测有56278个基因位点,因为6498个基因位点编码10432个转录本,所以总转录本为66710;如果去除15236个转座因子相关的蛋白编码基因后,共有41042个基因位点编码非转座因子相关的蛋白,平均9.4kb含一个基因,其中约29%的基因成族出现,约71%与拟南芥基因(Arabidopsis,28000-29000个基因)享有同源性(反过来,约90%的拟南芥基因与水稻基因享有同源性)。31439个基因位点已经得到ESTs序列、全长cDNA序列、Tiling芯片检测、大规模平行测序(massivelyparallelsig.Naturesequencing,