2013基因组学试题

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2013基因组学试题1.什么是基因组(5分)?真核生物基因组有什么特点(15分)?基因组是指一种微生物(包括细菌和病毒)或其它生物体细胞中的总DNA或RNA(是指逆转录病毒),包括核DNA,细胞器DNA(动植物线粒体DNA和植物叶绿体DNA)和染色体外遗传成分(如细菌的质粒DNA)。结构:真核生物基因组结构特点:真核基因组远远大于原核生物的基因组。真核基因具有许多复制起点,每个复制子大小不一。每一种真核生物都有一定的染色体数目,除了配子为单倍体外,体细胞一般为双倍体,即含两份同源的基因组。真核基因都出一个结构基因与相关的调控区组成,转录产物的单顺反子,即一分子mRNA只能翻译成一种蛋白质。真核生物基因组中含有大量重复顺序。真核生物基因组内非编码的顺序(NCS)占90%以上。编码序列占5%。真核基因产断列基因,即编码序列被非编码序列分隔开来,基因与基因内非编码序列为间隔DNA,基因内非编码序列为内含子,被内含子隔开的编码序列则为外显子。真核生物基因组功能相关的基因构成各种基因家族,它们可串联在一起,亦可相距很远,但即使串联在一起成族的基因也是分别转录的。真核生物基因组中也存在一些可移动的遗传因素,这些DNA顺序并无明显生物学功能,似科为自己的目的而级织,故有自私DNA之称,其移动多被RNA介导,也有被DNA介导的。功能:(一)真核基因表达调控的环节更多基因表达是基因经过转录、翻译、产生有生物活性的蛋白质的整个过程。同原核生物一样,转录依然是真核生物基因表达调控的主要环节。但真核基因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多的分量。此外,真核细胞中还会发生基因扩增(geneamplification),基因的扩增无疑能够大幅度提高基因表达产物的量,但这种调控机理至今还不清楚。(二)真核基因的转录与染色质的结构变化相关真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中NA和组蛋白的结构状态都影响转录,至少有以下现象:1.染色质结构影响基因转录2.组蛋白的作用3.转录活跃区域对核酸酶作用敏感度增加4.DNA拓扑结构变化5.DNA碱基修饰变化(三)真核基因表达以正性调控为主真核RNA聚合酶对启动子的亲和力很低,要依赖多种激活蛋白的协同作用。真核基因调控中有负性调控元件,但并不普遍;真核基因转录表达的调控蛋白是以激活蛋白的作用为主。真核基因组蛋白质编码的基因绝大多数是不连续的,采取逐个基因调控表达的形式。真核基因表达调控的环节多,录后调控的方式也很多1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。2.真核细胞基因转录产物为单顺反子。一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。3.存在重复序列,重复次数可达百万次以上。4.基因组中不编码的区域多于编码区域。5.大部分基因含有内含子,因此,基因是不连续的。6.基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。2.转录组和蛋白质组有何异同之处(10分)?转录组和基因组水平不同,转录组是高度动态的,当细胞受到侵犯时,甚至当细胞处于正常的生理活动如复制,分裂时,基因的转录情况也会变化很大,产生不同的转录组。mRNA是信使RNA,携带着从基因组转录下来的遗传信息,但并不是所有的基因都同时转录,是受转录因子控制的,而且并非所有基因组序列都能转录。原核生物中非转录成分较少,基因组序列利用效率较高,真核生物染色体存在大量非转录成分,一个基因转录形成的mRNA稳定性较差,转录的RNA原始产物要经过切割、修剪、添加、修饰和异构化形成成熟mRNA,tRNA和rRNA,其中内含子在mRNA拼接时被切除掉。通过选择性拼接,一个基因可以编码多条多肽链。正常的mRNA拼接发生mRNA内部,而在一些低等生物中还存在着奇怪的反转录(trans-splicng)现象,拼接发生在两条mRNA之间,即两条mRNA在剪接因子作用下,第一条剪接下来的外显子与另外一条剪接下来的外显子拼接在一起,编码一个新的多肽。转录组只研究mRNA转录组学研究的是某个时间点的mRNA总和,可以用芯片,也可以用测序。芯片是用已知的基因探针,测序则有可能发现新的mRNA,蛋白组学针对的是全体蛋白,组要以2D-Gel和质谱为主,分为top-down和bottom-up分析方法。理念和基因组类似,将蛋白用特定的物料化学手段分解成小肽段,在通过质量反推蛋白序列,最后进行搜索,标识已知未知的蛋白序列。蛋白质组(Proteome)的概念最先由MarcWilkins提出,指由一个基因组(genOME),或一个细胞、组织表达的所有蛋白质(PROTein).蛋白质组的概念与基因组的概念有许多差别,它随着组织、甚至环境状态的不同而改变.在转录时,一个基因可以多种mRNA形式剪接,一个蛋白质组不是一个基因组的直接产物,蛋白质组中蛋白质的数目有时可以超过基因组的数目.蛋白质组学(Proteomics)处于早期“发育”状态,这个领域的专家否认它是单纯的方法学,就像基因组学一样,不是一个封闭的、概念化的稳定的知识体系,而是一个领域.转录组是RNA转录后的全部产物,而转录后的产物经过加工修饰(例如甲基化、拼接、加尾等)后才变成蛋白质。相同之处就是他们的大部分结构相同。不同之处就是一个有加工过程,一个没有。3.简述遗传图谱的构建方法(5分),说明遗传图谱在基因组研究中的意义(10分)。答:遗传图谱:某一物种的染色体图谱(也就是我们所知的连锁图谱),显示所知的基因和/或遗传标记的相对位置,而不是在每条染色体上特殊的物理位置。采用遗传学分析方法将基因或其它DNA标记按一定的顺序排列在染色体上,这一方法包括杂交实验,家系分析。标记间的距离(遗传图距)用减数分裂中的交换频率来表示,单位为厘摩(Centi-Morgan,cM),每单位厘摩定义为1%交换率。遗传学图谱的解像度(分辨率)低,大约只能达到100万碱基对(1Mb)的水平。构建:采用遗传学分析方法将基因或其它DNA标记按一定的顺序排列在染色体上,这一方法包括杂交实验,家系分析。标记间的距离(遗传图距)用减数分裂中的交换频率来表示,单位为厘摩(Centi-Morgan,cM),每单位厘摩定义为1%交换率。作图群体的建立、分子标记的选择、结果统计与数据处理、绘制图谱通过遗传图谱,我们可以大致了解各个基因或DNA片断之间的相对距离与方向,如哪个基因更靠近着丝粒,那个更靠近端粒等。遗传图谱不仅是现阶段定位基因的重要手段,即使在人类基因组全物理图谱建立起来之后,它依然是研究人类基因组遗传与变异的重要手段。初步的连锁图谱是任何物种深入开展遗传学研究的基础,高密度连锁图谱可用于数量性状位点(quantitativetraitloci,QTL)的定位,分子标记辅助选择(markerassistedselection,MAS)和比较基因组作图。分子生物学方法帮助我们寻找DNA编码信息,但我们首先要知道,在哪里才能找到与目的性状相关的那段DNA.基因具有多效性,有些表型可能很难直接寻找其相关的DNA序列,遗传分析给我们提供了一个独立的、确定与遗传性状相关联基因的位置的方法。当关于一个基因的功能还处于假设阶段时,或者当某一特定表型与DNA的关联还处于推断状态时,遗传分析是唯一的手段4.什么是物理图谱(5分)?简述大片段文库的物理图谱如何构建(15分)?物理图谱(physicalmap)物理图谱是指有关构成基因组的全部基因的排列和间距的信息.它是通过对构成基因组的DNA分子进行测定而绘制的.绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来.DNA物理图谱是指DNA链的限制性酶切片段的排列顺序.即酶切片段在DNA链上的定位.DNA是很大的分子.由限制酶产生的用于测序反应的DNA片段只是其中的极小部分.这些片段在DNA链中所处的位置关系是应该首先解决的问题.故DNA物理图谱是顺序测定的基础.也可理解为指导DNA测序的蓝图.广义地说.DNA测序从物理图谱制作开始.它是测序工作的第一步.制作DNA物理图谱的方法有多种.构建物理图谱有哪些方法?遗传图谱与物理图谱的异同点?(20分)物理图谱:确定染色体DNA上诸如限制性内切酶切识别位点或序列标志位点(STSs)等的位置图,图距是物理长度单位,如染色体的带区、核苷酸对的数据等。物理图谱构建:1)提供排好的染色体DNA或全基因组DNA的顺序;2)提供一套密集的遗传标记和彼此间的精确距离。3)提供一套可以直接用于染色体DNA或基因组DNA测序的NDA样品。方法:原位杂交技术——细胞遗传学图谱直接将基因或遗传标记或文库克隆通过FISH定位在染色体上限制性酶切方法——限制图谱利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志之间物理距离〔碱基对(bp)或千碱基(kb)或兆碱基(Mb)〕的图谱STS容量法——序列标签位点图谱通过PCR或分子杂交将STS顺序定位在基因组的DNA区段中克隆的指纹连接法——连续的文库图谱1)构建一个基因组库。2)按照这些片段在完整的染色体中的顺序和位置来排列文库中的这些随机片段。“指纹识别”:包括将原始的克隆切割成更小的片段,然后用电泳法对这些片段根据尺寸进行排列。寻找克隆间重叠的指纹片段,以判定克隆间是否能够连接起来②最通常的物理图的构建方法是把限制酶切的DNA片段,按其次序排列连接起来。作图的技术路线基本上分两类:一类是由长到短作图,另一类则是由短到长作图。前者是将基因组DNA用切点很少的限制酶如NotI等完全田切,得到长约100—1000kb的DNA长(大)片段,估计每条染色体平均130个片段,按照片段上的标记把片段按次序排列,然后再把每一长片段酶切成短片段,再把短片段排列成序。这是由长到短的作图,图比较完整但分辨力低。后一类方法则是先将基因组DNA用限制酶作部份酶切,得到的短片段分别用酵母人工染色体(YAC)或粘粒(Cosmid)等作载体加以克隆,然后根据克隆片段两端共有的序列即重迭序列两两连接,逐渐延伸成长片段。这样作图的分辨力较高,但图不完整往往留有空缺。这是因为有些酶切产生的DNA片段太短,不易被克隆,以致在通过重迭序列把片段连接时出现中断。一组相互邻接的DNA片段的克隆称为邻接DNA片段组。这两个策略可以根据研究的需要选定。5.第二代DNA测序的原理是什么(5分)?不同基因组需要不同的测序策略,简要说明两种策略的特点(15分)。都需要费用更低、通量更高、速度更快的测序技术,第二代测序技术(Next-generationsequencing)应运而生。第二代测序技术的核心思想是边合成边测序(SequencingbySynthesis),即通过捕捉新合成的末端的标记来确定DNA的序列,现有的技术平台主要包括Roche/454FLX、Illumina/SolexaGenomeAnalyzer和AppliedBiosystemsSOLIDsystem。这三个技术平台各有优点,454FLX的测序片段比较长,高质量的读长(read)能达到400bp;Solexa测序性价比最高,不仅机器的售价比其他两种低,而且运行成本也低,在数据量相同的情况下,成本只有454测序的1/10;SOLID测序的准确度高,原始碱基数据的准确度大于99.94%,而在15X覆盖率时的准确度可以达到99.999%,是目前第二代测序技术中准确度最高的。虽然第二代测序技术的工作一般都由专业的商业公司来完成,但是了解测序原理、操作流程等会对后续的数据分析有很重要的作用,下文将以Illumina/SolexaGenomeAnalyzer测序为例,简述第二代测序技术的基本原理、操作流程等方面。2.基本原理Illumina/SolexaGenomeAnalyzer测序的基本原理是边

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功