一、简答题(任意选择其中1题回答,7分)1.假如你通过测序得到了小鼠的一个未知基因序列,如何才能确定该基因在小鼠基因组中的位置?如何获得其编码的蛋白质的序列?如何预测其编码产物的亚细胞定位?如果该基因编码1个膜蛋白,你又如何预测其序列上的跨膜区?1.首先对查询序列作如下处理:(1)给定单词(word)长度w(一般蛋白质为3,核酸为11)和打分矩阵,将长度为n的查询序列从第一位到最后一位拿到n-w+1个单词(2)创建一个单词列表,其中的单词为经与上述单词比对打分后分数高于T的长度为w的单词。(3)单词表中的单词称为种子(seed),将单词表中的每一个单词在所有的数据库序列中找到其出现的每一个位置。然后打开BLAST,选择nucleotideblast,输入处理了的序列,选择合适的数据库,选择相应的参数,包括目标序列数量,Wordsize,match/mismatchscores,等点击BLAST键,查看结果(基因的定位、功能等),在proteinID中找到其编码的蛋白质,点击FASTA,查看该蛋白质的氨基酸序列。其中在操作时有一些注意事项1、利用其他字母掩盖低复杂序列区域,防止假阳性的产生。2、用动态规划的方法沿左右两个方向延伸种子直到打分不低于某一个临界分值(允许暂时低于该值)。3、BLAST算法得到的结果的统计显著性分析:计算E-value。结果:E值:越低越好;序列比对得分Score:越高越好;高得分片段的相似度Identity:越高越好。2.你从实验中获得一条由250个氨基酸组成的蛋白质的序列。你想了解该蛋白质的三维结构是否已知。根据你从本课程中学到的知识,该如何寻找答案?SWISS-model:同源建模方法预测蛋白质结构。一般由四步完成。1。从待测蛋白质序列出发,搜索蛋白质结构数据库(如PDB,SWISS-PROT等),得到许多相似序列(同源序列),选定其中一个(或几个)作为待测蛋白质序列的模板;2。待测蛋白质序列与选定的模板进行再次比对,插入各种可能的空位使两者的保守位置尽量对齐;3。建模:调整待测蛋白序列中主链各个原子的位置,产生与模板相同或相似的空间结构——待测蛋白质空间结构模型;4。利用能量最小化原理,使待测蛋白质侧链基团处于能量最小的位置。具体操作:打开BLAST,选择UniprotBLAST,输入氨基酸序列,选择蛋白质数据库,点击BLAST键,查看结果(蛋白质信息),查看蛋白质是否具有三维机构数据,若有则找到PDB中的标识符,利用它找到蛋白三维结构,若无则利用该蛋白的氨基酸进行蛋白三维结构预测。二、论述题(任意选择其中2题回答,每题9分,共18分)1.以细胞分化或疾病发生发展为模型,从遗传信息流动的角度谈谈基因组是如何解码的,其中有哪些地方值得我们研中心法则及其补充内容告诉了我们遗传信息的流动方向。过程包含了如下6点:DNA的复制,遗传信息流动方向由DNA→DNA;DNA的转录,遗传信息流动方向由DNA→RNA;翻译,遗传信息流动方向由RNA→蛋白质;RNA的复制,遗传信息流动方向由RNA→RNA;RNA的逆转录,遗传信息流动方向由RNA→DNA;蛋白质的复制,遗传信息流动方向由蛋白质→蛋白质.其中任何一个环节出现了问题,都可能引起疾病的发生,比如着色性干皮病(DNA水平),表皮细胞中的DNA在紫外光下会受到破坏,,着色性干皮症患者细胞内通常有一种酵素无法运行,导致皮肤丧失修复能力。或者疯牛病(蛋白质水平),其由于致病Prion蛋白空间折叠出现了问题从而引起疯牛病,还有很多由于蛋白质折叠异常而造成分子聚集甚至沉淀或不能正常转运到位所引起的疾病还有老年性痴呆症、囊性纤维病变、等等。这其中的很多小环节出现了问题都可能造成巨大的影响,但同样给了我们治疗疾病的新思路,即从遗传信息流动的途径的环节入手,即使改变一个小小的基因,蛋白都可以引起个人表型的改变,从而治愈疾病。2.试述核受体配体依赖性转录激活机制。核受体家族由A/B,C,D,E四大具有不同功能的结构域组成。A/B域的N端接受配体非依赖的顺式激活,C端调节该核受体与其他家族成员的结合从而影响核受体与DNA的结合,还与核受体对目标DNA的选择有关;保守的C域决定DNA结合活性,是核受体的特征性区域,同时影响核受体对其伴侣核受体的选择;D域为一可弯曲的铰链区,带有核定位的信息,并连接C与E两区域;E域能够与配体结合,二聚体化并被激活,发挥转录因子的作用调控下游靶基因转录。细胞核内,核受体通过三种基本的作用模式调节基因转录:1,核受体与其伴侣转录因子的二聚体受到其配体亲脂性小分子激活后结合至靶DNA的靶序列从而调节转录;2,该二聚体受到配体激活后招募其他转录因子,通过其他转录因子与靶DNA的靶序列结合调节转录;3,该二聚体受到细胞表面受体或CDK蛋白激酶的激活而与靶DNA的靶序列结合调节转录。此外,最新研究发现核受体能够与胞浆蛋白发生相互作用,提示其可能具有转录因子之外的功能。核受体与相应的配体结合后同细胞内的辅助激活因子CBP/P300、PCAF、P/CIP和SRC家族等结合形成的复合物能使组蛋白乙酰化促进基因的转录,1.其与激动剂结合,使受体改变自身配体结合结构域构象用于募集co-activators,从而使受体与基础转录器更加有效并激活转录。2.显著增加受体的反式激活作用而不刺激基础转录活性;过表达时,可特意的反转不同受体间的相互抑制;必须含有自发的可转移激活域。3..在营养缺乏情况下胚胎成纤维细胞停止分裂,甚至发生自噬以及死亡。据文献报道,蛋白A可能诱导了细胞周期的阻滞,请设计实验探索该蛋白在调控细胞周期或细胞凋亡方面的作用。细胞周期研究策略和方法:有丝分裂摇落法:得到M期细胞化学同步法:DNA合成阻断,同步于S期;中期阻断法,同步于M期。免疫组化、westernblot:检测参与细胞周期调控的蛋白质Brdu掺入实验:鉴别S-期细胞显微注射:(在高倍倒置显微镜下,利用显微操作器(Micromanipulator),控制显微注射针在显微镜视野内移动的机械装置,用来进行细胞或早期胚胎操作的一种方法)细胞融合:细胞核和细胞质对细胞周期进程的影响细胞凋亡的研究方法和策略:形态学检测:染色(HE染色、吖啶橙荧光染色、细胞骨架染色)、光镜观察、扫描电镜观察、投射电镜观察。DNA琼脂糖凝胶电泳(琼脂糖凝胶电泳是用琼脂糖作支持介质的一种电泳方法。其分析原理与其他支持物电泳最主要区别是:它兼有“分子筛”和“电泳”的双重作用。)tuneltechnique(DNA原位末端标记-tunel法染色)彗星电泳(包括测定DNA双链断裂的中性单细胞凝胶电泳技术和测定DNA单链断裂的碱性单细胞凝胶电泳技术)流式细胞检测(是一种在功能水平上对单细胞或其他生物粒子进行定量分析和分选的检测手段,它可以高速分析上万个细胞,并能同时从一个细胞中测得多个参数,与传统的荧光镜检查相比,具有速度快、精度高、准确性好等优点,成为当代最先进的细胞定量分析技术)目的:探究蛋白A是否影响细胞周期或细胞凋亡方法:1、利用设计并构建蛋白A相关Sirna干扰胚胎成纤维细胞蛋白A的表达,抑制其表达水平,培养过后采用流式细胞技术检测胚胎成纤维细胞的细胞周期分布以及凋亡水平,与同条件下培养的正常胚胎成纤维细胞比较,若试验组与对照组相比细胞周期阻滞或者凋亡减少,说明蛋白A对细胞阻滞与细胞凋亡起促进作用。2.利用设计病毒使胚胎成纤维细胞蛋白A基因过表达,提高其蛋白表达水平,培养过后采用流式细胞学技术检测胚胎成纤维细胞的细胞周期分布以及凋亡水平,与同条件下培养的正常胚胎成纤维细胞比较,若试验组与对照组相比细胞周期阻滞或者凋亡增加,说明蛋白A对细胞阻滞与细胞凋亡起促进作用。6.新基因产生的7种途径。1.①基因复制(Geneduplication,或称基因倍增),到目前为止,最重要和最普遍认为的产生新基因拷贝的方式就是基因倍增,其速率是0.01/基因/百万年。其可以分为3类,1.整个基因重复,2.部分基因重复,3单个基因重复。其中非整个基因重复是通过不对称交换,姐妹染色体之间的不等交换,DNA放大实现的。2.②结构域混排domainshuffling。来自于不同基因的两个或者多个结构域能够被异常得拼接在一起从而产生新的嵌合结构并表达新的功能。其主要是通过非常规重组和后移区域插入实现的。3.③基因水平转移genehorizontaltransfer,,当一个基因在两个不同的个体间转移时候,就发生了基因的水平转移,经常发生在原核生物之间。其载体包括噬菌体,质粒,整合子,转座子,基因组岛4.④逆转座Retroposition。在基因组内存在着通过DNA转录为RNA后,再经逆转录成为cDNA并插入到基因组的新位点上的因子,被称为逆转座子(retrotransposons)。逆转座作用的关键酶为逆转录酶和整合酶。5.⑤基因融合/分裂genefusion/genefission。两个相邻的基因能融合成一个基因,一个基因也可以分裂成两个基因,其在原核生物里面更常见(0.5%),基因融合在真核生物里更常见。6.⑥从头起源denovoorigination。一个编码区域从一个目前已知的非编码区起源,在整个基因起源是罕见的。比如果蝇精子特异的动力蛋白中间链基因sadic。7.可动元件(mobileelement),一个可移动的元件,也被认为是转座元件(TE),其片段可以被宿主基因直接获取。8.混合机制:新基因可以通过上述机制产生,既可以是单个机制在起作用,也可以是多种机制的共同作用。基因注释和功能元件表型(phenotypes):生物体可观察的所有特性(特显、性状、特征)的总和,受到基因型和环境的影响。(疾病也是一种表型)•人类基因组的结构和特点•结构:•2%的基因组编码蛋白基因•非编码蛋白基因:非编码RNA(rRNA,tRNA,miRNA),结构序列(核骨架附着区),调控序列、无功能的“junk”•基因和功能性元件的概念更新•编码蛋白基因:开放阅读框(ORF),密码子偏倚,转录和翻译起始与终止模体,在内-外含子边界拼接共有序列•编码蛋白基因的预测确认:与之前注释的cDNA匹配,同生物中EST匹配,GenBank中有核苷酸或概念上转录蛋白序列的相似,蛋白结构预测与PFAM结构域匹配,有可识别的启动子序列,在突变位点知道其表型•非编码蛋白基因的发现:二级结构;同源性;实验•功能性元件:•ENCyclopediaofDNAElements(ENCODE)•Decodingthegenome:正向遗传学(表型-基因型),反向遗传学(基因型-表型,转/敲基因动物、ENCODE计划)•基因密度:碱基占Ensembl数据库基因或UCSCbrowser数据库人类mRNA最好的BLAT平面图的百分比。基因组注释(Genomeannotation)是利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释,是当前功能基因组学研究的一个热点。基因组注释的研究内容包括基因识别和基因功能注释两个方面。基因识别的核心是确定全基因组序列中所有基因的确切位置。从基因组序列预测新基因,现阶段主要是3种方法的结合:(1)分析mRNA和EST数据以直接得到结果;(2)通过相似性比对从已知基因和蛋白质序列得到间接证据[1];(3)基于各种统计模型和算法从头预测。对预测出的基因进行高通量功能注释可以借助于以下方法,利用已知功能基因的注释信息为新基因注释:(1)序列数据库相似性搜索;(2)序列模体(Motif)搜索;(3)直系同源序列聚类分析(Clusteroforthologousgroup,COG)[2]。随着微生物全基因组序列测定速率的加快,开发有Web接口的高效、综合基因组注释系统十分必要。基因组功能元件包括编码蛋白基因,非编码蛋白基因,调控区域,染色体结构维持和调节染色体复制动力DNA元件,到目前为止,ENCODE计划主要集中研究了44个靶标,共3000万个DNA碱基对,ENCODE计划推翻了传统观点,即我们的基因组蓝图作为一群独立的基因,漂浮在“垃圾基