BAG-TJU人工基因组的设计与合成李炳志bzli@tju.edu.cn2013-04SyntheticYeast2.0•Buildingtheworld‘sfirstsyntheticeukaryoticgenometogether!Dr.JefBoekeBAG-TJU第九章人工合成酵母基因组李炳志bzli@tju.edu.cn2013-04BAG-TJU§1酿酒酵母简介§2酿酒酵母基因组结构特点§3酵母基因命名法§4人工设计基因组的原则§5人工合成基因组的技术第九章人工合成酵母基因组BAG-TJU§1酿酒酵母简介•酵母(Yeast)是一类种类繁多的生物资源,已知有80个属约600多种,数千个分离株。•酵母是一类单细胞的真核生物。–它有完整的亚细胞结构和控制严密的基因表达调控机制。–它既能通过有丝分裂进行无性繁殖–也可以通过减数分裂实现有性繁殖。BAG-TJU§1酿酒酵母简介•酿酒酵母(Saccharomycescerevisiae)–域:真核域–界:真菌界–门:子囊菌门–纲:半子囊菌纲–目:酵母目–科:酵母科–属:酵母属–种:酿酒酵母BAG-TJU§1酿酒酵母简介•酿酒酵母(Saccharomycescerevisiae)–又称面包酵母或者出芽酵母。–在现代分子和细胞生物学中用作真核模式生物。•Morganism–发酵中最常用的生物种类。–细胞为球形或者卵形,直径5–10μm。–同时存在单倍体和双倍体(酵母的优势形态)。BAG-TJU§1酿酒酵母简介•酿酒酵母(Saccharomycescerevisiae)–芽殖(Budding):正常繁殖方式BAG-TJU§1酿酒酵母简介•酿酒酵母(Saccharomycescerevisiae)–芽殖(Budding):正常繁殖方式BAG-TJU§1酿酒酵母简介•酿酒酵母(Saccharomycescerevisiae)–有性繁殖:子囊孢子•单倍体可以交配,重新形成二倍体•酵母有两种交配类型,称作a和αBAG-TJU§1酿酒酵母简介•酿酒酵母(Saccharomycescerevisiae)酵母细胞生活史BAG-TJU§1酿酒酵母简介•酿酒酵母(Saccharomycescerevisiae)–最符合基因表达的宿主,因此被最早成为基因表达系统的宿主。–已广泛被用来表达各种各样的外源基因。•用酿酒酵母表达的乙型肝炎疫苗(Merck公司),人胰岛素(Novo-Nordisk公司)和人粒细胞集落刺激因子(Immunex公司)都已成为正式上市的基因工程产品。–合成生物学:“细胞工厂”“底盘细胞”BAG-TJU•酿酒酵母是1996年完成全基因组测序,第一个完成基因组测序的真核生物。•酿酒酵母的基因组包含大约1200万碱基对,分成16组染色体,共有6275个基因,其中可能约有5800个已知功能基因。§2酿酒酵母基因组结构特点BAG-TJU•酿酒酵母的单倍体细胞含16条染色体,总长度为12Mb,其中第I条最短,第IV条最长。•基因组中没有明显的操纵子结构,有间隔区和内含子。•酿酒酵母染色体基因组中,ORF大约占整个基因组的70%基因间平均间隔为600bp。•酿酒酵母中约4%编码蛋白质的基因含有内含子。§2酿酒酵母基因组结构特点BAG-TJU§2酿酒酵母基因组结构特点BAG-TJU§2酿酒酵母基因组结构特点BAG-TJU•染色体结构§2酿酒酵母基因组结构特点BAG-TJU•着丝粒centromere–染色体中将两条姐妹染色单体结合起来的区域,由无编码意义的高度重复DNA序列组成。–一般位于染色体的主缢痕或染色体端部,使姐妹染色单体连在一起。•着丝粒种类–短着丝粒(点着丝粒):约200bp•酵母–区域着丝粒:序列较长(从40kb至几Mb),含有很多重复序列§2酿酒酵母基因组结构特点BAG-TJU•酵母着丝粒§2酿酒酵母基因组结构特点在酿酒酵母中,所有染色体的CEN序列的长度均大于130bp,由5’→3’依次分为CDE-I、CDE-II和CDE-III。BAG-TJU•端粒Telomere–真核细胞内线性染色体末端的一种特殊结构,由DNA简单重复序列以及同这些序列专一性结合的蛋白质构成–在大多数生物中,端粒DNA只由几个碱基组成的DNA重复单位通过串联重复而形成的,长度从20bp至几kb不等。–酿酒酵母端粒DNA长约为300bp,其重复单位为•5’C1-3A•3’G1-3T§2酿酒酵母基因组结构特点BAG-TJU•复制起点–酵母的复制起点是指染色体上控制DNA复制起始的一小段DNA序列,通常称为自主复制序列(ARS,autonomouslyreplicatingsequence)。–自1979年首次发现酿酒酵母的ARS以来,已在酿酒酵母中发现约有400个ARS,但这些ARS使用频率不同,差异十分巨大。§2酿酒酵母基因组结构特点BAG-TJU•自主复制序列ARS的结构–酿酒酵母中,ARS是长度为100-200bp、富含AT的DNA片段。–根据其在质粒中的稳定性,可将ARS分为A、B、C三个结构域,其中A和B最为重要。•A区:由11bp核苷酸(A/T)TTTAT(A/G)TTT(A/T)组成的保守序列,即ARS共有序列。•B区:位于ARS的3'末端,长度约80bp。•C区:结构域位于ARS的5'末端,这一结构域也是富含AT,但C结构域之间不具有同源性,也不含共有序列。§2酿酒酵母基因组结构特点BAG-TJU•不同物种基因/蛋白命名法并不相同–大肠杆菌:hisG–人类:p38–酵母:URA3•酿酒酵母基因名称–系统名:基因在染色体上的位置–标准名(StandardName):基因功能描述§3酵母基因命名法BAG-TJU•酿酒酵母基因命名原则–URA3基因系统名:YEL021W标准名:URA3(URAcilrequiring)§3酵母基因命名法Yeast第V号染色体上左臂BAG-TJU•酿酒酵母基因/蛋白质书写原则–基因名需要斜体•细胞中存在该基因:大写斜体URA3•细胞中该基因缺失:小写斜体ura3或ura3△•细胞中该基因突变:小写斜体带编号ura3-1–蛋白名称为正体•大写正体:URA3•首字母大写,后两位小写:Ura3•首字母大写,后两位小写,最后加p:Ura3p§3酵母基因命名法BAG-TJU•酿酒酵母基因/蛋白质书写原则–实验室常用酵母野生型菌株•BY4741:MATa;his3△;leu2△;met15△;ura3△•BY4742:MATα;his3△;leu2△;lys2△;ura3△•BY4743:MATa/α;his3△/his3△;leu2△/leu2△;lys2△/LYS2;MET15/met15△;ura3△/ura3△•W303a:MATa;leu2-3112;trp1-1;can1-100;ura3-1;ade2-1;his3-11,15§3酵母基因命名法BAG-TJU•酿酒酵母基因信息查询–SGD:§3酵母基因命名法BAG-TJU•如何确定酵母基因的ORF?–起始密码子:ATG–终止密码子:UAG,UAA,UGA§3酵母基因命名法酵母基因组的ORF平均长度为1450bp即483个密码子,最长的是位于XII号染色体上的一个功能未知的ORF(4910个密码子),还有极少数的ORF长度超过1500个密码子。酿酒酵母基因功能标注:SC1.0计划BAG-TJU§4人工设计基因组原则§4.1人工改造原理§4.2删除与移位§4.3替换§4.4引入新序列§4.5SCRaMbLE!BAG-TJU§4.1人工设计基因组原则•利用密码子简并性实现Elements删除换位替换引入不变RetrotransposonstRNAgenesTAGstopcodonsreplacedbyTAALoxPSymsitesGeneorderSubtelomericrepeats(Y’&X’)IndividualsynonymouscodonsNoncodingregionsIntronsPCRTagsBAG-TJUBAG-TJU§4.1人工改造基础BAG-TJU§4.2删除与移位•基本理念:–优化基因组,减少不稳定和冗余结构•删除–逆转录转座子–端粒重复部分–内含子•移位–tRNA基因BAG-TJU§4.2删除与移位•删除–逆转录转座子•目前推测这类重复序列并非必需部分•还会引起染色体不稳定–亚端粒重复部分(Subtelomericrepeats)•有两类,X’和Y’(无功能)•引起端粒沉默或染色体分离•Y’全部删除,X’用更优化的序列取代–内含子BAG-TJU§4.2删除与移位•移位–tRNA基因–在基因组中高度冗余的一类基因•共计275个tRNA基因•仅有47种tRNA•这些冗余基因会造成染色体不稳定–从各个染色体上剔除,专门放在一个新染色体上BAG-TJU§4.3替换•基本理念:–将酵母基因组打造得更便于今后人工操作•终止密码子替换•PCRTags•部分同义密码子替换BAG-TJU§4.3替换•终止密码子替换–将TAG替换为TAA•在正常情况下这两者均将转录为终止密码子–有研究小组构建了一种新型tRNA•当细胞中表达该新型tRNA的基因•TAA将不再作为终止密码子•翻译将继续下去Isaacs,F.J.etal.Precisemanipulationofchromosomesinvivoenablesgenomewidecodonreplacement.Science333,348–353(2011).BAG-TJU§4.3替换•PCRTagsBAG-TJU§4.4引入新序列•必需基因(essentialgene):–一些基因在突变时会引起致死表型,这些基因被称为必需基因。张春霆院士生物信息学家天大理学院建立了酵母必需基因库BAG-TJU§4.4引入新序列•非必需基因:–非必需基因≠可以随意缺失的基因–同时缺多个非必需基因也有可能致死–能减到多小?•“最小基因组”•“精简基因组”•“精简基因集”BAG-TJU§4.4引入新序列•在每个非必需基因前后加入了特殊序列–LoxPSymsites•Cre-LoxP重组酶系统–特异性删除某特定序列的技术–在新型基因打靶中获得广泛应用,是条件性基因打靶、诱导性基因打靶、时空特异性基因打靶策略的技术核心。BAG-TJU§4.4引入新序列•Cre-LoxP重组酶系统–Cre重组酶•于1981年从P1噬菌体中发现,基因编码区序列全长1029bp。•一种位点特异性重组酶,能介导两个LoxP位点(序列)之间的特异性重组,使LoxP位点间的基因序列被删除或重组。BAG-TJU§4.4引入新序列•Cre-LoxP重组酶系统–LoxP(locusofX-overP1)序列:•来源于P1噬菌体•有两个13bp反向重复序列和中间间隔的8bp序列共同组成,8bp的间隔序列同时也确定了LoxP的方向。•13bp的反向重复序列是Cre酶的结合域。BAG-TJU§4.4引入新序列•Cre-LoxP重组酶系统–如果两个LoxP位点位于一条DNA链上,且方向相同,Cre重组酶能有效切除两个LoxP位点间的序列BAG-TJU§4.4引入新序列•Cre-LoxP重组酶系统–如果两个LoxP位点位于一条DNA链上,但方向相反,Cre重组酶能导致两个LoxP位点间的序列倒位BAG-TJU§4.4引入新序列•Cre-LoxP重组酶系统–如果两个LoxP位点分别位于两条不同的DNA链或染色体上,Cre酶能介导两条DNA链的交换或染色体易位。BAG-TJUBAG-TJU§4.5SCRaMbLE!•SCRaMbLE:–SyntheticChromosomeRearrangementandModificationbyLoxP-mediatedEvolutionBAG-TJU§4.5SCRaMbLE!•SCRaMbLE:StrainsMutantswithdifferentgeneticbackgroundandphenotypesDifferentcomb