1第一章基因工程概述第一节基因操作与基因工程基因操作(genemanipulation):指对基因进行分离、分析、改造、检测、表达、重组和转移等操作的总称。基因工程(geneengineering):通过工具酶,在体外将目的基因、基因片段或其它DNA元件进行切割,与适当的载体进行连接和重组,导入相应受体细胞,并使外源基因进行复制和表达,定向改造受体生物性状或获得表达产物。基因操作与基因工程的关系:基因操作的核心是基因重组(generecombination)技术,基因工程是基因操作、基因重组的核心内容和主要目的。基因工程的遗传学效果:受体生物发生遗传信息或遗传性状的变化并能稳定遗传给下一代。第二节基因工程是生物科学发展的必然产物一、基因是基因重组的物质基础遗传因子、基因:是遗传信息的基本单位。从物质结构上看,基因是染色体组核酸分子。基因(gene)是作为遗传物质的核酸分子上的一段片段并具有遗传学功能,可以是连续的,也可以是不连续的,可以是DNA也可以是RNA,可以存在于染色体上,也可存在于染色体之外(如质粒、噬菌体等)。基因工程的理论基础:⑴.明确了遗传信息的携带者—基因的载体是DNA,明确了遗传的物质基础。⑵.DNA分子的双螺旋结构和半保留复制模型得以阐明,解决了基因的自我复制和传递问题。⑶.中心法则、操纵子学说的提出以及遗传密码子的破译,解决了遗传信息的流向和表达问题。(4).遗传物质基础和中心法则的通用性决定了基因工程原理和技术在生物界普遍适用,尤其是可以实现跨越任何物种界限的遗传成分转移。自此,从理论上讲,基因工程已有可能成为现实基因工程的技术基础:⑴.DNA体外切割和连接技术(限制性内切核酸酶和DNA连接酶的发现与应用,标志着DNA重组时代的开始)。⑵.克隆载体的发展与应用。⑶.大肠杆菌转化体系的建立。⑷.琼脂糖电泳技术的应用。⑸.DNA测序技术的应用。⑹.核酸杂交技术的应用。从技术上为基因工程的诞生奠定了基础。四、基因工程的内容1、基因操作原理:(1)DNA和RNA的操作。(2)基因克隆与功能研究。(3)基因组学与生物信息学的应用。2、基因工程的应用:(1)生物反应器(bioreactor):大规模生产生物活性分子如生长激素、胰岛素等。(2)遗传改良(geneticimprovement)、分子育种(molecularbreeding)、设计构建新物种。(3)基因治疗(genetherapy):人体转基因或基因组编辑。第三节基因的结构——基因操作的理论基础一、基因的结构组成对基因操作的影响1、基因及其产物的共线性:一个基因的核苷酸序列与其产物的氨基酸序列一一对应。N个氨基酸=3N个编码碱基。2、基因及其产物的非共线性。间断基因。内含子(intron)是指真核基因在RNA加工过程中从原初转录本中剪去而不进入成熟RNA结构、2不具有氨基酸编码能力的一段序列。外显子(exon):是真核基因转录本中剪去内含子后所保留的RNA片段,它们拼接并进行适当修饰后成为成熟RNA并执行相应功能。3、基因的重叠性与可变性:基因的重叠性:单个DNA序列可编码一个以上的蛋白质,它们在结构上可以具有序列重复性,也可以是相互完全不同的全新蛋白质。原因:可变性转录起始位点、可变性起始位密码子、可变性编码终止位点、可变性剪接。开放读码框(openreadingframe,ORF):成熟mRNA中从起始密码子ATG至终止密码子(TAA、TAG或TGA之一)之间形成的一个连续的氨基酸编码区间。以起始密码子的第1个碱基作为+1,其5’方向的第1个碱基为-1。4、启动子和终止子启动子(promoter):基因转录过程中控制起始的部位,通常是位于转录起始位点5’上游的一段DNA区间,其上有许多顺式元件。转录起始位点(transcriptionstartsite):起始转录的第一个碱基,也是掺入到RNA中的第1个碱基。在转录研究中记为+1,其5’方向的第1个碱基(已属于启动子而非转录区)为-1。侧翼序列(flankingsequence):一条核酸单链上位于某一特定位置的5’或3’方向的序列。上游(upstream):一条核酸单链上位于某一碱基的5’方向。下游(downstream):一条核酸单链上位于某一碱基的3’方向。终止子(terminator):位于基因的3’部位、终止基因转录过程的一段DNA区间。有依赖不依赖ρ因子两种。核糖体结合位点(ribosomalbindingsite,RBS):位于mRNA起始密码子及其正上游的一段区间,是核糖体结合并起始翻译过程的位点。原核和真核的RBS显著不同。转录单位(transcriptionunit)/转录本(transcript):从转录起始位点直至转录的最后一个碱基之间被转录的RNA序列,可以包含一或多个蛋白编码框。亚克隆(subcloning):1、将大片段克隆子的DNA重新打断成小片段,然后分别克隆到新的载体中,供进一步研究。初步克隆中的外源片段往往较长,含有许多目的基因片段以外的DNA片段,在诸如表达序列分析和突变等操作中不便进行,因此必须将目的基因所对应的一小段DNA找出来,这个过程叫“亚克隆”。2、通指将DNA片段从一个载体穿梭克隆到另一个载体的过程。亚克隆技术:泛指实验室中以DNA在大肠杆菌中经典克隆操作为核心的基本技术体系。第二章分子克隆工具酶第一节限制性内切酶一、限制与修饰1、限制与修饰现象:限制(restriction):指一定类型的细菌可以通过限制性内切酶(restrictionednonuclease)的作用,破坏入侵的噬菌体DNA,导致噬菌体的寄主范围受到限制。限制作用实际就是限制性内切酶降解外源DNA,维护宿主遗传稳定的保护机制。修饰(modification):指寄主本身的DNA,由于在合成后通过甲基化酶(methylase)的作用得以甲基化,使DNA得以修饰,从而免遭自身限制性酶的破坏。修饰作用宿主细胞通过甲基化作用达到识别自身遗传物质和外来遗传物质的目的。甲基化作用:最主要的碱基修饰,使腺嘌呤A成为N6-甲基腺嘌呤,胞嘧啶成为5’-甲基胞嘧啶。限制酶是一类能够识别双链DNA分子中的某种特定核苷酸序列,并由此切割DNA双链结构的核酸水解酶。限制酶存在于细菌中,也存在于一些病毒中,真核生物中没有限制酶。3.限制性核酸内切酶的种类据限制性核酸内切酶的识别切割特性、催化条件及是否具有修饰酶活性,可分为Ⅰ、Ⅱ、Ⅲ型三大3类。Ⅱ型限制酶用途大,多为同源二聚体,其中切口酶只在单链上产生切口,Ⅱs型识别序列和切割位置特殊。二、限制酶识别的序列1、限制酶识别序列的长度(n):一般为4-8个碱基对,最常见为6bp。识别位点出现频率:4n2、限制酶识别序列的结构:多数为回文结构(palindrome)即镜像对称结构。一些酶可识别多种结构尤其是允许一些碱基是简并的,还有一些酶识别序列呈间断对称,即回文对称序列之间可以间隔一定长度的任意碱基。3、限制酶的切割位置:多数在识别序列内部,也有在外部、两端、两侧或单侧的。三、Ⅱ限制酶的功能和产生的末端类型Ⅱ限制性核酸内切酶有严格的识别、切割顺序,它以核酸内切方式水解DNA链中的磷酸二酯键,产生的DNA片段5′端为P,3′端为OH,识别序列一般为4~6个碱基对,通常是反向重复顺序,具有180°的旋转对称性,即回文结构。Ⅱ限制性核酸内切酶切割双链DNA产生3种不同的末端类型。1、对称型突出末端:回文结构决定对称,分为5’突出和3’突出的粘性末端(cohesive/stickyend)两种。2、平末端(bluntend):任何平末端酶的酶切产物可以互连,但连接效率比粘性末端低100倍左右。3、非对称的突出末端:因为识别序列是非回文的、简并的或存在间隔序列,故产生的粘性末端也为非对称的。即使是单酶切限制片段在连接时也具有方向性。4、同裂酶(isoschizomer):不同的酶识别序列相同,切割位点可以相同也可以不同,又分为同序同切酶、同序异切酶、同功多位酶和其它类型。例:SmaⅠ(CCC↓GGG)和XmaⅠ(C↓CCGGG)5、同尾酶(isocaudarner):不同限制酶识别序可以相同,也可以不同,但它们产生的末端是一样的,末端间可以相互连接。同尾酶在基因工程尤其是载体构建中有较大用途。例:XhoⅠ(C↓TCGAG)与SalⅠ(G↓TCGAC)、BamHI(G↓GATCC)和BglⅡ(A↓GATCT)6、归位内切酶(homingendonuclease):一些线粒体、叶绿体、核DNA和T偶数噬菌体的内含子编码内切酶(称为I-prefix)或内含肽(intein)具有内切酶活性(称为PI-prefix)。它们识别序列很长,核心识别序列一般为10-12bp,识别位点极少。四、DNA末端长度对限制酶切割效率的影响限制性核酸内切酶识别和切割靶序列时需要识别序列两侧具有一定长度的DNA,否则会降低切割效率。对侧翼长度敏感性较低的酶有EcoRⅠ等,只要一个侧翼碱基即保证90%的效率。对侧翼长度敏感性高的酶有AccⅠ、HindⅢ、PstⅠ等,侧翼3个碱基以上也未必理想。设计引物、接头等时要考虑适当长度的保护碱基,载体构建时多克隆位点中的相临位置的酶的切割序列的选择也很重要。限制酶的活性单位(unit):1个单位的酶是指在建议的缓冲液及温度下,在20μl反应液中反应1h,使1μgDNA(多用λ)完全消化所需要的酶的量。五、位点偏爱某些限制酶对同一底物中的不同位置的识别位点的切割效率不同,表现出偏爱性,这种现象称作位点偏爱。某些噬菌体DNA中的某些相同的酶切位点对酶的敏感性不同。λ噬菌体DNA为48502bp,两端为12bp粘性末端。EcoRⅠ酶切割λ噬菌体中的5个位点时并不是随机的,靠近右端的位点比分子中间的位点切割快10倍;EcoRⅠ对腺病毒2DNA不同位置切点的切割速率也不同。由于位点偏爱性,λDNA用HindⅢ消化而制备的λHindⅢDNAmarker中4.3kb条带甚至比2.0kb条带还弱。4原因:切割时需要同时与2个识别位点作用(如NarⅠ等),或识别和切割时要求在DNA上有2个明显不同的结合位点,其中1个是另1个的被切割时起激活作用的变构位点。应对办法:超量用酶、延长切割时间。七、限制酶的星活性(staractivity)在极端非标准反应条件下,限制性核酸内切酶能切割与特异识别序列不同但相似的序列,降低酶切反应的特异性,这种改变的特殊性称为限制性核酸内切酶的星活性。产生原因:①反应体系中甘油的浓度大于5%。②酶用量过大,大于100U/μgDNA。③低离子强度,小于25mmol/L。④高pH,大于8.0。⑤含有机剂如乙醇、二甲基亚砜、二甲基乙酰胺等。⑥Mn2+、Cu2+、Co2+、Zn2+等非Mg2+的二价离子的存在。易发生星活性的内切酶有:EcoRI、HindⅢ、KpnI、PstI、SalI、HinfI等。办法:对因改进。八、单链DNA的切割多数限制酶很难切割单DNA模板。部分限制酶除切割双链DNA外,还可切割单DNA,但活性一般都不高。切口酶虽然识别双链,但只在单链上切口,名称前要加一个N。九、酶切位点的引入现代基因工程中通过引物化学合成等方式可以很方便进向目标位置引入设计的酶切位点。通过不同酶切末端的连接重组也可产生新的酶切位点,对具体情况的分析在设计中有价值:5’突出末端补平后重连;同尾末端连接;平末端连接。十、影响限制性核酸内切酶活性的因素①DNA样品的纯度DNA样中混有蛋白质、苯酚、氯仿、乙醇、EDTA、SDS、NaCl等都有可能抑制酶活性。可采用以下方法,提高酶活性:加大酶的用量,1μgDNA用10U酶加大反应总体积延长反应时间②DNA样品的甲基化程度大肠杆菌中的dam甲基化酶在5′GATC3′序列中的腺嘌呤N6位引入甲基,受其影响的酶有BclI、Mbol等,但BamHI、BglII、Sau3AI不受影响。大肠杆菌中的dcm甲基化酶在5′CCAGG3′或5′CCTGG3′序列中的胞嘧啶C5位上引入甲基,受其影响的酶有EcoRII等,但BglI