第十一章DNA文库的构建和目的基因的筛选ConstructionofDNALibraryandScreeningofTargetGene定义和分类•基因文库指某个生物的基因组DNA或cDNA片段与适当的载体在体外通过重组后,转化宿主细胞,并通过一定的选择机制筛选后得到大量的阳性菌落(或噬菌体),所有菌落或噬菌体的集合。•按照外源DNA片段的来源,可将基因文库分为:基因组DNA文库(genomicDNAlibrary)和cDNA文库(complementaryDNAlibrary)。•基因组文库:分离特定的基因、分析特定基因的结构、研究基因的起源与进化、基因的表达调控•cDNA文库:大规模基因测序、发现和寻找新基因、基因注释、基因表达谱分析、基因功能研究DNA文库构建的基本程序•1、提取研究对象基因组DNA,制备合适大小的DNA片段,或提取组织或器官的mRNA并反转录成cDNA;•2、DNA片段或cDNA与经特殊处理的载体连接形成重组DNA;•3、重组DNA转化宿主细胞或体外包装后侵染受体菌;•4、阳性重组菌落或噬菌斑的选择。目标基因筛选方法•表型筛选法•杂交筛选和PCR筛选•免疫筛选法•酵母双杂交系统筛选第一节基因组DNA文库的构建•定义:指将某生物体的全部基因组DNA用限制性内切酶或机械力量切割成一定长度范围的DNA片段,与合适的载体体外重组并转化相应的宿主细胞获得的所有阳性菌落。文库的代表性和随机性•代表性是指文库中所有克隆所携带的DNA片段重新组合起来可以覆盖整个基因组,即可以从该文库中分离任何一段DNA。•引用两个策略:•一是采用部分酶切或随机切割的方法来消化染色体DNA,以保证克隆的随机性,保证每段DNA在文库中出现的频率均等;•二是提高文库所含基因组DNA的总容量,通常用覆盖基因组的倍数来衡量。文库的总容量由外源片段的平均长度和重组克隆的数量共同决定。•为预测一个完整基因组文库应包含克隆的数目,Clark和Carbon于1975年提出如下的计算公式:N=ln(1-p)/ln(1-f)•N:代表一个完全基因组文库所应该包含的重组克隆个数p:表示所期望的目的基因在文库中出现的几率f:表示重组克隆平均插入片段的大小和基因组DNA大小的比值•哺乳动物:3*109bp若p=99%,平均克隆片段长度20kbf=20kb/3*107kbN=690773.2•E.Coli:4639221kbp=99%,f=20kb/4600kbN=1056.9p=99%,f=10kb/4600kbN=2116载体的选择•构建大片段基因组DNA文库使用的载体主要有λ噬菌体(λphage)、粘粒载体(cosmid)、细菌人工染色体(BacterialArtificialChromosomes,BAC)、酵母人工染色体YAC(YeastArtificialChromosomes,YACs)、P1(BacteriophageP1)和PAC。•根据特征,这些载体可以分为两类:•一类是基于噬菌体改建的,利用了噬菌体的包装效率高和杂交筛选背景低的优点;•另一类经改造的质粒载体或人工染色体,其主要优点在于可容纳超过100kb以上的外源片段。基因组DNA文库的构建流程•基因组DNA文库的构建程序包含5个部分:•①载体的制备;•②高纯度大分子量基因组DNA(HighMolecularWeightDNA,HMWDNA)的提取;•③HMWDNA的部分酶切与脉冲电泳分级分离(PFGEsizeselection);•④载体与外源片段的连接与转化或侵染宿主细胞;•⑤重组克隆的挑取和保存。•1、基因组DNA文库的载体制备•载体的好坏是影响连接成功与否的关键,载体的制备要求两点,一是纯度高;二是去磷酸化好。•2、高质量大分子量基因组DNA的提取和部分酶切构建不同大小插入片段的基因组文库对DNA质量要求不同,一般所提取的DNA分子量至少应该是文库最终平均插入片段长度的3~5倍。实践表明,提取的基因组DNA分子量越大,所得到的重组克隆的插入片段越大。•3、文库的连接转化或包装侵染一般在构建大片段基因组DNA文库时,大量连接前都要先使用小体系连接来寻找最适的比例。在电转化和包装侵染过程中,首先最好选择转化效率高的进口感受态细胞或效价高且质量稳定的包装蛋白,同时,研究表明对连接产物进行脱盐处理也可以明显地提高其效率。•4、文库的质量检测文库的质量是由文库所含克隆的数目、平均插入片段的长度、插入效率、基因组覆盖度和覆盖倍数等因素所决定的。在文库的质量检测中,除了克隆子数目是可以确定的,其它值都是估算的。•基因组覆盖倍数的计算方法一般包括两种:•一是公式计算法,基因组覆盖倍数=平均插入片段长度×克隆数/基因组DNA的长度(一般是约数);•另一种算法是结合基因组覆盖度的检测来进行的。•基因组覆盖度是指文库中的克隆覆盖基因组的范围,检测时是通过选择一定数目的已知的单拷贝的基因作探针来筛选文库。由于所使用的每个探针筛选的克隆数目即表明文库中对该基因位点的覆盖倍数,因此,基因组覆盖倍数又等于所有探针筛选到的阳性克隆的总个数/使用的总探针数的比值。亚基因组文库的构建基因组DNA文库克隆子的保存•1、影印滤膜保存法•2、文库在液体培养基中扩增保存•方法:从琼脂平板上挑取已长出的克隆子转入含适当的抗生素培养基中,混合的细菌生长数代后,其培养物于-70oC储存(加终浓度为25%的甘油)。•缺点:因文库菌落生长的不均匀性而导致文库中某些特定的序列过多或过少。•3、保存单个克隆子于含有甘油的培养基中•方法:从平板上挑选单个克隆子接种于合适的含抗生素的培养基中,菌体生长到一定浓度后,加入终浓度为25%的甘油,于-70oC或-25oC下保存。•缺点:需保存的克隆子数过多,工作量大第二节cDNA文库的构建•定义:是指将某种生物体基因组转录的全部mRNA经反转录产生的cDNA片段分别与克隆载体重组,储存于某种受体菌中,该群体就称该生物基因组的cDNA文库。•cDNA(complementaryDNA,互补DNA):是由生物的某一特定器官或特定发育时期细胞内的mRNA经体外反转录后形成的互补DNA。•cDNA文库的构建共分四步:•第一,细胞总RNA的提取和mRNA分离;•第二,第一链cDNA合成;•第三,第二链cDNA合成;•第四,双链cDNA克隆进质粒或噬菌体载体并导入宿主中繁殖。RNA的分离•cDNA文库构建是以mRNA为起始材料的,mRNA在总RNA中所占比例很小,因此从总RNA中富集mRNA是构建cDNA文库和其它应用所必需进行的步骤。通过降低rRNA和tRNA含量,可大大提高筛选到目标基因的可能性。•目前纯化mRNA的方法都是在固体支持物表面共价结合固定一段由脱氧胸腺嘧啶核苷组成的寡聚核苷酸[oligo(dT)]链,由它与mRNA的Poly(A)尾巴杂交,从而吸附固定住mRNA,进而将mRNA从其它组分中分离出来的。•1、mRNA的来源:•选用mRNA含量高的组织材料,或通过药物等方法提高mRNA的含量。•2、mRNA完整性的检测•1)mRNA分子的大小:哺乳动物mRNA长度为500-8000bp,大部分mRNA位于1.5-2.0kb之间.•2)总mRNA指导合成cDNA第一链长分子的能力。•3)指导合成高分子量蛋白质的能力,指导合成目的多肽的能力。•3、mRNA在细胞中的丰度•1)高丰度mRNA•目的mRNA在细胞中的含量占细胞质总mRNA量的50-90%,如珠蛋白,免疫球蛋白,卵清蛋白,该类mRNA在合成和克隆cDNA之前不需进一步纯化特定mRNA。•2)低丰度mRNA•目的mRNA在细胞中的含量占细胞质总mRNA量的0.5%以下。•4、mRNA的富集方法•典型的哺乳动物细胞含有10,000-30,000种不同的mRNA分子,某些mRNA分子在细胞内的拷贝数很低甚至只有一个拷贝。1)按大小对mRNA进行分级分离•通过琼脂糖凝胶电泳分离大小不同的mRNA分子,该方法的分离效果最好,但从凝胶中回收的得率较低.•蔗糖梯度离心:加入破坏RNA二级结构的变性剂如氢氧化甲基汞等,再进行蔗糖梯度离心以分离不同分子量的mRNA.2)cDNA的分级分离•mRNA通过反转录形成cDNA,在插入到克隆载体前,通过琼脂糖凝胶电泳,将不同大小的cDNA分子分离开来。•优点:•a)避免了分离过程中mRNA被污染的RNA酶降解•b)增加了获得全长cDNA克隆的概率•c)获得更准确的分级分离效果(分子量)•3)多聚核糖体免疫学纯化法•使用抗体来纯化合成目的多肽的多聚核糖体。将正在合成的新生多肽链的多聚核糖体结合到免疫亲和柱(A蛋白-Sepharose柱)上,随后用EDTA将多聚核糖体解离下来,并通过Oligo(dT)层析分离mRNA,利用该方法可将目的mRNA纯化数千倍。目的mRNA在细胞中的含量可为数十拷贝。第一链cDNA的合成oligo(dT)引导的DNA合成法:•利用真核mRNA分子所具有的poly(A)尾巴的特性,加入12-20个脱氧胸腺嘧啶核苷组成的oligo(dT)短片段,由反转录酶合成cDNA的第一链。•缺陷:cDNA末端存在较长的poly(A)而影响cDNA测序;因为逆转录酶无法到达mRNA分子的5’-末端,必须从3’-末端开始合成cDNA。对于大分子量的较长的mRNA分子而言,特别麻烦。mRNA随机引物引导的cDNA合成法(randomlyprimedcDNAsynthesis):根据许多可能的序列,合成出6-10个核苷酸长的寡核苷酸短片段(混合物),作为合成第一链cDNA的引物。在应用这种混合引物的情况下,cDNA的合成可以从mRNA模板的许多位点同时发生,而不仅仅从3’-末端的oligo(dT)引物一处开始。随机引物cDNA合成的方法不适合构建cDNA文库,一般用于克隆特定mRNA的5'末端,如RT-PCR和5'-RACE。第二链cDNA的合成•cDNA第二链的合成就是将上一步形成的mRNA-cDNA杂合双链变成互补双链cDNA的过程。•cDNA第二链的合成的方法大致4种:自身引导合成法、置换合成法、引导合成法、引物-衔接头合成法。•1)自身引导合成法:•获得的单链cDNA3’端会形成发夹结构的能力,以此作为第二链合成的引物,在大肠杆菌聚合酶IKlenow或反转录酶的作用下,合成cDNA的第二链。再利用S1核酸酶将连接处(仅该位点处为单链结构)切断形成平端结构可以进行连接。•缺点:在以S1核酸酶切割cDNA的发夹状结构时,会导致对应于mRNA5’端的地方的序列出现缺失和重排。S1核酸酶的纯度不够时,会偶尔破坏合成的双链cDNA分子。•2)置换合成法:获得的双链cDNA5’端也会有几对碱基缺失•原理:•以第一链合成产物cDNA:mRNA杂交体作为切口平移的模板,RNA酶H在杂交体的mRNA链上造成切口和缺口,产生一系列RNA引物,在大肠杆菌DNA聚合酶I的作用下合成cDNA的第二链。优点:a)合成cDNA的效率高b)直接利用第一链的反应产物,不需纯化c)避免使用S1核酸酶来切割双链cDNA•3)引导合成法:获得的双链cDNA能保留完整的5’端序列•首先是制备带有Poly(dT)的载体片段Ⅰ和一端带有Poly(dG)的片段Ⅱ,并用片段Ⅰ来代替Oligo(dT)进行cDNA第一链的合成,在第一链cDNA合成后直接采用末端转移酶(TdT)在第一链cDNA的3'-端加上一段Poly(dC)的尾巴,同时进行酶切创造出另一端的粘端,与片段Ⅱ一起形成环化体,这种环化了的杂合双链在RNA酶H、大肠杆菌DNA聚合酶Ⅰ和DNA连接酶的作用下合成与载体联系在一起的双链cDNA。•主要特点:合成全长cDNA的比例较高,但操作比较复杂,形成的cDNA克隆中都带有一段Poly(dC)/(dA),对重组子的复制和测序都不利。•4)引物-衔接头法:引导合成法改进而来•第一链合成后直接采用末端转移酶(TdT)在第一链cDNA的3'-端加上一段Poly(dC)的尾巴,然后用一段带接头序列的Poly(dG)短核苷酸链作引物合成互补的c