引物设计一、软件使用:推荐软件:PrimerPremier5.0优点:操作简单、显示各种参数改变和可能的二聚体、异二聚体、发夹结构等缺点:没有明显缺点本地同类软件:DNAClub;Oligo6.22;VectorNTISuit;Dnasis;Omiga;Dnastar;DNAMAN(LynnonBiosoft,Quebec,Canada).网上同类软件:Primer3(WhiteheadInstitute开发);JaMBW(EuropeanMolecularBiologyLaboratoryofHeidelberg开发)。网站已引进并调试好这两种软件。独特之处在于:对全基因组PCR的引物设计,可以将设计好的引物对后台核酸数据库进行比对,发现并排除引发错配的引物。因此建议经常做全基因组PCR的用户试用。二、推荐操作:引物搜索:PrimerPremier5.0引物评价:Oligo6.22三、引物设计的原则:首先引物要跟模板紧密结合,其次引物与引物之间不能有稳定的二聚体或发夹结构存在,再次引物不能在别的非目的位点引起DNA聚合反应(即错配)。围绕这几条基本原则,设计引物需要考虑诸多因素,如引物长度(primerlength)、产物长度(productlength)、序列Tm值(meltingtemperature)、ΔG值(internalstability)、引物二聚体及发夹结构(duplexformationandhairpin)、错误引发位点(falseprimingsite)、引物及产物GC含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。以使用Oligo软件分析设计引物为例,笔者总结出以下的要点:1.引物的长度一般为15-30bp,常用的是18-27bp,但不能大于38,因为过长会导致其延伸温度大于74℃,即Taq酶的最适温度。2.引物3’端的序列要比5’端重要。引物3’端的碱基一般不用A(3’端碱基序列最好是G、C、CG、GC),因为A在错误引发位点的引发效率相对比较高。另外引物间3’端的互补、二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR影响不大,因此常用来引进修饰位点或标记物。3.引物的GC含量一般为40-60%,以45-55%为宜,过高或过低都不利于引发反应。有一些模板本身的GC含量偏低或偏高,导致引物的GC含量不能在上述范围内,这时应尽量使上下游引物的GC含量以及Tm值保持接近(上下游引物的GC含量不能相差太大),以有利于退火温度的选择。如果G-C比例超出,则在引物的5’端增加As或Ts;而如果A-T比例过高,则同样在5’端增加Gs或Cs。但也有认为:原来普遍认为PCR引物应当有50%的GC/AT比率的观点其实是不对的,以人基因组DNA为模板,用81%AT的引物可以产生单一的、专一的、长250bp,含有70%AT的产物。完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/AT比率应当等于或高于所要放大的模板的GC/AT比。4.引物所对应模板序列的Tm值最好在72℃左右。(Tm值曲线以选取72度附近为佳,5’到3’的下降形状也有利于引物引发聚合反应),至少要在55-80℃之间5.ΔG值(自由能)反映了引物与模板结合的强弱程度。一般情况下,引物的ΔG值最好呈正弦曲线形状,即5’端和中间ΔG值较高,而3’端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。3′末端双链的ΔG是0~-2kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%、到-8时少于20%、而-10时接近于0。6.可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,如此可保证不出非目的产物的假带。但对于特定的模板序列,还应结合比较其在正确位点的引发效率。如果两者相差很大,比如在正确位点的引发效率为450以上,而在错误位点的引发效率为130,并且不好找其他更合适的引物,那么这对引物也是可以接受的。7.Frq曲线为Oligo6新引进的一个指标,揭示了序列片断存在的重复机率大小。选取引物时,宜选用Frq值相对较低的片断。8.引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带而且会降低引物浓度从而导致PCR正常反应不能进行,与二聚体相关的一个参数是碱基的分布,3’端的连续GGG或CCC会导致错误引发。二聚体形成的能值越高越稳定,越不符合要求。与二聚体相同,发夹结构的能值越低越好。虽然有些带有发夹环,其ΔG为-3kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在5′末端对反应就没有多大的影响了。9.以公式(4×G/C+2×A/T–5)计算Tm值,即退火温度。选择较低Tm值的引物的退火温度为反应的退火温度。4-6℃的差别似乎对PCR产量影响不大。最好,保证每个引物的Tm值相匹配,且在70-75℃范围内10.要知道,更重要的因素是模板与稳定性较小的引物之间解链温度的差异。差异越小,PCR的效率越高。因为DNA的解链温度也取决于它的长度,所以有的研究者喜欢设计很长,而不求它很稳定的引物。可是,引物太长就难以避免形成二聚体和自身互补,因此,一般还是不用为好。如果期待的产物长度等于或小于500bp,选用短的(16~18mer)的引物:若产物长5kb,则用24mer的引物。有人用20~23mer引物得到40kb的产物。11.在DNA测序和PCR中最好用5′末端稳定(如GC含量较多),而3′末端不太稳定(如AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9kcal/mol的,通常就是专一性的探针或引物。寡核苷酸3′末端越不稳定,假引发的可能性越低。12.如果用3′末端低稳定性的引物,反应的最适退火温度范围会不寻常的宽。这就可以不经过事先的最佳化实验就能在最佳条件下进行反应。13.引物的唯一性:为了放大单个的、专一性DNA片段,选用的引物序列就应当是唯一的,即在模板中没有重复序列。如果用哺乳动物基因组序列作为模板,可以用Alu序列或其他短重复元件来核对想用的引物的互补性。由此也可知,应当避免使用同寡聚物(如—AAAAAA—)和二核苷酸重复(如—ATATAT—)。14.引物和产物的Tm值不要相差太大,20摄氏度范围内较好。定下引物的Tm值范围之后即可定下引物的长度范围。15.对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。16.值得一提的是,各种模板的引物设计难度不一。有的模板本身条件较差,比如GC含量偏高或偏低,导致找不到各种指标都十分合适的引物;有时PCR产物要作为克隆对象插入到载体中表达,因此PCR引物设计的可选择度很低。遇到这种情况只能退而求其次,尽量去满足条件,这时,使用自动搜索引物及正确地评价引物可使研究人员对实验心中有数。17.在设计克隆PCR引物时,引物两端一般都添加酶切点,必然存在发夹结构,而且能值不会太低,这种PCR需要灵活调控退火温度以达到最好效果,对引物的发夹结构的检测就不应要求太高。18.如扩增出多条带(引发错配所致),不出目的带或出目的带很弱(引物引发效率低下)四、Oligo6.22使用技巧1.Oligo的主要功能集中在Analyze菜单里,只要把它弄懂了,其他的就很简单了2.Frq为6.22的新功能,为邻近6-7个碱基组成的亚单位在一个指定数据库文件中的出现频率。该频率高则可增加错误引发的可能性3.因为分析要涉及多个指标,起动窗口的cascade排列方式不太方便,可从windows菜单改为tili方式4.当结束检测,按Alt+P键就出来PCR窗口,其中总结性地给出该引物的位置、产物大小、Tm值等参数,最有用的是还给出了推荐的最佳退火温度和简单的评价。五、ΔG概念:用于估测可能形成DNA或RNA双链的稳定性:在一个双链结构中,碱基对的相对稳定性是由其邻近碱基决定的。在热动力学中,这样的性质以双链形成时的自由能(ΔG)来表示。现在大多采用Breslauer等人提出的以最接近的相邻核苷酸的动力学数值(自由能)来预测双链稳定性的方法。为简化起见,所有的计算都在25℃条件下进行。此时,最接近的相邻核苷酸的自由能是:第一个(5′)核苷酸第二个核苷酸dAdCdGdTdA-1.9-1.3-1.6-1.5dC-1.9-3.1-3.6-1.6dG-1.6-3.1-3.1-1.3dT-1.0-1.6-1.9-1.9ΔG(kcal/mol)如:双链d(ACGG/CCGT)的ΔG是:ΔG(ACGG)=ΔG(AC)+ΔG(CG)+ΔG(GG)=-(1.3+3.6+3.1)=-8.0kcal/mol此计算方法特别适用于测定其3′末端会形成双链的引物的相容性。也可以用来计算发夹环结构的ΔG。不过,这时需要根据环区内核苷酸的数量添加一定的数值。如3个核苷酸时为5.2kcal/mol;4个时为4.5;5个为4.4;6个是4.3;7和8个为4.1kcal/mo1。六、按照氨基酸序列设计寡核苷酸:按照多肽的氨基酸序列来设计PCR引物或杂交探针是最常用的实验手段,尤其是在试图“钓取”一个蛋白质的基因时。此时要注意的问题有:(1)宁可用简并引物,也不用猜测的引物。氨基酸密码子的简并性给予引物设计以可塑性,这比用猜测的密码子要好得多。有人用1024个简并引物得到很好的结果。但是,应当避免在一个区域内有很高的简并性。但也有简并性低使引物不工作的报道。(2)引物与模板的错配。一般认为,所用引物与模板有15%~20%的错配,PCR的效果还能接受。但是,引物3′末端的错配比同样错配率的5′末端错配会引起更严重的问题。在最后4个碱基中有2个错配的引物,其PCR产量急剧下降。但是,当核苷酸浓度高时,3′末端有错配的引物还能被Tag聚合酶很好地利用。在0.8mmol/L时,大多数3′末端错配引物可以接受,虽然非专一产物比较多,DNA合成的忠实性也下降。即使在低核苷浓度下,还会有少量从错配碱基出发的合成,因此,在开始的PCR循环中把退火时间增加到3~5分钟,比之于用标准退火时间和高浓度核苷酸能够产生质量更好的所求产物。(3)在用唯一性引物时,建议用0.2mmol/L或更低的总核苷酸浓度,因为高浓度会增加错误参入的比率。(4)简并寡核苷酸时,PCR应当在比较高的引物浓度下进行,即1~3μmol/L而不是0.2μmol/L,因为在反应混合物中的大多数寡聚物并不是被用来引发专一的反应,而只是产生高的背景而已。七、复杂模板的扩增体系:所谓复杂模板,是指体系中的DNA种类和数量较多,不能以此引物对所有的模板一一比较来计算其异位引发的可能性的情形。此情形下与简单模板扩增相比较,还需要遵循下面一些原则以尽可能的避免异位扩增。1.引物3’末端的稳定性。引物3’末端的稳定性由引物3’末端的碱基组成决定,一般考虑末端5个碱基的ΔG。此值的大小对扩增有较大的影响,负值大,则3’末端稳定性高,扩增效率更高,同时也更易于异位引发。因此在复杂模板的扩增体系中,3’末端5聚体的ΔG应大于-9.0kcal/mol。2.碱基组成应尽