常用生物软件及使用概述也许不必将它当成您的研究领域但您最好知道如何使用这个工具一、管理实验室数据及文献资料查阅实验相关文献,以便对自己所要做课题的最新进展有一个基本的了解,从而确定自己的实验策略;同时,方便实验室结果的储存,管理和申报工作。常用软件:1、ReferenceManager(可以在线通过查找关键词搜索PubMed等多个数据库中的专业资料,同时保存查找的资料为本地文件。)2、Endnote(一个在线专业资料查找系统,可以保存查找资料,并在文章中对引用格式化.)3、医学文献王(特长在中文期刊的系统化,也支持外文文献数据库)二、分析和处理实验数据和公共数据随着实验的进行,就必须对实验过程中的DNA、RNA和蛋白质的信息进行各种处理,包括限制酶分析、引物设计、同源序列比较、质粒作图、结构域(motif)查找、RNA二级结构预测、蛋白二级结构分析、三维结构显示等方面的内容。1、限制酶分析推荐软件:DNAssist1.0大多软件只对线性序列进行分析,那么cNNNNN………NNNgaatt环状的序列就找不到EcoRI的位点,DNAssist1.0能很容易把这个EcoRI位点找出来。另外DNAssist在输出上非常完美,除了图形、线性显示外,还有类似DNASIS的列表方式,列出所有的位点(按酶排列,按碱基顺序排列)另外,VectorNTI亦是一选择2、引物设计Oligo6(引物评价)*PrimerPremier(自动搜索)*VectorNTISuit(综合分析)PrimerExpress(实时定量PCR引物和探针设计)OmigaDnastarPrimer3(在线服务)*3、同源序列比较NCBI的BLAST;ExPASy的AlignmentGeneDoc3.2ClustalXVectorNTIOmiga,Bioxm,LaserGene,pcgene等4、质粒作图GeneConstructionKitWinPlas2.7PlasmidPremier2.02PlasmidToolkit5、结构域(motif)查找推荐软件:PrimerPremier5.0PrimerPremier5.0的结构域查找功能与它的引物设计一样强,结果能以图形、表格、序列三种方式输出。同时还提供了一些未知的结构域的列表;当然软件本身也提供了大量的已知结构域的序列。6、RNA二级结构预测RNAdrawRNAStructure7、蛋白分析软件二级结构分析:Antheprot4.5三维结构显示:RasMolCn3D8、格式转换各种软件为了自己软件的需要有不同的格式,对我们使用数据带来了困难;格式转换软件能帮助用户解决这一问题。推荐软件:Seqverter1.3使用简单,填写输入文件和输出文件名就可以完成格式转换。而且能够转换的格式非常之多是其它软件所无法比拟的。另外,它可在线升级以读写更多格式文件。9、电泳图谱分析推荐软件:bandleader3.0提供处理DNA或蛋白分子凝胶电泳图象和从凝胶电泳图象获得相关数据的工具。它可以对电泳图谱进行半定量分析,识别扫描得到的WINDOWS图象格式.BMP,是一个难得的好软件。10、序列综合分析软件pcgeneBioEditLaserGeneDNASISDNAToolsDNAclubJellyfishOmigaVectorNTISuite(Bioxm)三、应用实例-----------PCR引物设计及相关软件使用→←SenseprimerAntisenseprimer选择模板序列保守区域1、引物设计原则引物长度碱基分布的均衡性Tm值引物二级结构引物3’端引物5’端引物的内部稳定性自由能分布概述引物长度一般引物的长度为15-30bp,常用的长度为18-21bp。过长或过短都不合适,为过长会导致其延伸温度大于74℃,不适于TaqDNA聚合酶进行反应,长度大于24核苷的引物并不意味着更高的特异性,而且比短序列杂交慢,从而降低了产量。引物过短会引起错配现象,一般来说引物长度大于16bp是必要的(18bp的序列在人类基因组中只会出现一次)。决定引物退火温度(Tm值)最重要的因素就是引物的长度Tm=(g+C)*4+(a+T)*2同一碱基连续出现不应超过5个GC含量一般40-60%,以45-55%为宜•GC含量太低导致引物Tm值较低,使用较低的退火温度不利于提高PCR的特异性•GC含量太高也易于引发非特异扩增。碱基分布的均衡性有一些模板本身的GC含量偏低或偏高,导致引物的GC含量不能在上述范围内,这时应尽量使上下游引物的GC含量以及Tm值保持接近(上下游引物的GC含量不能相差太大),以有利于退火温度的选择。引物Tm值一般要求:55℃-65℃。应尽可能保证上下游引物Tm值一致,一般差异控制在2℃以内。(引物的退火温度相差小于5℃一般不会影响PCR的产率,理想情况下一对引物的退火温度是一样的,可以在55℃~80℃间变化,有说接近72℃为最佳)上下游引物Tm值与产物Tm值一般应控制在20℃以内。一般采用较低引物Tm值-5℃作为PCR退火温度。一对引物的GC含量和Tm值应该协调。若是引物存在严重的GC倾向或AT倾向则可以在引物5’端加适量的A、T或G、C尾巴。若G+C含量太低,可在5'端加上一些G或C,若G+C含量太高,可在5'端加上一些A或T。引物二级结构引物二聚体(引物间不应多于4个连续碱基的同源性或互补性)•尽可能避免两个引物分子之间3’端有有较多碱基互补发夹结构(引物自身连续互补碱基不能大于3bp)•尤其是要避免引物3’端形成发夹结构,否则将严重影响DNA聚合酶的延伸。(两项结构的能值以不超过4.5为好,引物中间或5’端可适当放宽)两引物之间不应该存在互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。一般情况下,一对引物间不应多于4个连续碱基的同源性或互补性。引物3’端引物的延伸从3’端开始,因此3’端的几个碱基与模板DNA均需严格配对,不能进行任何修饰,否则不能进行有效的延伸,甚至导致PCR扩增完全失败。引物3’端的碱基一般不用A(3’端碱基序列最好是G、C、CG、GC)。另外引物间3’端的互补、二聚体或发夹结构也可能导致PCR反应失败。3’端的连续3个G或C,如GGG或CCC,会导致引物在G+C富集序列区错误引发引物5’端引物5’端可以有与模板DNA不配对碱基(对PCR影响不大),常在5’端引入修饰位点或标记物。•5’端加上限制性核酸内切酶位点序列(酶切位点5’端加上适当数量的保护碱基)。•5’端的某一位点修改某个碱基,人为地在产物中引入该位点的点突变以作研究。•5’端标记放射性元素或非放射性物质(如生物素、地高辛等)。双酶切位点,有利于定向克隆,2-3个保护碱基,一般加CG。计算引物Tm值时并不包括这些序列,但是应该对其进行互补性和内部二级结构的检测。引物的内部稳定性过去认为,引物3’端应牢牢结合在模板上才能有效地进行延伸,故3’端最好为G或C。现在的观点认为,引物的5’端应是相对稳定结构,而3’端在碱基配对的情况下最好为低稳定性结构,即3’端尽可能选用A或T(有说不适宜用A),少用G或C。若模板不很清楚,引物3’端最后一个碱基最好为T,其次是G或C,而不选A,国外资料表明,当末位为T时,即使在错配的情况下也能引发链的合成,而末位为A时,错配时引发大大降低,G或C居中,可见,模板很清楚时选A可以提高特异性。自由能分布∆G值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性(结合的强弱程度)。一般情况下,引物的ΔG值最好呈正弦曲线形状,即5’端和中间ΔG值较高,而3’端ΔG值相对较低,且不要超过9(绝对值,一般考虑末端5个碱基的ΔG。此值的大小对扩增有较大的影响,负值大,则3’末端稳定性高,扩增效率更高,同时也更易于异位引发。因此在复杂模板的扩增体系中,3’末端5聚体的ΔG应大于-9.0kcal/mol),如此则有利于正确引发反应而可防止错误引发。引物的3’端的∆G值过高,容易在错配位点形成双链结构并引发DNA聚合反应。(能值越高越容易结合)3′末端双链的ΔG是0~-2kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%、到-8时少于20%、而-10时接近于0。引发效率(引物唯一性)选用的引物序列就应当是唯一的,即在模板中没有重复序列好的设计工具会提供一个引物异位引发的评价指标,如Oligo6.0的falseprimingefficiency,即异位引发效率,这个值是由程序根据引物自身二级结构的能量、错配的类型、错配离3'末端的距离等因素综合计算而得出,当此值大于200时便很有可能引发扩增。如所用工具无量化指标,则可依据经验,当引物与模板在非预期位置退火,超过70%的碱基能互补配对,或引物3’末端连续8个或以上碱基配对,则认为有引发的可能。2、具体引物设计过程一般引物设计测序引物设计5’端引入限制性内切酶位点或标记引物设计简并引物设计特殊需求引物设计参数设置•默认引物长度-默认值为25•引物对搜索最大值-默认值为100•核酸浓度-默认值为250pM•单价离子浓度-默认值为50mM•游离Mg2+离子浓度-默认值为1.5mM•评分参数•Ratingparameters评分参数窗口是用来设定二级结构在引物评分中的权重系数二级结构越稳定引物评分就会越低相对于在引物中间形成的二级结构来说3末端的二级结构对PCR扩增的影响会更大为了将这一效应计算在内软件将3末端的二级结构的自由能数值G减去1这一修正会使3末端的二级结构显得更加稳定(1)Primerpremier5.0使用介绍参数设置序列获取及同源性比较比对软件和方式多,这里演示下Omiga,和primer载入序列PreimerPremier启动界面Loadsequence粘贴序列窗口这一窗口使得一段核酸序列通过选择以四种不同的方式粘贴上去(CTRL-V)基本信息SequencenameOriginalsequenceUsethesetwobuttontotranslatetheDNAseqtoaproteinseqoraproteinseqtoaDANseq8种密码子偏好Chooseafunction引物设计界面FirstyoucandesigntheprimermanuallySensestrandoranti-sensestrandUsefulinformationoftheprimer引物搜索选项设定引物类型搜索模式5’引物位置范围3’引物位置范围产物大小范围引物长度引物手动搜索选项设定搜索结果28对引物引物分值100分为满分每对引物的信息双击选中一对引物引物信息回到主窗口引物及产物信息是否出现hairpin,dimer,falseprimingandcrossdimer引物编辑引物编辑EditprimerhereAnalysistheeditresultAccepttheeditresultReturntothemainwindow(2)Oligo6.44使用介绍启动界面Opensequencefile3个弹出窗口Meltingtemperature∆GInternalStabilityFrq为邻近6至7个碱基组成的亚单位在一个指定数据库文件中的出现频率。该频率高则可增加错误引发的可能性。选中引物上游引物下游引物只是示意图引物分析KeyinformationofprimerHairpinDimerandcrossDimerGC%TotalPCRinformationFinalPCRinformationSearchforprimerusingOligo6.44Searchprimer