利用blast寻找新基因

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1.利用blast寻找新基因。首先从一个已知的蛋白质序列出发,搜索一个DNA数据库,找到尚未注释的、与查询序列相关的序列匹配,得到新发现的基因和对应的蛋白质;采用多种措施(一般采用逐个序列的验证)来验证匹配结果,证实确实发现了新的基因。1、选择一条已知蛋白序列。2、将选择的蛋白质序列用TBLASTN进行搜索,选择HTGS,EST,GSS或者特定物种的基因序列。具体来说,就是点击最右边一列Accession,进入该基因的详情页面,主要看FEATURES,如果FEATURES下面只有source(有的还有gap或misc_feature等),不含有Protein、Region、Site、CDS等注释属性,则可初步判定它是未被注释的新基因。3、用数据库搜索来判断它是否是真的新蛋白质。4、找到对应的基因,开展后续研究工作。实例略2分子进化树(写一种方法,原理,实例)距离法又称距离矩阵法,首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。再依据进化距离,分别依次将序列合并聚类,构建进化树。FM算法的基本步骤•1、找出关系最近的序列对,如A和B•2、将剩余的序列作为一个简单复合序列,分别计算A、B到所有其他序列的距离的平均值,用这些值来计算A和B间的距离•3、将A、B作为一个单一的复合序列AB,计算与每一个其他序列的距离,生成新的距离矩阵•4、确定下一对关系最近的序列,重复前面的步聚计算枝长•5、从每个序列对开始,重复整个过程•6、对每个树计算每对序列间的预测距离,发现与原始数据最符合的树实例略3、一个印象深刻的课件4、预测蛋白质的方法,怎么样预测(哪些数据库)蛋白质结构预测有主要3种方法。1、通过实验的方法,主要是X射线晶体学和核磁共振的技术。2、比较-同源模建方法。通过将目标蛋白序列与一个或几个已知结构的同源蛋白(模板)进行比较,从而预测目标的结构。当目标与模板的序列相似度较高时比较-同源模建相当有效。3、从头预测的方法。这种方法仅通过物理学原理来预测目标的结构。(课本)SWISS-MODEL进行同源建模的步骤(PPT)第一步:通过蛋白质数据库(Swiss-prot)检索到目标蛋白质序列。第二步:将该目标蛋白序列与晶体图像数据库(ExPDB)中的蛋白质序列比较,判断是否有与目标蛋白充分相似的同源序列。第三步:在存在同源序列的情况下,进行分子建模。(在多个同源序列存在的情况下,也可以将建立的三维结构模型提交给“项目/优化模式(project/optimisemode)”,从而修正提出的结构模型。)第四步:通过RasMol将分子模型显示出来。同源建模主要包括4步:(课本)1,、首先指定折叠类型并选择模板。利用BLAST和PSI-BLAST之类工具搜索同源蛋白质序列和结构。可以从PDB、CATH、SCOP等数据库,对目标进行搜索,根据结果分析从而确定结构保守区和可变区。2、将目标与模板对齐。对于远缘的蛋白质,很难得到精确的比对结果。如果目标与模板有30%以上的序列相似性且匹配区域长度足够(60个残基),那么他们很可能具有相似的结构。3建立模型。可用多种方法,如刚体装配和片段匹配。4评估模型。.5、如何构建PAM矩阵?1)构建序列相似(大于85%)的比对。2)计算氨基酸j的相对突变mj(j被其它氨基酸替换的次数)fj=氨基酸j的数目/总氨基酸数目j:第j种氨基酸;Mj:氨基酸j的突变率fj:每种氨基酸出现的频率;100:每100个残基发生一次突变(1%)3)针对每个氨基酸对i和j,计算j被i替换次数。4)替换次数除以相对突变率(mj)5)利用每个氨基酸出现的频度对j进行标准化6)取常用对数,得到PAM-1(i,j)1001002jjjjfMfjm总替换数总共发生替换数氨基酸7)将PAM-1自乘N次,可以得到PAM-NPAM2=PAM1*PAM1PAM250=(PAM1)250PAM-N=(PAM1)n

1 / 3
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功