UCSC操作步骤

samuel09
1 ℃
2020-01-10

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

启动子区含有丰富的转录因子结合位点（transcriptionfactorbindingsites,TFBS）,启动子序列基本上是由这些短序列组合而成，主要在TSS上游1kb的范围内。在TSS附近-60bp到+40bp是核心启动子区，它对于精确转录是必须的最小单元。对于一个已知基因的启动子可以在NCBI上查到其转录起始位点,并通过网上软件初步分析该基因启动子的大致序列及一些顺式调控元件(分析时应把包括整个基因包括在内).常见的在线预测工具有：软件神经网络启动子预测器（NNPP，）,Promoterscan(),DragonPromoterFinder(),Promoter2.0PredictionServer()SoftBerry(),网上还提供了一些常见基因的数据库：真核启动子数据库第85版（TheEukaryoticPromoterDatabaseCurrentRelease85，EPD，）转录起始位点数据库：该数据库主要包括人，小鼠等常见生物的基因转录起始位点及该基因启动子的可能情况。通过初步分析后,还应通过实验的方法加以确认.包括PCR步查法(对于一些短的启动子来说).如果预测目的启动子为长启动子，PCR步查较难时，也可采用筛选基因组文库的方法，筛选阳性克隆子并送长的克隆去测序。对一些关键的顺式调空元件可以通过凝胶阻滞试验（蛋白基因作用）来加以确认。查询启动子的更多方法：1.UCSC（1）网址：在Genome里选择物种，比如human，search里输入你的基因名PTEN，点击Go（2）出现新的页面，看到“KnownGeneNames”下面的PTEN了吧，点它（3）又回到了和（1）类似的页面，此时，点击sequence（4）出现一个新的页面，选中promoter，同时可以输入数值修改具体的序列区域，比如Promoterincluding2000basesupstreamand100downstream，即表示启动子-2000～＋100区域（5）点击“getsequence”，出现页面中最上面的序列“uc001kfb.1(promoter2000100)PTEN-phosphataseandtensinhomolog”就是你要的人PTEN启动子-2000～＋100区域的序列了2、Ensembl（1）网址：在“SearchEnsembl“标题下search后的下拉框中选中物种名homosapiens（人），for框中输入基因名PTEN，点击Go（2）出现的新页面中比较乱，但不要管它，直接寻找“Ensemblproteincodinggene”字样的，对，也就是第二个，点击它（3）新出现的页面也很乱，不过依然不用管它，看到左侧有点肉色（实在不知道怎么描述了）的那些选项了吗，对，就是“YourEnsembl”下面那一堆，在里面找“Genomicsequence”，点它（4）现在的界面就一目了然了，在“5'Flankingsequence”中输入数值确定启动子长度（默认为600），比如1000，点击update；（5）出现的序列中，标为红色的就是基因的外显子，红色之间黑色的序列就是内含子，而第一个红色自然就是第一外显子了，那么从开始的碱基一直到第一个红色的碱基间自然就是启动子-1000~+1的序列啦这样，你不仅查到了启动子，连它的外显子、内含子序列也全部搞定了3、SIB-EPD（1）网址：（2）具体使用方法大同小异，就是输入物种名、基因名，限定启动子序列区域不过有了前两个，我想已经足够用了，个人感觉SIB-EPD的库容量太小，很多基因查不到总结一下：ensembl一般也和NCBI的一致，你的情况可能例外。这就不清楚了。ensembl有七个外显子可能有它自己的理由。另外，NCBI的基因中gene库中同时有ensembl和genbank的链接，不如从这个链接看看。此外，还可以看一看这个基因在物种间的同源性，以及其它物种有几个外显子，做为参考。综合考虑一下。给你提供几个启动子区域查找的网站，慢慢摸索会学到更多的。果蝇的PROMOTER2.0通常确定启动子的算法可以分成两种,一种根据启动子区各种转录信号,如TATA盒、CCAAT盒,结合对这些保守信号及信号间保守的空间排列顺序的识别进行预测。如PROMOTER2.0,用神经网络方法确定TATA盒、CCAAT盒、加帽位点(capsite)和GC盒(GCbox)的位置和距离,识别含TATA盒的启动子。PROMOTERSCAN根据转录因子结合部位在基因组中分布的不平衡性,将转录因子结合部位分布密度与TATA盒的权重矩阵(weightmatrix)结合起来,从基因组DNA中识别出启动子区[3]。但上述程序预测的假阳性率较高,PROMOTER210每23kb出现一个假阳性;PRO2MOTERSCAN平均每19kb出现一个假阳性。PromoterInspector另一种方法根据启动子区序列的特征进行预测。Promo2terInspector从一组训练序列中提取出启动子区的环境特征,并将外显子、内含子和3’端非翻译区的特征与启动子区加以区分,从而在基因组中确定启动子位置初来乍到，发个技术贴了！！1、获取目的基因的mRNA序列，并且在NCBI的数据库中查获转录起始点2、截取转录起始点为中心，上下约各1000bp，若在此范围内出现CDS，可到翻译起始点终止3、利用在线软件进行分析PromoterInspector://bimas.dcrt.nih.gov/molbio/proscanPromoter2.0://://://本人是采取多种软件结合的方法，由于proscan和promoter2.0的假阳性率较高，仅作为参考，而promoterinspector的特异性较高，结果比较可信。同时，利用CpG岛预测，作为辅助参考4、最后，可以找到小鼠的同源区，进行同源性比较，启动子区域一定是高保守区5、到此，可以初步预测启动子区域的范围了。请高手多多指教！！启动子预测：转录因子预测：此处亦有好多，自己挑吧！以下内容转自启动子及转录因子结合位点数据库及预测工具PROMOTERFINDINGANDANALYSISPROGRAMSONTHEINTERNET--------------------------------------------------------------------------------TRANSPLORER(TRANScriptionexPLORER)Dnanalyze(TFmapping)DragonPromoterFinder1.2(TSSfinderandpromoterregionanalysis)FunSiteP2.1HCtata(TATAsignalprediction)McPromoterVer.3MatInspector(SearchforTFbindingsites)ModelGeneratorandModelInspectorNNPP2.1(TSSfinder)PromoterInspector(Strandnon-specificpromoterregionfinder)Promoter2.0(TSSfinder)PromoterScanII(Promoterregionprediction)RGSiteScanSignalScan(SearchforEukaryoticTranscriptionalElements)TESS(SearchforTranscriptionElements)TFSEARCH(PredictsTFbindingsitesbasedonTRANSFACdata)TRANSFAC(TFdatabaseandanumberofassociatedprograms)TSSGandTSSWPROMOTER2.0通常确定启动子的算法可以分成两种,一种根据启动子区各种转录信号,如TATA盒、CCAAT盒,结合对这些保守信号及信号间保守的空间排列顺序的识别进行预测。如PROMOTER2.0,用神经网络方法确定TATA盒、CCAAT盒、加帽位点(capsite)和GC盒(GCbox)的位置和距离,识别含TATA盒的启动子。PROMOTERSCAN根据转录因子结合部位在基因组中分布的不平衡性,将转录因子结合部位分布密度与TATA盒的权重矩阵(weightmatrix)结合起来,从基因组DNA中识别出启动子区[3]。但上述程序预测的假阳性率较高,PROMOTER210每23kb出现一个假阳性;PRO2MOTERSCAN平均每19kb出现一个假阳性。PromoterInspector另一种方法根据启动子区序列的特征进行预测。Promo2terInspector从一组训练序列中提取出启动子区的环境特征,并将外显子、内含子和3’端非翻译区的特征与启动子区加以区分,从而在基因组中确定启动子位置FirstEF近来还有一些程序将上述方法与CpG岛(CpGislands)信息相结合。CpG岛是一段200bp或更长的DNA序列,核苷酸G+C的含量