用BankIt向NCBI在线提交序列向NCBI提交序列常用的方法有两种,其一是在线提交的BankIt,其二是用软件Sequin。在此结合网络牛人实际操作经验来总结下如何通过BankIt在线提交DNA或RNA序列,供参考。1.整理序列信息:包括病原采集地、病原的寄主、寄主症状、采集人等基本信息;还有序列分析结果,包括序列全长大小,开放阅读框(ORF)的长度、位置及特定ORF序列翻译的氨基酸序列等基因水平的信息,这对于接下来的快速准确提交序列及提交成功后为全世界其他作者准确全面分享此类信息很重要;2.登陆BackIt站点,注意到页面右边的“SignintouseBankIt”标签,点击登录进入。如果没有账号就注册一个(注意,此账号与ncbi账号不通用)。附注册账号步骤,需要填写的项目为:Title:你的职位或头衔Firstname:名lastname:姓login:登陆名Affiliation:所属机构地址,一般填写自己学校地址E-mailAddress:通信电邮,填完后会发随机密码到此电邮地址,使用随机密码进行登陆,当然登陆后可对密码进行重置;3.登陆BankIt,看到如下图所示界面,此时NCBI会自动分配一个SubmissionID,但不是最终的提交序列ID:接下来共有九个步骤(好事多磨):3.1ContactInformation填写个人姓名、机构、电邮等资料集联系方式,如果错误该页会有ERROR提示直到正确填写,填写完毕点击CONTINUE;3.2Reference填写参考作者信息(Referenceauthor)及序列相关信息,比如该序列是否对应有文章,如单纯提交序列则只需选择Unpublished即可(Referencetitle项可以填入“DirectSubmission”),有的话就填写已发表文章的信息(卷、期等),接下来会问你该序列的提交者是否是序列的发现者等信息,填写完毕点击CONTINUE;※提示:新版的BankIt中,接下来会有“SequencingTechnology”一项,呈现有454、Illumina、SOLiD及Other等测序方法选择,目前为“Sangerdideoxysequencing”即一代测序方法测序,并且所提交的序列均为“assembledsequences”,目前的“assemblyprogram”为“Lasergene,version7.0”。3.3Nucleotide包括三个小项:SubmissionReleaseDate(期望NCBI什么时候公布你的序列)、16SrRNAsubmissions(该序列是否为16SrRNA)、Sequence(s)andDefinitionLine(s)(会提示问你该序列是否为全长genomicDNA、线状或环状等、序列长度,需要复制序列或提交FASTA格式文件),如若序列长度与复制序列或FASTA文件长度不同则会有提示,需要重新提交序列,依次选择即可。一般选择“ImmediatelyafterProcessing”,“非16SrRNA”,“genomicDNA”,“circular”,“complete”等信息,然后将全序列粘贴到下方的空格中,别忘了在上方写上总核苷酸数。完后审查看有没有错误,继续CONTINUE;3.4Organism填写Organism(病原物)的名字,即序列公开显示时候的标题(如MYVYNV分离物序列“MalvastrumyellowveinYunnanvirusisolateSC226-5,completegenome),点击CONTINUE后会出现自动检索项目,核对后(有可能会进行选择)继续CONTINUE;3.5SubmissionCategory提交范畴,是否直接提交或通过第三方Annotation提交(不是太清楚什么意思,可能指的是从EMBL和DDBJ中导入的数据吧),一般为直接提交,如下图示选择Original,继续CONTINUE;3.6Sourcemodifier选择该病原物的种类,比如质粒、线粒体等;Sourcemodifier下拉菜单及后面的Value设置:进一步选择该病原物获取信息,比如Country、Host、Clone、Collectiondate、Strain/Isolate等,至少三项(Organelle/Location为细胞器/位置,该项可以不填写),否则该项不通过,尽量信息全面真实,需要继续添加则点击Add,填写完毕查看下方已填写表格进行信息核对,然后CONTINUE;3.7PrimersPCR引物项目,可选项目,不想填写可CONTINUE;3.8Features(※)该步骤重要!将用到之前准备的内容,比如序列内ORFs等信息的填写,并根据之前的选项来填写该步骤,比如需要将DNA翻译为氨基酸序列并进行复制粘贴等,该步操作只需将之前准备信息录入即可,比较耗时;点击下方“ADD”键,页面将切换为↓在这里我们需要录入更多与该序列有关的信息,最主要的就是录入之前已经整理好的序列里面的开放阅读框(ORF)信息:GeneticCode设置为”Standard“,5'和3'都勾选上,ProteinName/ProteinDescription项都填写,将特定区域(ORF)的核苷酸序列翻译为氨基酸序列后(除去末端的终止子)复制到下方的”AminoAcidSequence“框中,依次录入即可。在这里越详细越好,具体参照实际操作;3.9ReviewandCorrect对已填写信息进行复核及提交,并被告知在2个工作日之内会收到NCBI电邮,需要进一步对序列进行审查核对;4.至此,基本序列提交已经完工,剩下的事情就是等待审核,大概两个工作日后会收到来自NCBI工作人员的电邮,如有问题会通知你进一步修改信息直到完全无误,包括以后的接受序列号,即你的序列会出现在NCBI里面世界上唯一的一个界面里。