基于全基因组snp数据如何进行主成分分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1)全基因组snp数据格式为.vcf2)利用vcftools软件进行格式转换:vcftools--vcftmp.vcf--plink--outtmp此时会生成两个文件:tmp.ped和tmp.map3)利用plink软件进行数据格式转换:./plink--noweb--filetmp--make-bed--outtmp注意,输入文件和输出文件都不需要文件名的后缀,此时生成3个文件:tmp.bed,tmp.bim和tmp.fam4)利用gcta软件进行pca构建4.1./gcta--bfiletmp--make-grm--autosome--outtmp此时生成一个文件:tmp.grm.gz4.2./gcta--grmtmp--pca3--outpcatmp此时生成两个文件:pcatmp.eigenval和pcatmp.eigenvec5)将生成的pcatmp.eigenvec用文本编辑器打开,在最上面加入一行:12pc1pc2pc3(之间以空格隔开),保存6)打开R软件6.1输入文件:a-read.table(D:/pcatmp.eigenvec,header=TRUE)6.2绘散点图:plot(a$pc1,a$pc2,pch=c(1,2,3,4,5,6,7,8,9,10),col=c(1,2,3,4,5,6,7,8,9,10),main=pca,xlab=pc1,ylab=pc2)6.3添加图例:legend(bottomleft,c(CL,IN,GZ,DA,PP,YN,DX,JY,NP,SL),pch=c(1,2,3,4,5,6,7,8,9,10),col=c(1,2,3,4,5,6,7,8,9,10))文件另存为JpegorTiffThat'sall,Gameover.再次向基因组-health(213256700)予以致谢!

1 / 2
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功