宫颈癌基因芯片数据的差异表达和聚类分析实验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

实验名称:宫颈癌基因芯片数据的差异表达和聚类分析实验目的:1.掌握GeneExpressionOmnibus数据库(GEO)的搜索及基因芯片数据的获得方法。2.熟悉MeV软件进行差异表达分析及聚类分析的操作方法及结果解释。3.熟悉网络搜索工具,浏览器及生物信息中心,掌握医学信息获取途径。实验方法和流程:一、选择研究基因选定感兴趣的基因芯片数据:宫颈癌是常见的恶性肿瘤之一,严重危害人群的健康。研究显示宫颈癌的发生发展是一个由多基因参与,通过多途径作用,经过多阶段而逐渐演变的过程。基因芯片作为一种高效、大规模获取生物信息的技术,能检测和分析肿瘤与正常组织的差异表达基因。本研究利用公共基因芯片数据库GEO中的芯片数据。对宫颈癌基因芯片数据的差异表达和聚类分析。↓输入网址进入GEO数据库↓选择GEODataSets键入检索词humanandcervicalcancer↓点击Search,进入数据库点击LargeRS-likefactorSONknockdowneffectinHeLacervicalcancercellline↓数据集编号自上而下为标题、数据集描述、物种(人类)、平台号、索引出处、系列号、样本数量、数据类型、公布时间几个缩写的涵义:(1)GPL——Platform,描述实验平台的信息,对芯片平台而言,描述芯片类型及芯片上的探针(probe或feature)的数据,据此可以得知特定芯片包含多少个探针,每个探针对应着哪一个基因等信息;(2)GSM——Sample,描述单个芯片试验的杂交数据,据此可以得知特定样本与芯片杂交之后测得的mRNA表达量或SNP等位基因型等信息;(3)GSE——Series,包含一系列的GSM,样本间存在相关性,据此可以得知多个相关样本的所有基因的表达量等信息;(4)GDS——Dataset,由GEO职员根据GSM编纂组合起来的条目,与GSE类似,同样描述了多个相关样本的所有基因的表达量等信息。点击右上角Samplesubsets可以看到研究采用的GDS4448宫颈癌基因芯片数据集,包含6个样本(GSM662184~GSM662189),其中有3例宫颈癌样本(实验组)和3例正常样本(对照组)。下载选择基因二、MeV软件操作1、数据预处理,删除GDS4448.soft(可用Excel打开)里面非数据部分信息2、打开MeV导入数据GDS4448.soft基因芯片由荧光标记法分为单色标记与双色标记,前者大多用于寡核苷酸芯片实验,后者多用于cDNA芯片。单色标记中,不同样品使用一种荧光染料与芯片杂交,双色标记将两个RNA样品分别与不同荧光素(Cy3、Cy5)标记然后与同一芯片杂交。探针对应的基因在测试样本中相对高表达,显示为红色,相对低表达相似为绿色,均不表达为黑色。红绿颜色的相对强度则反映基因在两种样本中表达的数量之比。3、数据过滤因为所选基因芯片包含22277个基因,需要过滤掉一些生物信息量小的基因。这里我们选择方差过滤4、聚类分析聚类结果图不同颜色表示相对表达量样本名基因名欧式距离存储和注释感兴趣的分类:5、使用SAM查找差异表达基因分为4类显著基因126个差异表达基因结果图红色为相对高表达(正相关),绿色为相对低表达(负相关),黑色为均不表达。ExpressionImages:positivesignificantgeneExpressionImages:negativesignificantgeneExpressionImages:allsignificantgeneExpressionImages:nonsignificantgeneExpressionGraphs:positivesignificantgene(120)CentroidGraphs:positivesignificantgeneExpressionGraphs:negativesignificantgene(6)CentroidGraphs:negativesignificantgene

1 / 18
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功