芯片表达谱及RNA-seq应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

生物信息学第八章生物信息学其他应用8.1芯片表达谱及RNA-seq应用转录组•转录组:一个活细胞所能转录出来的所有RNA的总和NGS*****GeneChipAffymetrix基因芯片转录组测序(RNA-seq)基因芯片的定义•多种名称:基因芯片(GeneChip)、微阵列(Microarray)•固定着大规模的DNA片段,用于检测整个转录组内成千上万个基因的mRNA表达水平的变化的微型器材靶标(Target)探针(Probe)芯片实验及数据分析动画:提取RNA-反转录(-扩增)-标记-杂交-扫描-获得原始数据实验流程基因芯片的局限性•只能检测已知或确定性的序列•无法检测新发现的、未放置到芯片上的基因•有部分探针的信号可能会受到非特异性杂交及个体序列差异的影响GeneChipAffymetrix*****NylonmembraneIlluminaBeadArraycDNAmicroarrayAgilent:LongoligoInkJetCGHDifferentTechnologiesRNA-Seq的定义•RNASequencing,简称RNA-Seq,也被称为全转录组鸟枪法测序WholeTranscriptomeShotgunSequencing)是基于高通量二代测序技术的转录组学研究方法。GenesDev.2009.23:1379◆均一化(Normalization)◆总结(Summarization)◆补缺失值(Imputation)芯片数据前处理◆数据过滤(Filtering)◆背景纠正(Backgroundcorrection)背景纠正均一化转录组测序数据前处理--质控比对率插入片段长度碱基质量分数GC含量转录组测序数据前处理--定量•影响定量的因素––––转录本的长度测序深度PCR扩增批次效应(HaasandZody2010)转录组测序数据前处理--定量salmon每百万读段中来自于某基因每千碱基长度的读段数(ReadsPerKilobaseMillion)每百万片段中来自于某基因每千碱基长度的片段数(FragmentsPerKilobaseMillion)每百万转录本中来自于某基因的转录本数(TranscriptsPerMillion)转录组数据前处理--批次效应dat:表达量矩阵batch:批次协变量mod:其它协变量par.prior(非)参数经验贝叶斯方法(Haghverdi,Lunetal.2018)基因差异表达分析❖处理(Treatment)/对照(Control)❖一般取以2为底的对数:log2(Treatment/Control)◆差异表达统计显著性(P-value)C差异表达基因聚类◆层次聚类(Hierarchicalclustering)差异表达基因聚类◆K均值聚类(K-meansclustering)

1 / 15
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功