当前位置:首页 > 办公文档 > 统计图表 > 基于新一代测序技术的全基因组表达谱分析
BGI-Sequencing华大基因科技服务1基于新一代测序技术的全基因组表达谱分析通过对样本中数以百万计的mRNA标签进行序列测定,新一代测序技术可以使研究人员对特定组织或器官进行数字化的分析,而成本与目前其他模拟化分析技术接近。由于我们的技术无需利用任何基因特异性杂交探针,您可以同时进行基因表达的定性与定量分析,而无需事先知道基因组的注释情况。一、技术路线见图1-1。图1-1表达谱分析技术路线基于新一代测序技术的全基因组表达谱分析方法具有如下无可比拟的优势:1.数字化信号:直接测定每个基因的特异性表达标签序列,通过计数表达标签序列的数目来确定该基因的表达量,大大提高了定量分析的准确度。整体表达差异分布符合正态分布,不会因为不同批次实验引起不必要的误差;BGI-Sequencing华大基因科技服务22.可重复性高:不同批次的表达谱度量准确,能够更准确的进行表达差异分析;3.高灵敏度:对于表达存在差异的基因能够灵敏的检测其表达差异;能够检测出低丰度的表达基因;4.全基因组分析:由于该技术不用事先设计探针,而是直接测序的方式,因此无需了解物种基因信息,可以直接对任何物种进行包括未知基因在内的全基因组表达谱分析;5.高通量测序:已有数据表明,当测序通量达到200万个表达标签时,即可得到样本中接近全部表达基因的表达量数据,而目前每个样本分析可以得到300万~600万个表达标签;6.无需重复实验;7.可同时发现新的转录本、基因组表达调控区域等;8.高性价比,完整深入的生物信息学分析支持。该方法已经应用于各个物种的不同组织、器官等差异表达基因的研究及功能基因组研究等领域。近来又被广泛应用于包括各种疾病在内的临床医学研究等领域。根据案例分析和比较分析(详情见下),新一代测序技术的全基因组表达谱分析方法的优势:优势具体内容数字化信号案例分析内容1、图2-1可重复性好图3-1、图2-2高灵敏度图2-2、图2-4、图3-3全基因组分析案例分析内容5高通量测序案例分析内容1无需重复试验案例分析内容2、3可检测新转录本、基因调控案例分析内容5、比较分析内容6高性价比比较分析内容7Tips:新一代测序技术的全基因组表达谱的特点:1.Tag长度约为20~21bp;2.高通量:一次可以测得200万以上的Tag;3.测序技术而非杂交技术;4.高性价比,我们提供全套的实验设计、上机到生物信息分析的完整解决方案。利用表达谱数据,客户可以很容易的得到样品间的表达差异。准确、灵敏的捕捉到不同样品间差异表达的基因。为后续的分析提供十分可靠的参考基因集合。此外,我们将对差异表达的基因进行十分全面、深入的各类功能注释、信号通路等相关分析。力求最大限度的提供给客户最可靠、最全面的信息。二、新一代测序技术同芯片技术的比较分析1.Ratio的分布BGI-Sequencing华大基因科技服务3图2-1新测序技术(Solexa)和Array的Ratio分布图图2-1中,“UniqInArray”表示Array独有的数据,“UniqInSolexa”表示Solexa独有的数据,“Common-”表示两种样本(10T和5T)共有的数据。可以看出,Array的Ratio数据出现“异常”分布,出现“小鼓包”。2.两个样品之间的“信号”强度的关联性图2-2两个样品之间的“信号”强度关联性从上图可以看到,Array方法由于噪音干扰,cutoff的选取较不稳定。图2-1中的小鼓包在图2-2左图的圈中,说明“小鼓包”处很有可能出现错误。图2-2中,我们看到“UniqInSolexa”的表达基因数据大部分集中在(0,0)—(1.5,1.5)之间,表明使用新一代测序技术研究表达谱具有高敏感的特性,可以捕捉到很多低表达的基因。3.新一代测序技术的测序深度与Array信号强度的比较BGI-Sequencing华大基因科技服务4图2-3新一代测序技术的测序深度与Array信号强度的比较从图2-3上看到芯片数据在信号强度的cutoff上差异较大,体现了芯片信号强度(噪音强度)的不稳定性。另外,两种技术得到的数据有一定的相关性。在“核心区”,有80%的数据一致性较好。有一部分表达的基因在新一代测序技术中的Tag数较少,但是芯片有很高的强度。这部分恰好很多是处于Ratio分布的“小鼓包”处,不符合正态分布,错误的可能性极大。4.分段Ratio内的表达量分布分析图2-4分段Ratio内的表达量分布分析根据分段Ratio表达量分布,我们可以看出用新一代测序技术得到的表达谱结果的Ratio值更加灵敏。这是因为这种深度测序的方法得到的是数字表达谱,而芯片技术是杂交信号。5.两种技术数据的置信度分析由于深度测序用的Tag全部都是Unique的。即我们定位得到都是可信度很高的表达量数据。芯片由于杂交信号可能因为探针序列的相似性而互相影响。因此数据可能会有一些误差。关于探针序列相似性的影响:我们目前正在进行更深入地分析,以便估算芯BGI-Sequencing华大基因科技服务5片数据问题的大小。6.新测序技术产出数据的其他应用由于我们尚有50%的Tag数据没有应用。这些数据中,60%可以用于基因的分析,另有40%定位在基因组未注释的区域。通过使用新一代测序技术进行深度测序得到的数据,为进一步研究新的转录本、基因组表达调控区域等,提供了强大的数据支持。这部分工作尤其可以针对那些Ratio差异较大的区域进行更详细的生物信息学分析。另外,利用这些数据还可以进行一些结构突变的分析。对于生物信息分析而言,目前许多芯片厂家需收费进行基本分析。如一些芯片分析软件一年使用权达到1万美金,且仅仅只是得到基因的表达量而已。我们这里提供的是更多、更深入的后续分析,包括Pathway,GO,Cluster等,为客户提供最符合客户项目的解决方案。个别案例,还可以根据客户需求定制新的分析流程。三、案例分析肺癌组织的表达谱分析。选取2个肺癌病人(5T和10T)的组织提取总RNA,进行分析。实验目的为了检测两个病人中表达差异较大的基因,以便找出两个病人症状差异的原因,并进行下一步相关的研究。通过新一代测序技术进行表达谱测序的研究,可以开展如下的分析研究内容:1.数据质量的概述通过严格的质量标准筛选后,通过率达到80%,最终得到500万左右的Tag标签。2.标签的初步分析统计两个样品中有95%的Tag重复频度超过1,73%以上的Tag重复频度超过50。3.表达谱测序饱和度分析通过对表达谱测序饱和度的分析,通常在表达谱Tag数目达到200万时,测序Tag接近饱和。因此,通过新技术测序,仅需要1次试验,就可以得到足够后续进行表达分析的数据。4.样品重复性下图显示了新一代测序技术得到的表达谱测序数据的稳定性(图3-1)。BGI-Sequencing华大基因科技服务6图3-1表达谱测序数据可重复性分析5.Tag标签的注释(含cDNA,预测基因,EST,线粒体基因组,基因组等)本案例中,人的2万7千个基因中有50~60%都被Tag所覆盖。即一半的基因的表达量差异被检测出来。为了提高Tag同基因关联的可信度,我们仅仅选取了在基因序列中唯一定位的Tag。这部分唯一定位的Tag占全部Tag数目的50%左右。另外,除去上述用于基因表达量统计的唯一定位Tag,有大约20%的Tag被定位到了基因组的未注释区域,其中大约有10万个Tag在基因组上的位置是唯一的。利用这些数据我们找到了许多新的转录本和调控区域。同时发现了若干潜在的两个样品间显著差异的区域。为后续的实验提供了可靠的研究目标。6.参考Tag标签的统计分析表3-1显示的人的参考Tag的统计信息,我们可以看到96.53%的基因都拥有Tag。说明Tag-based新一代测序技术的方法进行表达谱分析的可行性。表3-1人的参考Tag的统计信息ReferenceTagDatabasesNO.PercentagecDNA27,239geneshaveCATGsite26,29596.53%No.oftotalreferencetags450,387No.ofunambiguoustags191,70542.56%No.ofambiguoustags258,6827.基因表达量的分布统计样品间的基因表达量的分布(图3-2)。BGI-Sequencing华大基因科技服务7a)b)图3-2a为10T的基因表达量分布;b为5T的基因表达量分布8.样本间表达差异基因的相关分析通过对表达差异基因的统计和分析,我们可以选取样品间表达存在差异的基因,反馈给用户;此外一些已经报道可能相关的基因,是这一部分研究的重点,通过表达差异,我们可以推测出相关基因可能发生的变化。针对此例,图3-3中2个基因是已经报道的在10T样品中高表达的基因。图3-35T和10T的基因差异表达分析9.样本间表达差异的信号通路的相关分析对差异表达的基因进行基因功能的分析,进行涉及信号通路的研究,提供可能被激发的信号通路列表,以便进行后续进一步分析。10.根据Tag距离3’端的位置对Tag和基因数目进行的统计分析BGI-Sequencing华大基因科技服务8图3-4Tag和基因数目的统计分析11.Tag标签表达同其反义Tag标签的表达关系通过对反义Tag的研究,可以探索是否存在反义表达的现象。华大基因科技服务北京中国北京市顺义天竺空港工业区B区6号楼(101300)电话:010-80481833传真:0755-25273865深圳中国深圳市盐田区北山工业区综合楼10层(518083)电话:0755-25273045传真:0755-25274284杭州中国浙江省杭州市之江路51号(310008)电话:0571-28955886传真:0571-28955881本资料的最终解释权归华大基因所有。
本文标题:基于新一代测序技术的全基因组表达谱分析
链接地址:https://www.777doc.com/doc-1060276 .html