摘要:现在最常用的两种分析实时定量PCR实验数据的方法是绝对定量和相对定量。绝对定量通过标准曲线计算起始模板的拷贝数;相对定量方法则是比较经过处理的样品和未经处理的样品目标转录本之间的表达差异。2-△△CT方法是实时定量PCR实验中分析基因表达相对变化的一种简便方法,即相对定量的一种简便方法。本文介绍了该方法的推导,假设及其应用。另外,在本文中我们还介绍了两种2-△△CT衍生方法的推导和应用,它们在实时定量PCR数据分析中可能会被用到。关键词:反转录PCR定量PCR相对定量实时PCRTaqman反转录PCR(RT-PCR)是基因表达定量非常有用的一种方法(1-3)。实时PCR技术和RT-PCR的结合产生了反转录定量PCR技术(4,5)。实时定量PCR的数据分析方法有两种:绝对定量和相对定量。绝对定量一般通过定量标准曲线来确定我们所感兴趣的转录本的拷贝数;相对定量方法则是用来确定经过不同处理的样品目标转录本之间的表达差异或是目标转录本在不同时相的表达差异。绝对定量通常在需要确定转录本绝对拷贝数的条件下使用。通过实时PCR进行绝对定量已有多篇报道(6-9),包括已发表的两篇研究论文(10,11)。在有些情况下,并不需要对转录本进行绝对定量,只需要给出相对基因表达差异即可。显然,我们说X基因在经过某种处理後表达量增加2.5倍比说该基因的表达从1000拷贝/细胞增加到2500拷贝/细胞更加直观。用实时PCR对基因表达进行相对定量分析需要特殊的公式、假设以及对这些假设的验证。2-△△CT方法可用于定量PCR实验来计算基因表达的相对变化:2-△△CT公式的推导,以及实验设计,有效性评估在AppliedBiosystemsUserBulletinNo.2(P/N4303859)中有介绍。用2-△△CT方法分析基因表达数据在文献中也有报道(5,6)。本文介绍了该方法的推导、假设以及应用。另外,本文还介绍了2-△△CT两种衍生方法的推导和应用,它们在实时定量PCR数据分析中都可能被用到。1.2-△△CT方法1.1.2-△△CT方法的推导PCR指数扩增的公式是:这里,Xn是第n个循环後目标分子数,X0是初始目标分子数,Ex是目标分子扩增效率,n是循环数,CT代表目标扩增产物达到设定阈值所经历的循环数。因此:XT是目标分子达到设定的阈值时的分子数。CT,X是目标分子扩增达到阈值时的循环数。Kx是一个常数。对于内参反应而言,也有同样的公式:用XT除以RT得到:对于使用Taqman探针的实时扩增而言,XT和RT的值由一系列因素决定:包括探针所带的荧光报导基团、探针序列对探针荧光特性的影响、探针的水解效率和纯度以及荧光阈值的设定。因此常数K并不一定等于1。假设目标序列与内参序列扩增效率相同:或:XN代表经过均一化处理过的初始目标分子量;△CT表示目标基因和内标基因CT值的差异(CT,X-CT,R)整理上式得:最后用任一样本q的XN除以参照因子(calibrator,cb)的XN得到:在这里对于一个少于150bp的扩增片断而言,如果Mg2+浓度、引物都进行了适当的优化,扩增效率接近于1。因此目标序列的量通过内均一化处理之后相对于参照因子而言就是1.2.2-△△CT方法的假设和应用要使△△CT计算方法有效,目标序列和内参序列的扩增效率必须相等。看两个反应是否具有相同的扩增效率的方法是看他们模板浓度梯度稀释後扩增产物△CT如何变化。图1显示的是cDNA样品在100倍稀释范围内的实验结果。对于每一个稀释样本,都用GAPDH和c-myc特异的荧光探针及引物进行扩增。计算出c-myc和GAPDH的平均CT值以及△CT值,通过cDNA浓度梯度的log值对△CT值作图,如果所得直线斜率绝对值接近于0,说明目标基因和内标基因的扩增效率相同,就可以通过△△CT方法进行相对定量。在图1中,直线斜率是0.047,因而假设成立,△△CT方法可以用来分析数据。如果两个扩增反应效率不同,则需要通过定量标准曲线和绝对定量的方法来进行相对定量;或者也可以重新设计引物,优化反应条件使得目标序列和内参序列具有相同的扩增效率。1.3.2-△△CT内标和参照因子的选择使用内标基因的目的是为了对加入到反转录反应中的RNA进行均一化处理。标准的看家基因一般都可被用作内标基因。适合于实时PCR反应内标基因包括GAPDH,β-actin,β2-microglobulin以及rRNA。当然,其它的看家基因也同样能被用作内标。我们推荐在应用某一基因作为内标之前首先确证该基因的表达不会受实验处理的影响。验证实验处理是否对内标基因表达产生影响的方法在2.2部分有描述。2-△△CT方法中参照因子的选择决定于基因表达定量实验的类型。最简单的设计就是把未经处理的样品作为参照因子(calibrator)。经内标基因均一化处理後,通过方法计算,目标基因表达差异通过经过处理的样本相对于未经处理的样本的倍数来表示。对于未经处理的参照样,△△CT=0,而20=1。所以根据定义,未处理样本的倍数变化为1。而对于那些经过处理的样本,相对于参考因子基因表达的倍数为2-△△CT。同样的分析也可用于不同时相的基因表达差异,在这种情况下,一般选0时刻的样本作为参照因子。有些情况下,并不是比较不同处理样本基因表达差异。例如,有的是想看某一器官中特定mRNA的表达。在这种情况下,参照因子可能是另一器官中该mRNA的表达。表1显示了大脑和肾脏总RNA中c-myc和GAPDH转录本的CT值。在这一个例子中,大脑被人为的选择为参照因子,通过计算得到肾脏c-myc表达量经GAPDH校正後相对于大脑的表达量的结果。尽管相对定量方法可用于这种组织之间的比较,但结果的生物学解释是相当复杂的。不同种类细胞中目标和参照转录本单一的相对量变化可能在任何特定的组织中都存在。1.4.2-△△CT方法的数据分析实时定量PCR所得到CT值可以很容易的输出到表格程序如MicrosoftExcel中去。为了显示数据分析过程,我们在这里给出了一个基因表达定量的实验数据和样本列表。通过β-actin均一化处理,我们对目标基因fos-glo-myc的表达变化进行了监测。在8h的时间范围内,在每一时间点都取3个重复样本,每一样本在cDNA合成之後都做定量PCR,数据分析用到了公式9,即:Timex表示任意时间点,Time0表示经β-actin校正后1倍量的目标基因表达。0时刻目标基因和内标基因的平均CT(见图2第8栏)被用于公式9中。通过公式9计算出每一个样本目标基因表达通过β-actin均一化处理後相对于0时刻的倍数(见图2第9栏)。平均SD,CV由每一个时间点所取的三个重复样求得。用这种分析方法,在0时刻的平均倍数变化接近于1。我们发现通过检测在0时刻平均倍数变化是否为1可以很方便的验证三个重复样品之间是否有错误或者误差。如果得到的结果与1偏差很大,则表明存在计算错误或者是很高的实验误差。在前面的例子中,在每一时间点上分别取了三个独立的RNA样本进行了分析。因此对每一个样本分别处理,通过计算後取结果的平均值就非常重要。如果是同一样本进行PCR扩增的重复,这就需要首先求出平均CT,然後再进行计算。怎么样计算平均值就要看目标基因和内参基因是在同一个管子中扩增还是在不同的管子中扩增。表1给出了目标基因(c-myc)和内参基因(GAPDH)在不同管中扩增的实验数据。在这里不应该把任一单个的c-myc管子和GAPDH管子作比较,而应该分别计算出c-myc和GAPDH的平均CT来计算△CT。重复实验中CT值的估计偏差通过标准的指数计算转化成最後结果中相对量的变化。但其中的一个难点是CT值与相应的拷贝数成指数关系(见第4部分),因此,在最後的计算中,的误差通过△△CT加上标准偏差和△△CT减去标准偏差来评估,这就使得求得的数值相对于平均值呈不对称分布。不对称分布是因为结果经指数处理後转化成量的线性比较造成的。通过不同荧光染料标记的探针,我们可以在同一管中同时扩增目标序列和内标序列。表2给出了目标基因(c-myc)和内标基因(GAPDH)在同一管中扩增的实验数据。对于任意一个管子,目标基因(c-myc)和内参基因(GAPDH)扩增时加入的cDNA量都是一样多的,所以可以分别对每个管子计算△CT值,这些值取平均后再进行计算。在这里估计误差值也是一个不对称的范围,反映了误差经指数处理转化为线性差异。在表1和表2中,估计误差在从△CT到△△CT的计算中未见有增加,这是因为我们把参照基因和检测基因的误差都显示出来了。我们把△CT,cb当作一个人为设定的常数来减去,得到△△CT。这样得到的结果就与图2所显示的在求平均之前对不同重复样本分别通过各自的CT值求实所得结果相当。另一种方法是将参照基因当作没有任何误差的1倍的量,在这种情况下,平均△CT,cb的误差值被引入到每一样本的△△CT中。在表1中,肾脏中△△CT变成-2.50±0.20而经过校正的c-myc量是5.6倍,范围从4.9到5.6。而在大脑中的结果是没有误差的1倍。2.2-△Cf方法2.1.2-△Cf方法的推导通过内标RNA可以对加入RNA的量的差异进行校正。2-△△CT方法的数据分析的一个特点就是能够利用实时PCR实验的一部分数据来完成这种校正。在其它的方法不能定量初始RNA量的时候:例如,在能得到的RNA量非常有限的时候或者需要处理高通量的样品的时候,这一方法的优势就格外明显。当然我们也可以利用PCR实验以外的方法来完成这种校正。最常用的一种方法就是用紫外吸收来确定用于cDNA合成的RNA量,然後将相同的RNA反转录产生的cDNA用于PCR定量反应。这种外标法校正的一个应用例子就是研究某种实验处理是否影响内标基因的表达。在这里,目标基因和内标合二为一。在这个例子中,公式[2]不被公式[3]除,公式[5]变成:整理得:任一样品X0,q除以参照品X0,cb得:在这里△C'T=CT,q-CT,cb。△C’T与前面计算中用的△CT(用目标基因CT值减去参照基因CT值)相互区别。就象在1.1部分所描述的,如果条件优化较好,效率接近于1,内标相对于参照因子为:2.2.2-△Cf方法的应用2-△CT'方法的一个应用就是确定实验处理对某一候选内标基因的影响。为了显示这一过程,我们做了血清饥饿/诱导实验(7)。血清饥饿/诱导是研究某些mRNA降解的常用方法(8)。然而,血清可能影响一些基因的表达包括标准的看家基因的表达。在24-h血清饥饿培养之後,在NIH3T3细胞中加入15%血清诱导基因表达。从细胞中提取Poly(A)+RNA,并将之反转录成cDNA。利用SYBRGreen通过实时定量PCR检测GAPDH,β2-microglobulincDNA的量。GAPDH和β2-microglobulin各自的相对量通过2-△CT'公式求得。细胞处理对于GAPDH的基因表达有明显影响,但对β2-microglobulin没有什么影响。因此β2-microglobulin很适合做血清刺激定量实验的内标,而GAPDH并不适合。这一例子向大家展示了在只研究一个基因的时候怎么用2-△CT'的方法分析基因相3.实时PCR数据的统计学分析实时PCR最终分析的是阈值循环或CT。CT值通过PCR信号的对数值和循环数来确定。因此CT值是一个指数而非线性概念。因此,在任何统计分析中都不要用原始的CT值来表示结果。正如我们在前文中所描述的一样,PCR相对量通常和内标和参照样本一起计算而很少直接用CT值来表示,除非我们想检验重复样本之间的差别。为了向大家显示这一点,我们用SYBRGreen通过real-timePCR来检测相同cDNA的96个重复反应。所有反应组分在同一管中混好後分装到96个管中,做实时PCR分析,得到了每一个样本的CT值。为了比较样品间变化,计算了96个样本的平均±SD,如果通过原始CT值计算,平均±SD是20.00±0.193,CV为0.971%。但是如果把原始CT值用2-CT转化成线性形式,平均±SD是9.08×10-7±1.33×10-7,CV为1