研究生课程论文题目:基因芯片技术及其应用研究进展课程:分子生物学姓名:贾玉臣学号:Y200801502009年5月1基因芯片技术及其应用研究进展摘要:作为后基因组时代中重要实验手段的基因芯片技术,因其自动化程度高、效率高、准确率高等优点,已经应用于许多领域。本文从基因芯片的原理、分类、制备及其数据的处理与分析来概括性地介绍了基因芯片技术,然后在当前基因芯片技术应用研究基础上,对基因芯片技术的前景进行了展望。关键词:基因芯片,芯片数据分析,应用研究GenechipandtheadvancesofstudiesonitsapplicationAbstract:Genechip,animportanttechnologyinpost-genome,hasbeenappliedinmanyfieldsasitsadvantagesofautomation,efficiencyandaccuracy.Genechiptechnologyisbrieflyintroducedfirstlyfromitsprinciple,classification,productionanddataanalysis,thenaprospectongenechipismadeonthebasisofitscurrentapplication.Keywords:Genechip,analysisofchipdata,studiesonapplication随着人类基因组计划(HPG)的提前完成以及分子生物学相关学科的迅猛发展,越来越多的动植物、微生物基因组序列得以测定,基因序列数据正在以前所未有的速度迅速增长。然而,怎样去研究如此众多基因在生命过程中所担负的功能就成了全世界生命科学工作者共同的课题。为此,建立新型杂交和测序方法以对大量的遗传信息进行高效、快速的检测、分析就显得格外重要了。可以说,人类基因组计划催生了基因芯片技术。基因芯片又常被称为DNA微阵列(DNAMicroarray)或DNA微阵列芯片,是后基因组时代中的重要实验手段。基因芯片(GeneChip),是指将大量特定的寡核苷酸探针分子有序地、高密地固定于支持物上,然后与进行了标记的样品进行杂交,通过检测杂交信号的强度及分布进而对靶分子的序列和数量进行分析。目前在基因芯片的基础上,又发展起来了许多其它生物芯片,可以说,广义上的生物芯片正是起源于基因芯片。所谓的生物芯片是指高密度固定在固相支持介质上的生物信息分子(如寡核苷酸、基因片段、cDNA或多肽、蛋白质)的微阵列,阵列中每个分子的序列及位置都是已知的,并且是预先设定好的[1]。由于基因芯片能一次检测大量的目标分子,自动化程度高、效率高、准确率高,在研究2基因表达、疾病诊断、发现新基因、DNA测序和药物筛选中有广泛的应用前景[2]。因此,本文将在主要概述基因芯片技术的基础上,介绍一些基因芯片技术的应用及其研究进展。1基因芯片概述1.1基因芯片的原理基因芯片的测序原理是杂交测序方法,即通过与一组已知序列的核酸探针杂交进行核酸序列测定的方法。在一块基片表面固定了一定数量序列已知的核苷酸的探针。当溶液中带有荧光标记的靶核酸序列,经退火后,与基因芯片上对应位置的核酸探针产生互补匹配杂交时,通过确定荧光强度最强的探针位置,获得一组序列完全互补的探针序列,据此可重组出靶核酸的序列。大规模基因测序或多态性分析时,每个核苷酸或突变点都必须检测出来。因此,通常设计出一套大量的核苷酸探针,在靶序列上跨越每个位点,只在中央位点的碱基设计上有所不同,根据每套探针在每个位点的杂交严谨程度,即可测定出该碱基的种类。如果基因芯片仅是用于检测基因表达的差异,只需设计出针对基因中特定区域的几套寡聚核苷酸即可。基因芯片把大量已知序列探针集成在同一个基片上,经过标记的若干靶核酸序列通过与芯片特定位置上的探针杂交,便可根据碱基互补匹配的原理确定靶基因的序列。对于核酸探针而言,杂交温度是非常重要的,必须要经过反复的优化以达到最佳杂交效果[3]。1.2基因芯片的分类由于基因芯片的制备方法和应用范围的不同,可以将基因芯片依据不同的标准分为不同的种类。按载体材料区分:(1)固定在聚合物膜(如尼龙膜,硝酸纤维膜等)表面上的膜芯片。这种方法的优点是所需检测设备与目前分子生物学所用的放射显影技术相一致,相对比较成熟。但芯片上探针密度不高,样品和试剂的需求量大,定量检测存在较多问题。(2)固定在玻璃板上的玻璃芯片。这种方法点阵密度可有较大的提高,各个探针在表面上的结合量也比较一致,但在标准化和批量化生产方面仍有不易克服的困难。(3)固定在硅板上的硅芯片。(4)固定在陶瓷表面的3陶瓷芯片等。按制作方法可分为原位合成芯片、直接点样法芯片等。按载体上探针的种类可分为寡聚核苷酸芯片和cDNA芯片等。如果按应用区分,总的来说又可分为表达谱芯片和检测芯片。平常所说的基因表达谱芯片其实是从应用上讲,可用于对基因及其表达的量进行检测的芯片,寡聚核苷酸芯片和cDNA芯片都可用于表达谱研究。cDNA可以通过PCR扩增出,[4],一般而言,基因表达谱芯片主要用于研究基因的功能,是指将待测及对照组的mRNA通过逆转录将荧光分别标记到两种组织的cDNA上,并与基因芯片进行杂交及荧光信号扫描,通过计算机处理就能确定芯片上的基因结合了探针的量,从而来判定此基因是否表达,或在两种组织中的表达是否有变化。1.3基因芯片的制备1.3.1载体的准备制备基因芯片,首先要选择一个合适的固相支持物-载体,以供基因能在上面进行杂交反应,一般的载体包括膜、玻片、塑料、陶瓷及硅等。目前,经过化学修饰的玻片越来越成为人们青睐的对象,比如进行多聚赖氨酸修饰、APS氨基修饰、APS-PDC(异硫氰酸)修饰、APS-GA(戊二醛)修饰以及硫基修饰等,它具有其它载体所不能比拟的诸多优点:可耐受高温、离子强度高、退火质量提高、荧光信号本底低背景干扰弱、点样方便,而且成本较低。1.3.2基因探针的制备探针的设计是芯片设计中的核心,探针的特异性决定芯片杂交结果的特异性,同时根据不同的研究目的,探针在选择特异性区域和保守区域时应各有侧重点。另外,探针设计还与检测的灵敏度和稳定性密切相关。就探针的来源,目前比较常用的有cDNA探针和寡核苷酸探针。cDNA探针就是与mRNA互补的DNA,由逆转录方法获得,一般被认为是真实表达的基因。完整cDNA的长度从几百个碱基对到几千个碱基对之间,由于cDNA文库构建技术已经相当成熟,人们比较容易获得一个组织或个体大量种类的cDNA,这些从文库中扩增的得到的cDNA经纯化、检测、定量分析后溶解在适当的缓冲液中,可作为探针在点样法制备基因芯片时直接使用。4寡核苷酸探针是人工合成的,随意性好,设计创意的空间也大。设计寡核苷酸探针时,研究人员必须要对该基因有着充分的了解。是选择基因的保守区域还是特异性区域、是一段还是几段、是保留突变点还是另引入新的突变位点等,都要求实验人员根据自己的实际要求来考虑。一般来说,寡核苷酸探针既可以用于检测芯片的制备,也可用于表达谱芯片的制备。长度一般选取在15~70mer左右的片段,探针往往在5’端进行氨基修饰,考虑探针在杂交过程中的自由度,在探针的5’端氨基后紧跟12个碳原子。探针的杂交区域应尽量避免存在二聚体结构。目前比较通用的DNA合成方法是亚磷酰胺三酯法,合成每个单核苷酸都需要四步以上的操作。美国安捷伦以及国内的赛百盛等公司都可提供寡核苷酸合成服务。当然,如果自己拥有一台DNA合成仪的话,就可以随时依照自己的意愿来合成目的寡核苷酸片段。一套合适的参照体系的运用,既保证了基因芯片质量的稳定性,又保证了其在不同实验条件下的可对比性。(1)阳性对照:一般选用管家基因,是指基因表达水平比较稳定,不太受环境变化而产生变化的一类基因,它能保证各种芯片杂交试验中基本都能保证表达的稳定性,因而它们在各芯片上的信号应该保持一致,以它们作为校验标准,可以保证同一芯片上不同杂交样品间或不同芯片的杂交样品间表达信号的可对比性。(2)阴性对照:一般选用与所研究基因无同源性的其它种属的基因作为对照。(3)空白对照:一般选用不含任何基因的点样稀释液,空白对照可以作为分析芯片杂交结果时本底信号的参照[1]。1.3.3点样及点样后处理所谓点样,就是指利用点样仪将已经得到的探针序列通过接触式针点或非接触式喷点的方法点到预先进行过化学修饰的基因芯片载体上,由于核酸分子中磷酸基团的负电性使之可以通过静电相互作用同载体表面牢牢地连接起来[5]。Hegde等[6]运用将浓度为0.2mg/mL的纯化的PCR产物与二甲亚砜按1:1的比例来进行点样。在基因芯片的制备过程中,对点完样的芯片进行后处理是其最后一道工序,也是其中非常关键的一道工序。点样后处理的目的主要是为了使探针能与载体表面牢固结合,同时,还对载体上未与探针结合的游离活性基团进行封闭以避免在5杂交过程中非特异性的吸附对实验结果(特别是背景)造成大的影响。因此,基因芯片点样后处理的结果直接影响了实验结果的好坏。更高的探针固定率可提高杂交时的灵敏度;而封闭效果好的芯片在杂交后的背景特别干净,所得到的结果也就相对更为可靠。1.3.4靶基因的标记当通过一定的方法获取到了靶基因后,在与基因芯片退火杂交之前必须要进行分离、扩增和逆转录,然后再进行标记,包括放射性同位素标记、荧光标记等。虽然前者具有很强的现实强度,但由于其放射危害性,现在使用的越来越少。新近发展的多的荧光标记方法用不同激发波长的荧光素对不同来源的靶基因进行标记,可以更直观地比较不同来源样品的基因表达差异。目前虽然已经报道出了诸多可以用来标记的靶基因的荧光或其它标记物,但用的最多的且效果较好的是Cy3和Cy5,它们不但具有很好的荧光强度,而且可以尽可能少的与探针或载体粘连[7]。其实对靶基因进行标记后,他们本身并不是红色或绿色的,而是经过扫描仪的扫描处理后才显现出了我们所预期的颜色。1.4基因芯片的图像处理及数据分析1.4.1图片获取完成基因芯片的制备后,下一步便是根据不同的研究目的设计和选择实验标本(包括组织、细胞等),然后通过各种方法对其标记上染料分子(多用荧光分子)或同位素(32P、33P),与基因芯片进行杂交。对于用荧光标记的标本,其杂交结果可通过专门的芯片扫描仪进行扫描得到,常用的扫描仪主要有基于PMT(光电倍增管)和CCD(电耦合器件)作为感光器件的两种。1.4.2样点的识别但光学扫描仪扫出的芯片图像并没有给出各个样点的信号值、背景值和荧光信号比等信息,必须通过进一步的图像处理提取并得到各个样点的相应数据信息,供进一步的统计分析。因此,芯片图像处理的主要目的是量化芯片上样点的具体信息。芯片图像的处理首先要识别样点并确定样点的位置。样点识别的第一步是生成网格或圆,以确定样点的大概位置。根据芯片上行和列的数目,由计算机自动6生成一个网格或圆,每个网格或圆就为每个点提供了一个相对位置的坐标。样点位置确定后,还得对样点进行识别,主要是对网格或圆按照一定的规则不断的调节大小,找出最合适的位置和大小,使之正好与样点一样大。1.4.3确定信号和背景值在样点识别并定位后,点内的区域和周围的一部分区域内的像素就用来计算信号和背景强度,所以样点代表的基因表达情况是由样点的信号值扣除背景值得到的。1.4.4数据的预处理在得到代表基因表达情况的数据后,应当对数据进行预先处理。目的就是要将一些质量很低、数据可能不准确的点予以清除;还要对芯片进行归一化校正处理;另外还可以用散点图先观察数据的特性,做一些预先的分析准备工作。以cDNA芯片为例,其常用散点图表示在两个组织中基因表达量的比例信息。如果两个样本组织的表达程度一致,那么散点集中在通过远点的斜率为1的直线附近,如果不为1,说明两种荧光标记有一个系统误差,可以通过软件来校正。数据的预处理还包括设定一个阈值来判断真正的弱信号点后,以及利用LOWESS函数来对芯片进行校正。最后再进行相应的数据分析。1.4.5数据的统计分析经过预处理的芯片数据,其实还是枯燥无味、难以理解的。需要采用相应的