基因芯片技术State-of-theart*冯永强*GrahamRamsay,NatureBiotechnology1998,16:40一、基因组序列数据库及分子生物学的研究现状1.人类基因组(测序)计划(Humangenomeproject)的逐步实施,现(1997年底)已完成2%序列及800,000个cDNA片段(EST)的测序工作,预计2005年可全部完成;2.其它生物基因组的测定工作:11种微生物0.6-4.2Mb、大肠杆菌4.6Mb、酵母13Mb全序列,线虫71%、果蝇6%、小鼠0.2%序列得到测定。然而,怎样去研究如此众多基因的生物信息及其在生命过程中所担负的功能,成了全世界生命科学工作者共同的课题!二、分子生物学的发展为核酸序列分析与测定提出的新要求•速度快、效率高•可同时对大量核酸序列进行检测和分析•操作简便、自动化程度更高•总体效率较常规杂交方法高三、基因芯片的基本概念及发展经过基因芯片(Genechip)又称DNA芯片(DNAChip)或生物芯片(Biologicalchip,不过该词尚包括肽芯片等其它类型),它是指将大量探针分子固定于支持物上,然后与标记的样品进行杂交,通过检测杂交信号的强度及分布进而对靶分子的序列和数量进行分析。早在八十年代初有人就曾设想利用计算机半导体技术生产基因芯片以对人类基因组大量的遗传信息进行分析和检查,但直到光引导原位合成(light-directedinsitusynthesis)高密度探针技术和激光共聚焦显微扫描问世之后才使该设想逐步成为现实,并迅速应用到分子生物学的多个领域,得到了科学界的高度重视。四、基因芯片技术与传统杂交检测方式的比较•操作自动化程度一次可检测的序列个数总体效率基因芯片技术简便很高极大很高传统杂交方法复杂很低很小很低基因芯片技术从本质上说与SouthernBlotting或NorthernBlotting相同(所以Affymetrix曾与Southern就专利问题产生冲突),只是探针密度极高而已。不过,为此花费了大量的人力物力从事研制工作。当然,其结果也很是诱人。五、基因芯片的基本构造1.支持物:如玻片、硅片、NC膜、Nylon膜2.探针:高密度的探针序列按照一定的次序固定在支持物上,每个位点的序列是已知的外观探针支持物剖面图平面局部放大六、基因芯片相关技术硬件:–序列合成设备包括:核酸或多肽合成仪(作预合成点样用)、照相平板印刷及半导体制作相应设备(作光引导原位合成)。–激光共聚焦显微扫描设备:激光共聚焦显微镜或相应设备,以采集高密度点阵杂交信号并进行数字化处理分析。软件–基因序列分析及探针筛选技术(可能涉及专利等产权问题)–序列合成及定位技术(光引导原位合成或微量点样技术)–杂交信号的采集和分析技术(需要处理极大量的杂交信号并能由此得到所需信息)七、基因芯片当前研究状况现在全世界已有十多家公司专门从事基因芯片的研究和开发工作,而且已有较为成型的产品和设备问世。这些公司主要以美国的Affymetrix公司为代表,该公司聚集有多位计算机、数学和分子生物学专家,其每年的研究经费在一千万美元以上,且已历时六七年之久,拥有多项专利。产品即将或已有部分投放市场,产生的社会效益和经济效益令人瞩目。详情如下表所示:世界十大基因芯片研制单位简要情况一览公司阵列方法杂交方式检测应用领域Affymetrix(美国)20-25mer探针光引导合成在1.25/5.25cm2的硅片10000-260000个Oligo探针与30-40个标记样品cDNA/asRNA片断荧光表达谱检测多态性分析诊断Brax(英国)Oligo合成后结合于芯片上通用芯片上100个探针与标记核酸质谱诊断、表达谱检测及新基因鉴定Hyseq(美国)500-2000ntDNA样品印刷于0.6cm2/18cm2的膜预组装的5mer-Oligo打印于1.15的玻璃片64/55000个样品cDNA点与8000/300个7mer探针通用1024个Oligo点探测10kbcDNA样品,加标记的5mer探针和连接酶同位素诊断、表达谱检测、多态性分析、新基因鉴定及大规模测序IncytePharmaceticals(美国)压电打印PCR产物或芯片上合成Oligos1000最终可达10000个Oligo/PCR片断与标记RNA荧光/同位素表达检谱测多态性分析诊断续表IncytePharmaceticals(美国)压电打印PCR产物或芯片上合成Oligos1000最终可达10000个Oligo/PCR片断与标记RNA荧光/同位素表达检谱测多态性分析诊断Moleculardynamics(美国)500-5000nt的cDNA用笔打印于10cm2玻璃片10000个cDNA点与200-400nt标记cDNA荧光新基因鉴定表达谱检测Nanogen(美国)预组装的20mer的探针俘获于电活化芯片位点25/64/100/400/最终10000个Oligo点与200-400nt标记cDNA荧光诊断及短的重复序列鉴定ProtogeneLab(美国)通过打印于表面张力阵列将40-50merOligo合成于9cm2玻璃片8000个Oligo点与200-400nt标记核酸样品荧光表达谱检测多态性分析Sequenom(德国,美国)20-25mer探针合成后打印成阵列250点,激光解吸-质谱分析质谱新基因鉴定诊断及作图Synteni(美国)500-5000ntcDNA用滴头打印于4cm2的玻璃片10000个cDNA点与200标记cDNA荧光新基因鉴定表达谱检测德国癌症研究所(德国)约1000个PNA合成于8×10cm2的芯片荧光/质谱表达谱检测及诊断八、基因芯片的主要类型基因芯片以其片基(substrate)的不同可以分为无机片基和有机合成物片基。前者主要包括半导体硅片和玻璃片,其上的探针主要以原位聚合的方法合成,后者主要有特定孔径的硝酸纤维膜和尼龙膜,其上的探针主要是预先合成后通过特殊的微量点样装置或仪器滴加到片基上去(如下表所示)。片基探针固定方式探针密度显色及检测方式钢性片基如玻片、半导体硅片等原位合成(insitusynthesis)高荧光,激光共聚焦扫描、定量分析;生物传感器等薄膜片基如NC、Nylon膜等预先合成后点样(off-chipsynthesis)低荧光基因芯片的主要类型及其简要特点不过,也有人(RobertS.Matson)等以聚丙烯膜为支持物用传统的亚磷酰胺固相法原位合成高密度探针序列。九、基因芯片检测原理及简要过程PCRT7promoterT7promoter体内转录片段化1.5小时杂交、冲洗ACGT扫描分析1小时荧光素图2样品处理与检测过程简图基本过程–用生物素标记并经扩增(也可使用其它放大技术)的靶序列或样品然后再与芯片上的大量探针进行杂交–用链霉亲和素(streptavidin)偶联的荧光素(常用的荧光素还有lassamine和phycoerythrin)进行显色–图象的采集用落射荧光显微镜(epifluorescencemicroscope)、激光共聚焦显微镜或其它荧光显微装置对片基扫描–由计算机收集荧光信号,并对每个点的荧光强度数字化后进行分析。由于完全正常的Watson-Crick配对双链要比具有错配(mismatch)碱基的双链分子具有较高的热力学稳定性,所以,前者的荧光强度要比后者强出5-35%。从这一点来说,该检测方法是具有一定特异性的,而且荧光信号的强度还与样品中靶分子含量呈一定的线性关系。以下图为例。十、探针的合成与固定光引导原位合成(Lightdirectedinsitusynthesis)光引导聚合技术是照相平板印刷技术(photolithography)与固相合成技术、计算机技术以及分子生物学等多学科相互渗透结果。照相平板印刷技术中可用光引导形成电子线路(electricalcircuits),利用类似的道理可在固相支持物上同时合成出大量不同的化合物。操作过程(见下图)*使支持物氨基化*用光不稳定保护基(photolabileprotectinggroup)将NH2基保护起来*选择适当的挡光板(mask)使需要聚合的部位透光,不需发生聚反应的部分不透光。这样,光通过挡光板照射到支持物上,受光的部分NH2解保护*合成所用单体分子一端按传统固相合成方法活化另一端则受光敏保护基团保护。这时,用单体分子去和支持物上解保护的氨基反应,偶联后的部位将仍旧带上保护基团。*类似地,进行以后其它反应直至得到目的寡聚体序列。光引导原位合成技术原理图NHHNHNHNHNHXXXXX光去保护XXXXNH2X-AXXXXNHAXXXXXNHAXh¦Τ挡光板2化学偶联化学偶联X-BX-C,etc.BBACC..........平板印刷用挡光板1hυ固相支物物化学偶联预合成点样技术(Off-chipsynthesis)这一方法在多聚物的设计方面与前者相似,合成工作用传统的DNA或蛋白固相合成仪进行。多聚物合成后再用特殊的点样装置或仪器(如美国CartesianTechnologies公司的PixSysNQ/PA系列产品)将其以较高密度分布于硝酸纤维膜或经过特殊处理的玻璃片上,点阵密度可达到2500spots/cm2(Yershovetal报道点阵密度最高可达20,000-30,000spots/cm2)。十一、光引导原位合成和预合成点样技术的比较点阵密度合成大量探针需要的反应步数检测效率技术难度设备情况知识产权问题光引导原位合成技术很高合成4n个序列只需4*n步反应很高很高需要大型复杂设备有可能侵权*预合成点样技术比较低合成4n个序列需4n个反应较高较低设备代价相对低廉无侵权可能*注:美国专利第5,744,305号说明固相表面点阵密度超过400spots/cm2将侵犯Affymetrix公司产权十二、光聚合技术存在问题及解决方案支持物相关技术照射光去保护方法及效率每步聚合效率硅片或玻片照相平板可见光酸去保护(98%)98%(需预处理)印刷技术电子射线等光去保护(92-94%)92-94%影响光聚合的主要因素现列表如下:其中,保护基团类型与去保护方式严重制约着聚合点阵的密度和探针的长度。如下表所示。不同去保护方式对聚合效果的影响去保护方式保护基类型每步产率探针密度可见光106/cm2电子射线(250Å)光敏92-94%1010/cm2*酸酸敏98%—可见,经典光引导聚合技术所存在的问题在于:•探针密度低、分辨力差•每步反应合成产率低十三、光敏抗蚀技术为此,GlennMcGall等将光引导合成技术与半导体工业所用的光敏抗蚀技术相合,以酸作为保护剂,使探针密度达到16,000spots/cm2以上(有望接近106spots/cm2)。光具有波粒二象性,所以具有衍射的特性。当挡光板透光孔间的距离足够小的时候,由于光的衍射,使受光部分与非受光部分光照对比度下降,如果仍用前述光引导合成技术就会使去保护作用不够理想,受照射部分与其它部分差别不够大,聚合纯度不高,降低了检测结果的信噪比(signal-noiseratio),从而影响了聚合点阵的密度的提高。光敏抗蚀剂的解离对照度的依赖是非线性的,所以当照度达到一定值时它就会解离,这样就部分地解决了由于光衍射引起的问题虽然由此增加了技术的复杂性,但却明显地提高了聚合点阵的密度。玻璃支持物coatphotoresist暴光maskhυ去保护NHH偶联repeat图4光敏抗蚀法光引导原位合成技术示意图十四、基因芯片技术的应用•利用基因芯片进行杂交测序基因芯片不仅可对大量基因或序列同时、快速进行定性、定量分析,而且作为一种极有发展前途的测序策略也倍受人们的重视。以图5为例,首先将八聚体寡核苷酸所有可能的序列组合合成或固定于片基上,对于每一序列其在片基上的位置是预先决定好的。样品扩增并经标记后与片基上所有序列进行杂交反应。这样,就会出现特定的杂交图谱,有杂交信号部位的寡核苷酸片段与待测样品序列是互补的最后分析产生杂交信号的寡核苷酸序列的重叠情况进而推导出样品的核酸序列。利用基因芯片进行杂交