SNPs的发展与人类健康一、SNPs的由来及概念SNPs是英文Singlenucleotidepolymorphisms的缩写,中文译为单核苷酸多态性。通俗地讲,可以认为是人类DNA序列的差异。具体地说,SNP指基因组序列中单核苷酸(A,T,C,G)改变时发生的DNA序列的多态性变化,即指基因组内特定核苷酸位置上存在两种不同的碱基,其中最少一种在群体中的频率不小于1%。人类基因组的30亿个碱基中,大约每300到500个碱基就有一个SNPs发生,整个人类基因组大约有2000万SNPs。SNPs既能在编码基因又能在非编码基因中发生,在编码基因中出现称做cSNPs。尽管多数SNPs不影响细胞功能,但是科学家认为SNPs确实可以使人易患病或影响对药物的敏感性。尽管遗传密码由4种碱基组成,但SNP通常只是1种二等位基因(biallelic),或二态的遗传变异。例如一个SNP可能把DNA的序列AAGGCTAA改变为TAGGCTAA。SNP作为一种碱基的替换,大多数为转换,而颠换较少,转换与颠换之比大约2∶1。SNP在CG序列上出现最为频繁,而且多是C→T,原因是CG中C即胞嘧啶常为甲基化的、自发地脱氨后即成为胸腺嘧啶。二、SNPs的研究意义SNPs是伴随着人类基因组计划(HGP)发展起来的,HGP下一阶段的另一任务是尽快鉴定人类DNA序列的差异,即单核苷酸多态性(SNPs)。虽然人类99%以上的DNA序列是相同的,但是DNA序列的变化对人类对疾病、环境攻击(比如细菌,病毒,毒素和化学物质)、药物和治疗的反应产生重大影响。这就使得SNPs对生物医学研究、药物开发、医学诊断和法医学发展有重要意义。除了基因制药、诊断、生物医学研究方面的应用,SNP图谱还有望被用来识别基因组上成千上万个附加标记,以简化HGP研究者绘制的很大的基因组图谱。(一)SNPs与疾病的关系为什么有人容易得糖尿病,有人容易得癌症,有人易肥胖,基因在这里起了主要作用。基因在决定个体的正常表型,即形态、代谢和免疫状态等方面起着决定性的作用。通过赋予个体对疾病的易感性或抵抗力,以及影响机体与环境因素的相互作用,基因也对任何疾病的发生发展起着重要作用。人们希望能识别这些基因,以加深对疾病的认识,从而改进疾病的诊断预防及治疗。由于技术条件的限制和认识上的差距,迄今为止疾病的遗传研究大多是从单个基因入手,很少从整个基因组及其功能状态考虑。随着SNPs的不断发现和人类第三代遗传标记图的绘制,现在已有可能描绘在某一疾病发病时或发育阶段中多个基因位点甚至整个基因组的状态。由于SNPs在基因组中分布广泛,人们希望通过研究可以对发病率高的多基因疾病产生更深的认识,他们相信SNP图谱将有助于认识复杂的多基因疾病,如癌症、糖尿病、血管性疾病和某些精神性疾病。这些疾病很难用传统寻找基因的方法来确定,因为仅仅一个基因的改变对其影响不大。目前SNPs可以在以下几个方面发挥作用:1、确定疾病相关基因;2、寻找可以带来新治疗方案的靶向基因;3、发现预测治疗效果的基因。SNPs的应用可分为以下三个阶段:第一阶段:制作出覆盖整个基因组的足够高密度的SNPs图谱。SNPs的物理定位与微卫星定位相似,SNPs至少可以作为遗传标记。在指定人群中,如果SNPs覆盖基因组的范围低于10%,它的意义则大打折扣。第二阶段:通过对比健康和患病人群SPNs发生的相对频率,可以对特定某种疾病在基因组上进一步定位。可以进一步提高这部分基因组的分辨率。第三阶段:利用SNPs可以在细节上研究遗传的变化。在这一阶段可以利用固定数目(10-100)的和某种特定疾病相关的基因进行遗传变化研究。在这一阶段,遗传上变化频率越低,可利价值越大。人们希望找到与疾病发病初期相关的基因。大多数SNPs在非编码区找到,而鉴定出编码区SNPs即cSNPs的意义非常重大,它往往代表基因型和表现型的改变。(二)SNPs与环境的关系不同的种族、人群对外界环境因素变化的反应不同;在同样的环境下有人很容易得病,为什么会这样?对SNPs的研究可以给出一定的答案。在疾病发生、发展的过程中,个体或群体对环境致病因素的易感性起着重要作用。这种易感性的遗传基础是基因组的结构差异或(和)表达差异。SNPs有助于阐明这些差异。人类的易感性也并不完全由基因决定。在环境致病因素作用下的基因表达差异起着更为重要的作用。随着DNA芯片在基因表达研究中进一步应用,在理论上只需很少的个体或标本就可确定环境因素对基因组表达的影响并找出易感基因。(三)SNPs与药物的关系在利用药物进行疾病治疗时,不同的病人治疗效果有时差异显著。造成这种差异的原因是由于药物本身在不同个体体内活化、代谢、清除方面的差异所决定的,而这种差异本质是遗传差异。SNPs能充分地反映个体间的遗传差异。通过研究遗传多态性与个体对药物敏感性或耐受性的相关性,可以阐明遗传因素对药物效用的影响,从而对医生有针对性地用药和药物的开发提供指导和依据。过去对单个基因对药物作用的影响方面的研究已经有不少成果。比如,已知一些参与药物代谢的酶的基因和受体基因可以改变药物在体内的代谢和个体对药物的敏感性。但对于许多常见的多发复杂疾病来说,单个基因对药物作用的影响甚微,一般不会超过5%。因此,在基因组水平上进行多基因研究是必要的也是必须的。SNPs由于数量众多和易于批量检测,正好为此提供了条件。目前,正在兴起的药物基因组学研究遗传因素对药物作用的影响和不同基因型个体对药物反应的差异,从而为临床有针对性地合理用药和根据不同基因型群体对药物的反应来改进药物设计提供了理论依据。这是当前制药行业对SNPs表现出空前兴趣的原因。(三)SNPs与HGP的关系HGP的发展为SNPs的应用提供了现实可行性,而SNPs是HGP下一步重要的目标:DOE和NIH组织的HGP树立了最近五年确定和绘制SNPs图谱的目标;发展快速、大规模确定和得到SNPs和其他DNA序列多态性的技术;确定大多数已知基因中编码区域的常见变化;绘制至少有100,000个标记的SNP图谱;建立序列多态性研究的智力基金;建立DNA样品和细胞标本的公共资源。三、SNPs的研究技术SNPs是重要的遗传标志之一,其本质上是DNA序列中单个碱基的置换,理论上任何用于检测单碱基突变或多态性的技术都可用于SNPs的识别或检出。但在目前利用现有技术进行大规模、大范围内检测SNPs还有一定难度。从理论上讲,RFLP、等位基因特异的寡苷酸杂交、寡核苷酸连接分析(OLA)、等位基因特异的PCR(ARMS)、DNA测序等都可分别进行SNPs检测。这些方法大多需要电泳和荧光标记,费时费力而效率有待提高。可能给我们带来光明前景的两种新技术是DNA微阵列分析法和应用原子力显微镜(AFM)观察SNP。DNA微阵列分析法:主要原理是在一块小硅片上进行微阵列分析,让目标DNA与密集的多重寡核苷酸阵列进行杂交,进而检出SNPs的有效方法。实现这种分析的关键是能在芯片上高密度地原位合成大量不同的寡核苷酸探针,以及实现杂交后的荧光检测和计算机分析,这种技术已广泛利用在科研上,微阵列DNA芯片在理论上可以提供足以检出任何SNP的探针,并通过杂交检出基因组中的cSNP或SNPs。一些公司和实验室正努力发展大规模SNPs检测技术,以期研制成检测全基因组SNPs的芯片。现已推出检测诸如p53抑癌基因、艾滋病毒、乳腺癌、囊性纤维病基因等已知SNPs的芯片或诊断试剂盒。应用原子压力显微镜(AFM)观察SNPs:化学家Lieber和遗传学家Housman的梦幻组合创造了这项简单的新技术。首先设计一个寡核苷酸探针能与你要找的基因组区域严格匹配,将此探针与一大分子如链霉素偶联,让此探针与DNA片段进行杂交。如果探针杂交成功,那么用AFM进行观察就能发现杂交阳性位点。此方法比传统方法明显优越的是能够对单倍体基因组进行检测。当数个探针同时在数百Kb的距离上进行搜索,再加上自动分析,SNPs的相关性研究恐怕能大大的向前迈进一步了。所以,我们可以满怀信心的期望AFM技术能早日得到实际应用。四、SNPs的国内外研究状况SNPs的研究已受到国内外政府和私营公司的广泛的重视。欧美各国以及日本正围绕SNPs的研究展开激烈角逐,并投入了大量人力和物力。美国国立生物技术信息中心(NCBI)已建立了SNPs的公用数据库及SNPs的报告登记制度。由NCBI确负责运营的公开数据库,集中了由世界各地研究人员发现的SNP,截止7月10日登记数已达39万个。由日本东京大学医学科学研究所和科学技术振兴事业团共同主办的SNPs数据库已正式对外开放。日本的SNPs数据库共收录了以日本人为对象进行调查后获得的6830个SNP,并在互联网上设立了供世界各国研究人员自由查阅的主页。由日本政府联合各方制定的新千年计划,以在明年年底前发现15万个SNP作为主要目标,并随时对外公开所获得的数据。我国的基因组计划也已注意到这一点,并根据我国的实际情况,加速发展SNPs研究及其应用的策略和重点。我国“863”计划生物领域专家委员会首席科学家强伯勤教授日前宣布,我国将于今年底启动中华民族基因组单核苷酸多态性(SNPs)系统目录的构建与研究,主要采用大规模测序的技术方法。国外私营公司为强占制高点,划分出泾渭分明的两大阵营:SNP联盟和PE公司CeleraGenomics。SNP联盟成员包括世界上顶尖的十家制药公司。1999年4月,十大制药公司和英国WellcomeTrust慈善机构宣布联盟成立,由ArthurL.Holden领导,寻找和绘制300,000个常见的SNPs。目标是使用均匀分布在整个人类基因组中的SNPs标记绘制能被广泛接受的、高质量的、具体的、有用的图谱。全球的成员公司包括:AstraZenecaGroupPLC,BayerGroupAG,Bristol-MyersSquibbCo.,F.Hoffmann-LaRoche,GlaxoWellcomePLC,HoechstMarionRousselAG,NovartisAG,PfizerInc.,Searle,SmithKlineBeechamPLC。累计资金有三千万美元,其中WellcomeTrust机构至少投资一千四百万美元。由这些公司赞助的确认SNPs的实验室都坐落在斯坦福大学和圣路易斯安娜州华盛顿大学Sanger中心的Whitehead研究院。数据管理和分析将在ColdSpringHarbor实验室进行,他们寻找对应于公共数据库的序列以决定SNP的基因组位点。其他地区的研究所将使用各种各样的程序。PE公司CeleraGenomics在其有着“科学狂人”之称的总裁兼首席研究官Venter的率领下(Venter以利用鸟枪法进行全基因组测序闻名于世,在他率领下Celera公司以惊人的速度抢先完成人类基因组测序),如今正利用其巨大的测序技术优势向SNPs发起冲锋,其势难以阻挡。CeleraGenomics不久前宣布它已开发出了它的人类基因组单核苷酸多态性数据库,该数据库被认为将支持并加快基因组制药的研究。Celera测定了五个不同种族捐献者的DNA。在其最先公布的数据库中包括了240万个独立专一的SNPs。这个数据库还包含了40万条从已公开的数据库中来的非重叠、独立的SNPs,使SNPs的总数达到280万条。Celera的SNP参考数据库是其基于网络的Celera探索系统的一部分,Celera的SNP参考数据库被认为是一个最综合及完整的单核苷酸多态性(SNPs)资源库。五、SNPs的商业发展前景SNPs在制药业和诊断上的非常大的价值,蕴涵着巨大商机。SNP联盟为什么赞助SNPs公共基因图谱,主要就是看到了SNPs的商业价值。SNP联盟把SNPs图谱视为制造有用、重要、竞争性、高质量研究工具的方法,激励整个研究、产业组织的革命性工作。国内外政府和企业的巨大投入也证明了这一点。SNPs与人类性格、某些疾病、药物安全性与效果变化有关。SNPs可为新的诊断方法、治疗方法、预计药物产品提供基础。SNPs也是群体研究中探索及说明新基因功能的一个极其有