论基因组学在人类疾病诊断与治疗中的应用摘要随着“人类基因组计划”的完成,结构基因测序的突破,由此延伸的“后基因组计划”即以功能基因鉴定为中心的“功能基因组学”产生。在以人类基因组为大背景研究疾病状态和发病过程中的基因型变化规律,将是揭示基因组功能奥秘的最佳途径。基因组学研究在医学方向上的路线图是:基因组结构——基因组生物学——疾病生物学——医学科学——医疗保障。前两个是过去和目前基因组学研究的基本内容,后三个是基因组学研究的未来和应用。“生命密码”不仅仅是被记录在DNA、RNA、蛋白质的序列里,它也寓于这些序列之外的其他种种生命物质(比如ATP的产生和流通)和行为(感受和认知)之中。对基因组序列的彻底解读,标志着基因组生物学研究的新起点。关键词:人类基因组计划后基因组计划基因组学引言自从“人类基因组计划”的启动及完成,它已是家喻户晓,但是很多人只是提留在字面上的理解,至于什么是基因组,研究基因组有什么方法和手段,研究基因组有什么功能和应用,也许大家知道的不是那么清楚。同时,由于DNA测序技术的改进提高了DNA测序的效率,极大地降低了测序成本,促使了基因组学的蓬勃发展,获得了很多此前无法探知的基因组表达谱信息。我国于1999年开始作为唯一的发展中国家参与了“人类基因组计划”,并成功地完成1%的测序工作,为我国基因组学的快速发展拉开了序幕。在这场全球科研竞赛中,我国科学家敏锐地认识到,在我国人口与临床遗传资源十分丰富的前提下,以人类基因组为大背景研究疾病状态和发病过程的基因型变化规律讲师揭示基因组功能奥秘的最佳突破,从而实施了向“疾病基因组学”研究的战略重点转移。[1]本文从上述几个方面进行阐述,带领大家真正了解“人类基因组计划”的深远意义,并重点了解基因组学在人类疾病诊断与治疗中的应用,即疾病基因组学的研究内容和进展。1.基因组的基本概念基因组(genome)一词用以表示真核生物从其亲代所继承的单套染色体,或称染色体组。[2]基因组(genome)是生物体内遗传信息的集合,是某个特定物种细胞内全部DNA分子的总和。[3]DNA是遗传信息的载体,转录成RNA,RNA翻译成蛋白质,调控多种生理代谢活动等。所有细胞形态都以DNA为遗传信息载体,生命多样性的基础在于基因组的大小和组成的差异性。[2]不同生物基因组的序列组成差别极大,一般而论,原核生物基因组重复序列的含量很少,真核生物中大型基因组有很高比例的重复序列,植物中多倍体的重复序列比例高于两倍体物种。基因组要分布在单一序列DNA。[2]基因组学(genomics)则是由美国人T.H.Roderick于1986年首次提出,是从传统的单个基因的研究转向对生物体整个基因组组成、结构、功能和进化的研究[2],改变了经典遗传学“零敲碎打”的模式,更加系统和全面地研究生命现象。尤其是伴随着高通量测序技术及其他研究技术的完善和推广,基因组学研究进入了一个飞速发展的研究阶段。“人类基因组计划”的启动也是为了更好解析人类基因组中携带的有关人类个体生长发育、生老病死的全部遗传信息,揭开人类生长的奥秘,追求健康,战胜疾病。“人类基因组计划”测定单倍体染色体中约30亿个碱基对序列,从如下8个方面阐述了这些编码的遗传信息[3]:1.确定人类基因组中编码基因(2万-2.5万个)的序列及其物理位置,研究基因的产物及其功能;2.了解转录和剪接调控元件的结构和位置,从基因组上宏观地了解转录及转录后的调控;3.了解染色体结构上的重复序列和非转录调控序列的大小和位置,了解各种不同的序列在染色体结构、DNA复制、转录及其表达调控中的影响与作用;4.研究空间结构对基因调节的作用。有些及基因的表达调控序列与被调基因在DNA的一级结构上相差甚远,但是在三维结构上却又恰好处于最佳位置,因此三维结构对基因的调节作用有待研究;5.发现与DNA复制、重组相关的序列。DNA并非一直都是忠实复制,也为变异与进化提供了基础。局部DNA的不正常复制将导致疾病或胚胎不正常发育。因此,研究人类正常复制和重组有关的序列及其变化,将为研究人类基因组的遗传与进化提供重要的依据。6.研究DNA突变、重排和染色体断裂等,了解疾病的分子机制,包括遗传性疾病、易感性疾病、放射性疾病甚至感染性疾病引发的分子病理学改变及其进程,为这些疾病的诊断、预防和治疗提供理论依据。7.确定和研究人类基因组中转座子、逆转座子和病毒的残余序列及其性质,了解病毒基因组侵染人类基因组后的影响,有助于人类有效利用基因载体进行基因治疗。8.研究人类个体间各遗传元件的多态性。可被应用于基因诊断、个体识别、亲子鉴定、组织配型、发育进化等许多医疗、司法和人类学的研究。此外,这些遗传信息还有助于研究人类的起源和进化。2.研究基因组的方法和手段?基因组计划的基本目标是获得全基因组序列,在此基础进行解读。获得全基因组序列的主要方法是进行DNA测序,然后再将读取的序列组装。而每次DNA测序可以读到的长度不大于1000bp,因此需要将较长的DNA序列分段测序没然后进行组装。但是如果基因存在重复的DNA片段,要如何正确定位,避免张冠李戴?解决的办法就是基因组作图(genomicmapping)。[2]2.1.遗传作图(geneticmapping)应用遗传学技术构建,根据表型命名的显示基因以及其它序列特征在基因组上位置的图。遗传学技术包括杂交育种实验、系谱分析。方法:杂交育种试验—根据子代基因型进行遗传连锁分析—算出重组距离—绘制遗传连锁图。局限性:遗传图的分辨率有限。由于微生物基因组较小,只要记录成百上千次交换实验就能获得十分详尽的遗传图。但是对于人类及大多数高等生物而言,由于子代数量有点,因此可供研究的样品有限,不能得到精确的遗传图谱。遗传图的覆盖面较低。由于重组热点、同一染色单体发生多起交换、连锁不平衡等现象会造成遗传图的偏离。遗传图分子标记的排列有时会出现差错。遗传作图的依据主要是子代个体的基因重组及其分离比。由于环境因素和取样误差,可能存在非随机的群体组成。在这种条件下,采用不同的杂交组合有时会得出不相同的结果,相同的分子标记在连锁图的不同位置上。2.2.物理作图(physicalmapping)应用现代生物技术,采用DNA分子标记绘制的遗传连锁图,能够显示包括基因在内的、序列特征的位置图。主要的方法有:限制性作图方法、基于克隆的基因组作图、原位染色体连锁图和辐射杂种作图等。DNA分子标记包括:RFLP、SSLP、SSR、SNP等。遗传作图与物理作图的共同之处都是确定基因或DNA分子标记在染色体上的排列位置。但是由于方法的局限,它们又各自有偏差,所以通过共同的作图标记可以相互校正,由此获得基因连锁图称之为基因组图(genomemap)。3.疾病基因组学研究的目标疾病基因组学主要体现在基因组、转录组、蛋白质组、代谢物组和pathways等层次之中,俨然形成“大科学”态势。其主要突出两点:一是要用综合的观点和思维模式把发生在上述各层次上的分子生物事件构建成合理的网络作用模型,真实地阐明疾病发生发展机理;二是利用“三高”技术(高通量、高灵敏度、高特异性)平台的建立和应用,解决疾病早期筛查、诊断、治疗、预防和药物筛选的工具和手段。[4]4.基因组学在疾病诊断与治疗中的应用4.1.鉴定微效(低危险度)疾病易感基因绝大多数疾病的发生是众多微效的、低外显率的易感基因相互作用以及它们与环境因素相互作用的综合结果。据推算,在人群中,疾病易感基因的平均危险度仅为1%左右,如此低危险度,采用传统的技术手段难以鉴别。已经提出了2种理论模型,第一种模型称为:常见病-常见变异体模型(commondisease-commonvariantmodel),意思是每种疾病都存在相对应的一组变异等位基因(包括多态性),而且这些基因变异在人类祖先就发生了的。因此,采用高通量技术,结合遗传分析方法,有可能从疾病患者基因组中一个个地找出变异等位基因,目前正在研究和采用的方法有:候选基因关联分析、单倍型(haplotype)关联分析、建立小鼠模型。以上方法有一个共同的要求,就是必须具备大标本量,否则影响鉴别能力。第二种理论模型叫做罕见等位基因模型(rareallelesmodel)。其要点有二:(1)与疾病发生相关的变异等位基因是新近发生的罕见等位基因;(2)这些罕见等位基因均属于弱等位基因(weakalleles),并且多个独立罕见等位基因存在于不同的单倍型之中,从而显示更弱的单倍型相关性。4.2.搞清基因型与临床表型的关系采用微阵列(基因芯片,蛋白质芯片等)技术和质谱分析技术发现了一些疾病发生发展中特有的基因表达谱和蛋白质图谱,把疾病发生发展中特异性突变(即特异性分子表型)组合在一起,从而阐明特异性分子表型之间的相互作用及其与疾病的不同表型特征的对应关系,以及与疾病对环境因素和药物的反应性的关系。4.3.研究疾病发生发展的分子作用机理将从以下三个问题构建疾病分子作用网络图:(1)疾病易感基因涉及哪些pathways?(2)pathways之间如何发生作用和影响?(3)疾病易感基因在pathways内是如何发挥作用及是否与pathway之外的分子发生作用?这一工作还有待众多科学家的参与和研究,目前尚未构建出完整的疾病分子作用网络图。4.4.构建数字化疾病模型采用数学、计算机、生物信息学和实验分子生物学方法,将基因组研究数据库进行整合分析,从而构建基因作用网络和数字化疾病模型(digitaldiseasemodel)根据这些模型发现药物,已开始进入实际应用阶段。4.5.疾病基因组学与其它分支学科在疾病诊断与治疗中的应用迄今已有1200多种疾病的致病基因被克隆,数百种疾病的相关基因位点被定位于不同染色体区域,为筛查和定位、克隆单基因遗传病致病基因和复杂疾病的易感基因提供了可靠线索。人类基因组图谱的完成为研究基因、蛋白质及其相互作用和在疾病发生发展中的网络作用图提供了可能。不少研究已深入到这一层面,并且其研究的领域还被大大地扩展,与疾病基因组学相关的其他基因组学分支学科大量涌现,如:比较基因组学(comparativegenomics),根据对不同模式生物基因组结构和功能的对比,为阐明人类疾病相关基因及其作用机理提供有力证据;生殖基因组学(reproductivegenomics),通过在基因组水平上研究生殖细胞的成熟与分化、精卵结合与受精、胚胎着床、生殖激素调控等生殖生物学基本过程,为阐明生殖机理、人口控制、孕早期检测及出生缺陷的防治提供可操作的办法;药物基因组学(pharmacogenomics)根据药物与基因组相互作用的特点,为高通量药物生产提供靶标,为个体化药物治疗提供依据,为药物毒性及抗性检测提供理论基础;干细胞基因组学(stemcellgenomics),研究人类胚胎干细胞及其分化过程基因表达谱和基因组结构变化,以及造血干细胞的基因表达谱和基因组结构变化;胚胎基因组学(embryogenomics),研究胚胎阶段基因表达谱和基因组结构;癌基因组学(oncogenomics或cancergenomics),研究细胞癌变过程中基因组结构和基因表达谱的变化,等等。[4]5.小结人类基因组研究不仅为疾病发生的基因网络作用这样的整体综合概念的建立奠定理论基础,还为医学的实际应用提供了高通量的技术平台,最突出的领域是新药筛选和诊断试剂盒研制。蛋白质芯片、基因芯片与组合化学、生物文库(蛋白质文库、多肽文库、抗体文库、基因文库)及化学文库的联合应用受到重视,这种联合应用在提高研究效率,降低新药开发成本等方面已见成效。在致病基因鉴定方面,1000多个单基因遗传病的致病基因已被确定和克隆,这些致病基因的产物主要属于12大类功能作用分子,若干多基因复杂性状疾病的主效基因和/或易感基因也被初步确定。疾病基因组学研究涉及自然科学的方方面面,属于学科交叉研究领域,因此,加强不同学科间的协调合作将成为必然的趋势。[4]6.参考文献[1]钟萍,赵文龙.我国基因组研究文献分析[J].现代情报,2006-8:37-39.[2]杨金水.基因组学[M]