基因定位与克隆基因定位或基因制图(genemapping):人类的基因定位或基因制图(genemapping)是近年来发展最快的领域之一。它的目的在于决定不同的基因在染色体上的位置。一条染色体是一条独立的DNA链,同一条染色体上的基因在该染色体上呈线性排列。人类的20000-25000个基因分布在24种染色体上,它们在染色体上的位置可通过两种制图方法来表示:1、物理图谱(physicalmap),即确定基因之间的绝对物理学距离,通常用Mb(百万碱基对)或Kb(千碱基对)来表示2、遗传图谱(geneticmap),即确定基因之间的遗传学距离,用cM(centimorgen分摩)表示。广泛定义基因克隆:基因克隆通常涉及到将构成某一基因的基因组DNA(genomicDNA,gDNA)或互补DNA(complemantaryDNA,cDNA)插入某一载体内,利用载体在宿主细胞(通常用大肠杆菌)中大量繁殖而获得该基因的足够量的拷贝,以便于进行基因的结构和功能的分析,广义的基因克隆也包括任何使基因或DNA片段扩增的操作。医学遗传学讨论的基因定位与克隆实质上不是广泛意义上的基因定位与克隆,主要针对致病基因的鉴定,即将某一特定基因的突变与某一特定的疾病联系起来,确定基因突变与某一疾病之间的因果关系,了解其致病机理,为疾病的诊断、预防和治疗提供理论依据。基因定位方法strategyforgenemapping•染色体多态法(chromosomeheteromorphism)•染色体畸变法(chromosomeabnormality)•体细胞杂种法(somaticcellhybrids)•染色体分类法(chromosomesorting)•原位杂交法(FISH)•剂量分析法(dosageananlysis)•测序法(sequencing)•家系分析法(pedigreeananlysis)染色体多态法.主要限于性染色体上的定位,根据某些性状或疾病在男女性别间的差异,结合系谱分析,将这些基因定位在X染色体上。•Duffy血型基因定位于1号染色体上,这是人类第一次将某一特定的基因定位在常染色体上。(Donahue在做染色体实验时发现自己的1号染色体长臂在靠近着丝粒区的地方变长了,通过对他自己家族染色体的观察发现,这一异常是遗传的,将其作为1号染色体上的一个特定的标记,随后发现这一标记与Duffy血型具有平行性,表明这种染色体的异常结构同这一基因相连锁,因此将此血型基因定位于1号染色体上。)染色体畸变法•畸变常涉及两个位点,如果这两个位点之一正好是某一功能基因所在的位置,染色体的畸变则肯破坏该基因的正常功能而引起疾病,根据染色体畸变的位置和疾病发生的关系,则可将致病基因定位于染色体的某一特定位置上。如DMD基因的定位Xp21。NLMG染色体异常进行基因定位---睾丸决定因子Testisdeterminingfactor体细胞杂种法•体细胞杂种通常由人和鼠的体细胞融合而成。这些融合细胞在最初几代培养过程中具有选择性丢失人类染色体趋势,而保留所有的鼠染色体。•保留在融合细胞中的染色体可以是多条,也可能只有一条甚至某条染色体的一部分。•根据研究的需要可将含有不同人类染色体的人鼠杂种细胞组合成人鼠杂种细胞板(hybridpanel),结合杂种细胞板和PCR的方法或基因剂量分析,或蛋白质表达分析,可将相应的基因定位到特定的染色体或染色体片段上,该杂种细胞板在人类基因定位以及人类基因组计划中发挥过重要的作用。•体细胞杂交基因定位示意图原位杂交法(FISH)•如果一个基因或基因的某一部分已经被克隆,则可将该基因用同位素或荧光标记和染色体原位的分子杂交,在染色体上恒定出现信号的区域即该基因在染色体上的位置。同一染色体上的多个不同的基因可用不同的荧光标记来鉴别他们在染色体上的相对位置,运用这一方法在中期染色体上,可区分两个相隔约2Mb的基因;在间期染色体上,据称可鉴别仅相隔50kb的两个基因。CONNEXIN31.1候选克隆:根据基因的功能、结构及已有的研究发现,预测可能与目的新基因有关的疾病,然后在相应患者中检测该基因的突变情况。位置克隆:目前最常用的方法,将某一疾病的致病基因用连锁分析的方法定位在某一染色体的特定位置上或区域内,然后在该位置上或区域内鉴定其致病基因。基因分型Genotyping除性染色体外,每个人体内的染色体都有两份。一个人所拥有的一对等位位点的类型被称作基因型genotype。对SNP位点而言,一个人有三种可能性,分别是AA,AG或GG。这种基因型的差异叫做单核苷酸多态性(SNP)。通过实验确定某个个体在某个多态性位点的基因型,被称作基因分型。几种多态标记:(1)RFLPs(2)STRPs(3)SNPs第一代标记:RFLP(restrictionfragmentlengthpolymorphism)。限制性内切酶可在特定的核苷酸位置切割DNA。DNA序列的改变甚至是一个碱基的改变,都可能改变限制性内切酶酶切片段的长度,通过凝胶电泳可以方便地检测这种长度的“多态性”。RFLP在整个基因组中都存在,根据对RFLP片段的多态性分析,可对某些疾病进行诊断并将与疾病有关的基因进行定位。——•1980年,Botstein首次提出。•使用特殊的外切酶切断DNA中特殊位点•1987年,第一张较完整的人基因连锁图,包含393个RFLP位点。•缺点:数目少,信息量小;成本昂贵,操作繁琐,不易发展到自动化水平。第二代标记:STR(shorttandemrepeatpolymorphism)。例如基因组中两个或两个以上的核苷酸短串联重复序列(CA)n,微卫星标记等,在不同个体中重复单位的数目变异非常大。微卫星标记荧光电泳图•STR广泛存在于人基因组,占约5%,基本单位是2bp-6bp的串联重复,其中以(CA)n,(GT)n常见。•1996年建立了以6000多个STR为主体的遗传图谱,目前有10000个左右的位点。•主要用于个体识别•优点:信息量大;易实现自动化。•缺点:标记数量不够多•随着人类基因组计划、国际人类基因组单体型计划(Hapmap计划)的完成,大量的SNP被发现。利用先进的高通量基因芯片技术,精确揭示重大疾病的基因变异,从而阐明疾病的遗传学发病机制,是目前科学界公认的最为有效的搜寻重大疾病易感基因的研究方法,被Science杂志评为2007年十大科学进展之首。•迄今已发现的SNP约900~1,000万个,相关的文章约4000余篇。•特点:•数量丰富•双等位标记,简单的+/-分析•根据结果可以估算出某个等位基因在一个群体中的频率•易于实现自动化,快速筛查SNP作为遗传标记的优势分析方法•连锁分析•关联分析连锁分析原理生殖细胞在减数分裂时发生交换,一对同源染色体上存在着两两相邻的基因座位,若两者之间距离较远,发生交换的机会较多,则出现重组次数就多;若两者之间距离较近,则重组机会较少。连锁分析就是根据基因在染色体上呈线性排列,不同基因相互连锁成连锁群的原理,即应用被定位的基因与同一染色体上另一基因或遗传标记相连锁的特点进行定位。123家系分析法(Lods)在家系中,重组率是进行连锁分析的基础Lodscore结果判定:Lod3肯定连锁,Lod-2否定连锁,-2Lod1则还需增加样本资料。L(Θ)=Θr(1-Θ)n-r=Θ1(1-Θ)4Lods=lg【(0.2*0.84)/0.55】=0.4185Lods=0.1249L(Θ)=Θr(1-Θ)n-r=Θ1(1-Θ)4/2+Θ4(1-Θ)/22010年在国内最早应用外显子组测序技术克隆了一个新的共济失调致病基因TGM62004年定位与克隆角膜环状皮样瘤家系基因组扫描的流程DNA抽提利用STR引物多重PCRGenotype基因分型Linkage连锁分析侯选基因,突变检测定位基因•角膜环状皮样瘤是一种先天性角膜良性肿瘤,呈常染色体显性遗传,以双侧眼球角膜缘处环形淡黄色肿块为特征,可延伸到结膜,患者可出现视力的改变如弱视、斜视和散光。•皮样瘤由外胚层包括角化的上皮、毛发、皮脂腺和中胚层包括纤维组织、脂肪组织、血管组成中国湖南角膜环状皮样瘤家系图I:1I:2II:1II:2II:3II:4II:5II:6II:7II:8II:9II:10II:11II:12II:13II:14II:15II:16III:1III:2III:3III:4III:5III:6III:7III:8IV:1IV:2IV:3IV:4IV:5IV:6III:9III:10III:11III:12IV:7IV:8III:13III:14III:15III:16IV:9III:17III:18III:19III:20III:21IV:10III:22III:23III:24III:25III:26III:27多重PCR•使用PE公司一套覆盖基因组22条常染色体、高杂合度的微卫星位点引物,一共382对。•采用Touchdown程序结合多重PCR反应方法,将5~12种不同引物混合,放入同一管中进行扩增,总反应体积5μl多重PCR反应体系•Reagent(试剂)Volume(体积ul)•10×GeneAmpPCRbufferII0.5ul10mMdNTPs0.1ul•25mmol/LMgCl20.6ul•5u/ulAmpliTaqGoldTMpolymerase0.04ul•10mmol/Lprimer0.04ul/pair•30ng/mlGenomicDNA1ul•steriledeionizedH2OaddH2Oto5ul疾病位点和染色体4q24-26上15个标记之间的两点LOD值LODSCOREAT=LOCUSGeneticdistance0.00.10.20.30.4ZmaxD4S1560104.75-2.501.251.170.860.451.25D4S2966106.893.412.872.261.570.813.41D4S1572107.953.913.412.721.880.933.91D4S1570109.023.582.982.311.560.733.58D4S1564112.626.075.043.902.661.306.07D4S2945116.375.044.213.302.271.115.04D4S2989117.066.725.644.443.091.556.72D4S1616117.065.014.333.472.431.215.01D4S406117.062.331.911.450.950.392.33D4S193117.066.075.083.972.741.356.07D4S1613121.616.635.574.383.051.536.63D4S1522123.130.643.933.312.381.213.93D4S1612124.45-3.791.851.591.140.601.85D4S402124.45-1.971.871.631.190.631.87D4S427124.45-3.691.401.190.760.321.40以上结果说明这个单体型在该家系中与疾病共分离,而这些重组事件的发生则将角膜环状皮样瘤疾病基因定位于4q24-26的D4S1572和D4S1522之间15.2cM范围内侯选基因的筛选•首先进行UCSC数据库(April,2003)查询D4S1572-D4S1522之间15.2cM的基因资料,结果显示在这个区间总计有65个knowngenes,52个Referencegenes•进行候选基因筛选时,考虑到组织发生中皮样瘤为异位到角膜的正常组织,推测角膜环状皮样瘤致病基因可能与胚层的移行、细胞的发育和分化密切相关侯选基因的筛选•通过筛选,选取其中3个能与组织细胞的发育分化和移行有关并在眼睛表达的基因:CXXC4PITX2TM4SF9PITX2—