基因组解剖1)基因组的结构成分2)基因组的顺序组成3)编码顺序蛋白质基因RNA基因4)原核生物基因组5)细胞器基因组6)非编码顺序DNA转座子逆转座子物种的染色体组Ophioglossumreticulatum(右)Myrmeciapilosula(下)箭蕨科:一支箭、瓶尔小草,630对染色体澳大利亞牛頭犬螞蟻,单倍体雄蚁1条染色体,双倍体雌蚁2条染色体染色体结构染色体显带或分带—chromosomebanding染色体带是指当染色体经一定的物理、化学因素处理并用特定的染料染色后,在显微镜下可显示出特定的深浅不同的条纹,或在荧光显微镜下看到不同强度的荧光节段。不同染色方法可分出Q、G、C、R、N、T及Cd等几种类型的带。不同的染色体具有不同形态的带,称为“带型”,反映了染色体固有的结构。据此我们可以准确无误地识别每一条染色体,并可用来分析染色体内部结构的变化。染色体带显示的过程称为染色体显带或分带。1968年,科学家用氮芥喹吖因使染色体不同部位差别染色,显示出清晰的带纹。自染色体高分辨显带技术问世后,研究者可以在人体细胞分裂的前中期染色体上显示出1256条带,在早前期染色体上可显示出3000~10000条带。显带技术不仅解决了染色体的识别问题,还为深入研究染色体的异常及人类基因定位创造了条件。染色体带型命名人类染色体带型最早确定的命名方式是从着丝粒向两侧按数字编号,短臂以p代表(p=petit),长臂以q代表.Karyotype和KaryotypingKaryotype:核型又称染色体组型,是指用显微镜照像或描绘的方法得到的单个细胞染色体的系统排列。由体细胞中全套染色体按形态特征和大小顺序排列构成,并依次配对、分组。代表的是该个体一切细胞的染色体组成。有丝分裂中期染色体的形态较典型,所以一般分析中期染色体。主要观察染色体的长短、着丝点的位置,臂的长短、有无随体,其中以着丝点的位置最为重要。Karyotyping:染色体核型分析,是指在显微镜下对个体细胞染色体的大小,形状,数目进行检测的一种方法.根据染色体分带技术可以检测到样品细胞的染色体结构是否正常,是否发生了染色体数目的变化,结构的重排,区段缺失或重复.人类染色体核型基因组的结构成分1)SAR和MAR2)CpG岛3)等高线4)富基因区5)“沙漠区”或贫基因区SAR和MARSAR:Scaffoldattehmentregion,与染色体骨架蛋白结合的染色体的DNA顺序.MAR:matrixarrechmentregion,与细胞核基质蛋白成分结合的染色体DNA顺序.MAR的分离MAR和SAR的特征1)当用交联剂如EtB处理提取的真核细胞核时,部分解旋的DNA可从细胞核中突出形成25-600kb长的环突.2)这些环突的DNA基部与细胞核基质紧密结合,将染色体DNA分成相对独立的结构区域.3)与细胞核基质结合的DNA顺序(基质附着区,MAR)含有较高比例的AT,约占总DNA的10%.4)拓扑酶II可与MAR结合,因此推测MAR成分与DNA复制有关.5)SAR可用二碘水扬酸铝分离,MAR则用高盐NaCl溶液分离.6)MAR或SAR之间的距离平均为30kb,染色体DNA环突长约25-600kb,因此并非所有MAR或SAR均与基质或骨架结合.或这说MAR(或SAR)与基质或骨架结合的位置是动态的,不固定的.SAR和MAR的应用由于发现许多功能基因的两侧含有SAR或MAR的结构,并证实SAR和MAR具有阻止异染色质位置效应和隔离相邻基因彼此干扰的功能,因此为了提高转基因的表达水平,在构建表达载体时可在基因两侧安装SAR或MAR顺序,以减少转基因沉默效应.什么是CpG岛满足CpG岛的条件为:1.连续200bp的DNA顺序(已修改为500bp);2.C+G含量大于50%(已修改为55%);3.观测到的CpG双碱基数目与预期的数目之比大于0.6(已修改为0.65).(Gardiner-Garden,J.Mol.Bio.,196:261,1987;ProcNatlAcadSciUSA99:3740-3745,2002)CpG岛的一般特点1)主要在脊椎动物中发现,其它种属基因组中也有CpG岛,但特征不明显.2)绝大多数CpG岛中很少出现胞嘧啶甲基化,因此被认为是基因转录活跃区.3)CpG岛主要分布在基因的启动子区和第一个外显子区.4)绝大多数管家基因(housekeepinggene)含有CpG岛,是寻找基因的一个指标.CpG岛的分布脊椎动物中CpG岛的分布有如下特点:1.主要分布在基因的5’端和第1个外显子区.2.人类中40%的管家基因的5‘端均含CpG岛.3.双碱基-CpG-具回文结构,是甲基化酶作用的位点,可在回文对称的两个胞嘧啶5位碳原子上进行甲基化.在CpG岛中-CpG-双碱基均无甲基化.人类基因组CpG岛的组成为何会产生CpG岛?1)由于细胞内胞嘧啶甲基化与脱氨基事件常常发生,导致复制时的C→A错配.在下一轮复制时原来的胞嘧啶(C)位置由胸腺嘧啶(T)取代,即发生碱基代换.因此基因组DNA顺序进化的总趋势是A/T比例增加.2)“基因转换”,即DNA复制时以同源DNA单链为模板进行复制,使子代DNA出现高G/C比的转换.3)管家基因对生物的存活极其重要,启动子区是基因调控的主要成分,因此很少发生可遗传的C→A的突变,保留了较平均值更高的G/C比.植物基因组中的CpG岛1)植物基因组,主要是小型基因组(水稻和拟南芥)含有类似脊椎动物基因组中的CpG岛.2)水稻和拟南芥CpG岛的分布密度分别为4.7kb和4.0kb.3)水稻和拟南芥CpG岛的分布覆盖了整个基因,并非如脊椎动物那样局限于基因5’端.4)植物除-CpG-可被甲基化外,-CpNpG-回文结构的胞嘧啶也可甲基化.5)植物中-CpG-在CpG岛中的比例在75-80%,与脊椎动物类似,单子叶高于双子叶.引自:Ashikawa,PlantJournal26:217,2001.水稻编码基因C/G比例非均一分布水稻基因的CG含量呈现由5‘向3’逐渐降低的分布态势,这种特征与人的肩膀类似,故称溜肩形(shoulder).基因组顺序组成的等高线(isochore)特点1)等高线(isochore)系指基因组中具有较均一的相似比例碱基组成的连续的DNA顺序.2)脊椎动物基因组中等高线DNA顺序具有相嵌分布的特征.3)高GC比例区总是分布在基因密集区或常染色质区,高AT比例区大多数分布在异染色质区或贫基因区.4)梯度密度离心可将不同碱基比例的具有均一性组成的DNA顺序分离.基因组等高线—碱基的非均一分布CpG岛与等高线的进化基因组的顺序组成1)编码顺序2)非编码顺序3)重复顺序4)单一顺序人类基因组概貌人类基因的一般结构1)theaveragehumangenecontains4exonstotaling1,350basepairs(cDNA)andthusencodesanaverageproteinof450aminoacids.2)Thedensityofgenesonthedifferentchromosomesvariesfrom基因密度最高:染色体19,平均每Mb为23个基因,43kb/基因基因密度最低:染色体13,平均每Mb为5个基因,200kb/基因最大的基因-Tintin(肌联蛋白)基因titin基因的外显子数Celera报道为234,人类基因组计划组织报道为178,编码27000个氨基酸.Titin基因全长约3000kb,约占人类基因组总长的0.1%.外显子最多的基因-Dystrophin1)Dystrophin(肌营养不良蛋白)withits79exonsspreadover2000kb,约占人类基因组0.1%..2)Duchennemusculardystrophy(DMD)perhapsitsgreatsizemakesthisgenesosusceptibletopartialdeletions.Ifthesecauseachangeinthereadingframe,nodystrophinissynthesizedandDMD,averysevereformofthedisease.3)Beckermusculardystrophy(BMD).Ifthedeletionsimplyremovescertainexons,ashortenedproteinresultsthatproducesBMD,amilderformofthedisease.4)ThegenefordystrophinisontheXchromosome,sothesetwodiseasesstrikemalesinatypicalX-linkedpatternofinheritance.该遗传病在男性中非常突出.无脊椎动物中没有的人类基因1.antibodiesandTcellreceptorsforantigen(TCRs).2.thetransplantationantigensofthemajorhistocompatibilitycomplex(HLA,theMHCofhumans),cell-signalingmoleculesincludingthemanytypesofcytokines.3.themoleculesthatparticipateinbloodclotting(凝血).4.mediatorsofapoptosis.AlthoughtheseproteinsoccurinDrosophilaandC.elegans,wehaveamuchricherassortmentofthem.人类中更为丰富.基因在染色体上的分布—酵母染色体长度基因密度染色体长度基因密度-----------------------------------------------------------------------------------------------------I230kb1102kbIX4402312kbII813kb4222kbX7453872kbIII315kb1722kbXI6673342kbIV1532kb8122kbXII10785472kbV577kb2912kbXIII9244872kbVI270kb1352kbXIV7844212kbVII1091kb5722kbXV10915692kbVIII563kb5882kbXVI9484972kb-----------------------------------------------------------------------------------------------------注:染色体IV和XII中重复顺序未包括在内.酵母最小染色体酵母最小染色体为VI,长270kb,含135个基因.据分析,为了保持最低限度的染色体长度,VI号染色体填充了许多非必需顺序.基因在染色体上的分布—线虫染色体大小(Mb)蛋白质基因基因密度-------------------------------------------------------------113.8628031/4.9kb214.7232591/4.6kb312.7725081/5.1kb416.1430941/5.1kb520.8240821/4.3kbX17.2226311/6.5kb-------------------------------------------------------------Total95.53191411/5.0kb基因在染色体上的分布—拟南芥染色体长度(Mb)基因(ORF)密度---------------------------------------------------------129.165431/4.0kb219.740361/4.9kb323.252201/4.5kb417.538251/4.6kb526.058741/4.4