医学遗传学研究的策略与方法王颖市场部经理上海天昊生物科技有限公司医学遗传学:应用遗传学的理论与方法研究遗传因素在疾病的发生、流行、诊断、预防、治疗和遗传咨询等中的作用机制及其规律的遗传学分支学科。包括疾病基因组学、肿瘤基因组学、表观遗传学、药物基因组学等分支。遗传性疾病:是指因受精卵中的遗传物质(染色体,DNA)异常或生殖细胞所携带的遗传信息异常所引起的子代的性状异常。分类:•单基因遗传病•多基因遗传病•染色体畸变遗传病•线粒体病单基因遗传病:是由于基因组内的一个基因突变而引起的遗传性疾病,又可分成4种:①常染色体显性遗传病如多指(趾),享廷顿舞蹈病。123456789101112131415②常染色体隐性遗传病,如白化病,先天聋哑等。③X染色体显性遗传病,如遗传性慢性肝炎等。④X染色体隐性遗传病,如血友病、色盲等。1234567891011121314151617181912345678910111213123456789101112131415•多基因遗传病:由多个微效基因累加共同作用,同时受到外界环境相互作用的结果。关键词:易感性、遗传异质性1.多基因遗传病:常见疾病(代谢综合症、心血管疾病、皮肤病、自身免疫病等);多基因数量性状(临床生化指标、骨密度、血压等)。2.肿瘤易感性:不同肿瘤发病的遗传易感性。3.药物个体差异:药物的有效性、副作用、安全性的个体差异的遗传机制研究。研究基本策略•连锁分析----家系•关联研究----人群•连锁分析和关联研究的原理和假说基本上是相似,两者均以相邻近的DNA变异共分离为基础。•连锁分析是通过鉴定经多代传递仍完整的单倍型为基础的,检测在一个家系中等位基因与疾病的传递是否相关。•关联研究则是通过鉴定经许多代数传递后仍保留完好的相邻近DNA变异之间的DNA片段,检测在一个群体中疾病和等位基因的相关性的存在与否。因此,关联研究也可认为是在未观察到的、可能存在的家系中进行的大规模的连锁分析。NatureGenetics,volume10;August2009一.连锁分析是基因定位中的主要策略之一。基本原理:在家系中,位于同一条染色体上的两个位点(致病基因与遗传标记)在减数分裂的过程中会发生交换与重组,染色体上的两个位点间相距越远,发生重组的机率越高,两个位点在一起传给后代的机会就越少。因此,由家系中标记位点与疾病位点间的重组率可估算出两者间的距离以及连锁程度。123512D11S418163373481391210331134121313531433153216121713D11S4181186121222323332413251326232733284129333013312332133313343335333633372238323916D11S4181401643334433453146定位克隆通过对覆盖密度适当的遗传图中的遗传标记物在家系中进行分型,以此找到与致病基因紧密连锁的某一标记物,从而确定该基因在染色体上的粗略位置,在此基础上再在该染色体区域使用覆盖程度更高、杂合度更好的标记物作深入的连锁分析和单倍型分析,就可将致病基因确定在较小的区域,这样,再利用物理图提供的该区域的染色体片段将基因确定。基于连锁分析的“定位克隆”技术的出现,导致了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发现,为这些疾病的基因诊断和基因治疗奠定了基础。连锁分析中,家系提供的信息量主要取决于两个方面:(1)家系的结构及大小,如世代数,核心家系数及患者数等;(2)遗传标记物(marker)杂合度,高者信息量大。因此,如果有足够大的家系,目前的微卫星标记已能将连锁分析定位于一定区域;而单核苷酸多态性(SNP)标记由于其杂合度有限,所以只能通过高密度来提高信息量。连锁分析法主要适用于已知遗传方式的单基因遗传病的基因定位,而在多基因遗传病易感基因定位研究中的作用非常有限。二、关联研究(associationstudy)最常用在无亲缘关系群体中随机选取一个疾病组及一个相应非疾病组,比较标记位点的等位基因频率在组间是否存在显著差异,故称病例-对照关联研究。此途径基于观察的标记位点等位基因与致病基因位点间存在连锁不平衡。标记位点与致病基因位点越近,且重组率越低,则用标记检出致病基因位点的机率越高。Allelefrequencydifferencesbetweencasesandcontrols▲Diseaseassociation▲Evolutionaryormigratoryhistory▲Genderdifferences▲Matingpractices▲OtherindependentprocessesHowever,manyearlyassociationscannotbereplicated.CommonLimitationsinassociationstudiesofcomplexdiseases▲Smallsamplesize▲Subgroupanalysisandmultipletesting▲Randomerror▲Poorlymatchedcontrolgroup▲Failuretoattemptstudyreplication▲Failuretodetectlinkagedisequilibriumwithadjacentloci▲Overinterpretingresultsandpositivepublicationbias▲Unwarranted‘candidategene’declarationafteridentifyingassociationinarbitrarygeneticregion关联研究通过对某些位点在病例组和对照组中观察到的频率是否存在显著性差异,来判断这些位点是否与该疾病表型具有相关性。目前常用的策略:1.热点候选位点2.热点候选基因3.基于生物学通路的候选基因4.全基因组水平GenomeWideAssociationStudy(GWAS)Wedefineagenome-wideassociationapproachasanassociationstudythatsurveysmostofthegenomeforcausalgeneticvariants.▲noassumptionsaboutthegenomiclocation▲nomisunderstandingfordiseasemechanism▲nobiasedoptionforthefunctionandthelocationofthecausalgenes全基因组关联研究(GWAS)科研项目的样品•样品的收集与选取•样品数量策略•需要注意的问题样品信息:编号、姓名、样品采集时间和地点、采集人。一般信息:性别、年龄(出生年月,如果涉及某种疾病要记录发病年龄或者是确诊年龄)、籍贯、身高、体重。病史及家族史:个体重大疾病的病史和相关疾病的家族史。临床资料:基本生化指标、血压、一般临床体征的检查、疾病特定的临床检查或者疾病确诊分级金标准检查的结果。临床治疗和预后:针对疾病的基本治疗用药方案(精确到时间、体重、计量)、用药后的有效性、毒副作用。疾病经过治疗后的预后和复发情况。知情同意书case-controlstudy的样品策略人群结构问题Populationstructureinassociationstudies1.Morefalsepositives2.MissrealassociationsAssociationstudiestypicallyavoidcombiningindividualsacrosspopulations,butalarge,multicenterstudymightinadvertentlyincludesomeindividualsoutsidetheprimarystudygrouporsomeindividualswithsubstantialbutundetectedlevelsofadmixture.Marker----SNPs遗传标记:SNP标记物系统单核苷酸多态性(SNP),是基因组中最为常见的变异,是指在基因组中,不同个体的DNA序列上的单个碱基的差异。SNP作为第三代的遗传标记,具有数量多、密度大、分布广等特点,在疾病定位和关联分析中可以发挥极为重要的作用。LD与haplotype连锁不平衡(linkagedisequilibrium):是连锁的基因座间,二者等位基因非随机的组合,出现优势组合。单倍型(haplotype):由于在基因组中相邻SNPs的等位位点倾向于以一个整体遗传给后代。位于染色体上某一区域的一组相关联的SNP等位位点就被称作单体型。大多数染色体区域只有少数几个常见的单体型(每个具有至少5%的频率),它们代表了一个群体中人与人之间的大部分多态性。Haplotypeblock指一个具有较高连锁不平衡水平和很少的单倍型多态的染色体区域。在一个block区域中的所有多态之间都具有很强的连锁不平衡水平,而与block外的多态之间的关联很弱。Block被认为是重组热点两侧的低重组区域。单倍型标签SNP在一个Haplotypeblock中存在有很多SNP位点,但是只用少数几个标签SNPs(haplotypetagSNP,htSNP),通过这些位点等位基因型的组合就能够提供该区域内大多数的遗传多态模式。2002年,国际人类基因组单倍型图计划(即国际HapMap计划)正式启动,该计划由加拿大、中国、日本、尼日利亚、英国和美国共同资助和合作进行,旨在建立一个将帮助研究者发现人类疾病及其对药物反应的相关基因的公众资源。目标是通过比较不同个体的基因组序列来确定染色体上共有的序列变异,描述人类基因组中常见遗传多态位点。•大多数常见的单体型存在于所有的人类群体中,但在不同人群中频率存在差异,研究此差异确保了通过对这些人群进行大规模的单体型分析的合理性。PopulationCEUCHBJPTYRISamplesize90454590Triple300030运用这些样品能通过HapMap计划发现几乎全部频率大于5%的单体型。利用这些世界主要人群绘制的单体型图应当对世界上所有的人群适用。基因分型技术▲Fluorescence:DirectdetectionGelelectrophoresisMicroarrayChip▲Massspectrometry数据分析•卡方检验•单倍型分析,单倍型卡方•回归分析•分层分析•数量性状的方差分析•多重校正Multiple-hypothesistestingTestingmorethanonehypothesiswithinanexperiment.Asaresult,theprobabilityofanunusualresultfromwithintheentireexperimentoccurringbychanceishigherthantheindividualp-valueassociatedwiththatresult.MultipleTestingCorrection(10SNPs)▲Bonferronip-valueorderp-value0.00610.006*10=0.060.00820.008*10=0.080.01230.012*10=0.120.0440.04*10=0.4……..▲FalseDiscoveryRatep-valueorderp-value0.00610.006*10/1=0.060.00820.008*10/2=0.040.01230.012*10/3=0.040.0440.04*10/4=0.1……..功能验证研究开展功能研究的前提1.确定位点与疾病表型存在相关。2.位点与某个基因的功能改变可能相关。3.预测此位点对该基因功能可能造成的影响。(质或者量的变化)4.确定需要研究的组织。5.确定可以使用的功能研究方法。常用的功能研究方法1.质的改变:需要根据基因编码的