基因检测结果风险评估和生物信息学郑征M.D.青岛大学生物化学与分子生物教研室序言:所有表型(疾病)都是遗传和环境共同作用的结果2外显率(Penetrance)是指一定环境条件下,群体中某一基因型(通常在杂合子状态下)个体表现出相应表型的百分率。外显率为100%时称完全外显(completepenetrance),低于100%时则为不完全外显(incompletepenetrance)或外显不全。临床中:•外显率100%意味着所有携带某种遗传变异的人最终都会罹患相应的疾病,常为单基因遗传病,如Huntington病•BRCA1基因变异的女性有85%将会最终发展为乳腺癌,外显率为85%;男性外显率则不到1%Huntington病Crohn病糖尿病白血病感染性疾病孟德尔遗传病复杂疾病环境性疾病易受环境因素影响易受遗传因素影响序言:所有表型(疾病)都是遗传和环境共同作用的结果3基因检测:预测遗传因素对个人健康的影响•指导生活方式(运动、饮食等)•规避诱发疾病的风险因素•指导用药(剂量、替换)•进一步诊断、治疗、预防单基因遗传病复杂疾病遗传模式清晰;外显率高遗传模式不清晰;外显率低一、基因检测报告的内容:1.商业化检测案例(1)23andMe在2013年初提供的基因检测服务项目•CarrierStatus:48项遗传变异位点检测•DrugResponse:20项药物反应检测•DiseaseRisk:119项疾病患病风险检测•Traits:57项遗传特征检测4一、基因检测报告的内容:1.商业化检测案例(2)华大医学目前提供的基因检测项目(卫计委评估公布的第一批高通量测序技术临床应用试点单位之一)5一、基因检测报告的内容:1.商业化检测案例(2)华大医学目前提供的单基因基因检测项目:各种套组——GeneTestPanel6一、基因检测报告的内容:1.商业化检测案例(3)PathwayGenomics目前提供的基因检测项目7一、基因检测报告的内容:2.检测结果示例8(1)一脉基因的检测报告样例一、基因检测报告的内容:2.检测结果示例9(1)一脉基因的检测报告样例一、基因检测报告的内容:2.检测结果示例10说明:•参考碱基和基因型为正链;•SNPedia结论:红色、绿色、蓝色、灰色分别表示有害、正常、有益突变和样品未覆盖;•SIFT:基于同源蛋白氨基酸保守性的预测;•Polyphen2:基于同源蛋白的三维结构预测;•MutationTaster预测:基于进化保守性、剪切位点改变和mRNA水平的变化引起的蛋白质特征丢失等信息预测;•-(空数据值):表示突变位点不在基因编码区。(1)一脉基因的检测报告样例一、基因检测报告的内容:2.检测结果示例11(2)PathwayGenomics的检测报告样例一、基因检测报告的内容:2.检测结果示例12(2)PathwayGenomics的检测报告样例一、基因检测报告的内容:2.检测结果示例13(2)PathwayGenomics的检测报告样例二、基因检测报告的形成:1.支撑报告的基础研究14检测报告中的注意事项及免责声明二、基因检测报告的形成:1.支撑报告的基础研究15(1)HGP(HumanGenomeProject,人类基因组计划)(2)InternationalHapMapProject(国际人类基因组单体型图计划)(3)GWAS(GenomeWideAssociationStudy,全基因组关联分析)(4)GRS(Geneticriskscore,遗传风险评分)二、基因检测报告的形成:1.支撑报告的基础研究16(1)HumanGenomeProject(人类基因组计划)测定组成人类染色体(指单倍体)中所包含的30亿个碱基对组成的核苷酸序列,绘制人类基因组图谱,辨识其载有的基因及其序列,破译人类遗传信息。二、基因检测报告的形成:1.支撑报告的基础研究17(2)InternationalHapMapProject(国际人类基因组单体型图计划)HapMap是人类基因组中常见遗传多态位点的目录,它描述了这些变异的形式、在DNA上存在的位置、在不同人群间的分布状况。不同个体的碱基的差别是目前最常见的遗传多态现象,这些遗传上的差别称为单核苷酸多态性或SNPs(发音为“snips”)。HapMap通过识别在人类基因组中常见的大约一千万个SNPs的大多数,来确定人类的大部分遗传多样性的分子基础。SNPs也是进行基因定位的分子标记。比如说基因的改变会增加罹患高血压的风险,研究者可以比较高血压患者和正常人的SNPs。如果某一个SNP在高血压患者中很常见,就可以把这个SNP作为标记来定位和识别与这一疾病相关的基因。二、基因检测报告的形成:1.支撑报告的基础研究18(3)GWAS(GenomeWideAssociationStudy,全基因组关联分析)是指在全基因组层面上,开展多中心、大样本、反复验证的基因与疾病的关联研究,是通过对大规模的群体DNA样本进行全基因组高密度遗传标记(如SNP或CNV等)分型,从而寻找与复杂疾病相关的遗传因素的研究方法,全面揭示疾病发生、发展与治疗相关的遗传基因。复杂性状GWAS分析方法的原理是,借助于SNP分子遗传标记,进行总体关联分析,在全基因组范围内选择遗传变异进行基因分型,比较异常和对照组之间每个遗传变异及其频率的差异,统计分析每个变异与目标性状之间的关联性大小,选出最相关的遗传变异进行验证,并根据验证结果最终确认其与目标性状之间的相关性。二、基因检测报告的形成:1.支撑报告的基础研究19(3)GWAS(GenomeWideAssociationStudy,全基因组关联分析),基因组水平研究SNP与疾病的相关性人类的疾病分为单基因疾病和复杂性疾病。单基因疾病是指由于单个基因的突变导致的疾病,通过家系连锁分析的定位克隆方法,人们已发现了囊性纤维化、亨廷顿病等大量单基因疾病的致病基因,这些单基因的突变改变了相应的编码蛋白氨基酸序列或者产量,从而产生了符合孟德尔遗传方式的疾病表型。复杂性疾病是指由于遗传和环境因素的共同作用引起的疾病。目前已经鉴定出的与人类复杂性疾病相关联的SNP位点有近千个。GWAS技术的重大革新及其应用,极大地推动了基因组医学的发展。二、基因检测报告的形成:1.支撑报告的基础研究20(3)GWAS(GenomeWideAssociationStudy,全基因组关联分析),基因组水平研究SNP与疾病的相关性a1)计算疾病的Risk•通过队列研究(cohortstudy)计算得出健康人(n=1005)发病率?105/1005=0.10时间得出Risk为10%二、基因检测报告的形成:1.支撑报告的基础研究21(3)GWAS(GenomeWideAssociationStudy,全基因组关联分析),基因组水平研究SNP与疾病的相关性D+D-TotalRisk解释All1059001005105/1005=0.10患病风险为10%TT15849915/99=0.15患病风险为15%TC4638342946/429=0.11患病风险为11%CC4443347744/477=0.09患病风险为9%a2)计算每种基因型(genotype)的绝对Risk•每个risk为绝对风险,是指某种基因型的人患某种疾病的风险二、基因检测报告的形成:1.支撑报告的基础研究22(3)GWAS(GenomeWideAssociationStudy,全基因组关联分析),基因组水平研究SNP与疾病的相关性绝对Risk相对Risk(RR)TT0.150.15/0.09=1.7TC0.110.11/0.09=1.2CC0.091.0(参考值)a3)计算每种基因型(genotype)的相对风险RelativeRisk•RR=两个risk的比值•用于衡量遗传变异对于患病风险的“影响程度”TT基因型的解释:1.7倍的患病风险,或患病风险增加了70%TC基因型的解释:1.2倍的患病风险,或患病风险增加了20%二、基因检测报告的形成:1.支撑报告的基础研究23(3)GWAS(GenomeWideAssociationStudy,全基因组关联分析),基因组水平研究SNP与疾病的相关性注:这里Risk和Odds的概念与流行病学中的患病率(prevalencerate)和发病率(incidencerate)不同b1)计算患病几率Odds•通过对照研究(case-controlstudy)计算得出健康对照组(Controls)(n=500)疾病组(Case)(n=500)二、基因检测报告的形成:1.支撑报告的基础研究24(3)GWAS(GenomeWideAssociationStudy,全基因组关联分析),基因组水平研究SNP与疾病的相关性CasesControlsTotal疾病的Odds解释All5005001000500/500=1.050:50患病概率TT160108268160/108=1.5患病概率不患病概率TC160121281160/121=1.3患病概率不患病概率CC180271451180/271=0.7患病概率不患病概率b2)计算每种基因型(genotype)的Odds•Odds=疾病人数/健康人数二、基因检测报告的形成:1.支撑报告的基础研究25(3)GWAS(GenomeWideAssociationStudy,全基因组关联分析),基因组水平研究SNP与疾病的相关性OddsOddsratio(OR)TT1.51.5/0.7=2.1TC1.31.3/0.7=1.9CC0.71.0(参考值)b3)计算每种基因型(genotype)的Oddsratio•OR值=两个Odds的比值TT基因型的解释:患病几率高,为不患病的2.1倍TC基因型的解释:患病几率高,为不患病的1.9倍二、基因检测报告的形成:1.支撑报告的基础研究26(4)遗传风险评分(Geneticriskscore,GRS)需要科学的算法•简单相加遗传风险评分(SC-GRS),简单易用,早期应用较多;•OR值权重遗传风险评分(OR-GRS),依赖GWAS、Meta分析等SNP权重数据,目前应用广泛;•直接logistic回归遗传风险评分(DL-GRS),基于原始数据拟合logistic回归模型估计的SNP权重;•多基因遗传风险评分(PG-GRS),依赖现有数据,以哑变量的形式考虑每个SNP;•可释方差遗传风险评分(EV-GRS),基于既往风险评分方法,考虑SNP效应和最小等位基因频率。二、基因检测报告的形成:1.支撑报告的基础研究27SC-GRS公式:=G1+G2+….+GiOR-GRS公式:=ln(OR1)G1+ln(OR2)G2+….+ln(ORi)Giin1iGGRSΣiin1i)Gln(ORGRSΣ(4)复杂疾病遗传风险评分(Geneticriskscore,GRS)注:D=1为病例,D=0为健康对照,Gi为第i个遗传易感位点(如SNP)的风险等位基因的数量二、基因检测报告的形成:1.支撑报告的基础研究28(4)复杂疾病遗传风险评分(Geneticriskscore,GRS)二、基因检测报告的形成:2.生物信息学的促进29生物信息学(bioinformatics)是一门新的前沿交叉学科,采用数理和信息科学的理论、技术和方法研究生命现象,理解和组织与生物分子相关的信息。生物信息学-新兴的交叉学科MathematicalsciencesComputersciencesLifesciences生物信息学对二代测序类基因检测的支持:•样本检测——序列回帖、拼接•查找突变——比对变异、变异信息数据库•计算评分——算法、打分软件•报告解读——功能注释数据库三、基因检测报告的解读:1.遗传咨询师302015年12月17日,美国医学遗传学与基因组学学会(ACMG)对个人基因检测服务提出了新的要求:实验室的CLIA资质认证遗传咨询专家的资质认证检测目的的明确性检测方法的科学性个人隐私的保护遗传咨询专家:在基因检测服务过程中,