高通量测序复杂疾病研究思路2015年2月•复杂疾病:是在众多因素共同作用下发生的,如多个基因、一个基因的多个突变、环境作用以及未知的随机因素,遗传模式复杂。可以认为对于复杂疾病来说,每个基因影响有限,单独不足以致病,而且可能对于疾病既非充分也非必要。复杂疾病在普通人群中发病率较高(一般不少于1%),所以也叫“常见疾病”,如精神分裂症、双相情感障碍、糖尿病、癌症等。复杂疾病•心脑血管疾病(高血压、冠心病、卒中)•神经系统疾病(自闭症、帕金森、阿尔兹海默症)•代谢类疾病(糖尿病、甲亢)•呼吸系统疾病(慢阻肺)•自身免疫病(红斑狼疮、类风湿)•……涉及疾病种类致病因素遗传因素•基因变异•表观遗传环境因素•生物性因素•理化性因素•营养性因素•精神性因素•……研究方向遗传易感性发生发展机制分子标志物疾病治疗遗传易感性•遗传基础是由多基因构成的,它部分决定了个体发病的风险。这种由遗传基础决定一个个体患病的风险称为易感性。(因此学术界将遗传因素和环境因素共同作用决定个体患病某种遗传病的风险称为易患性。易感性+环境因素=易患性)遗传易感性全基因组关联分析(Genome-wideassociationstudy,GWAS)是一种对全基因组范围内的遗传变异基因总体关联分析的方法,能够一次性对疾病进行轮廓性概览,适用于复杂疾病的研究。传统的GWAS研究以芯片技术为主,依赖于已知基因序列和杂交反应,往往遗漏重要信息,且可靠性、重复性差。近两年,利用高通量测序进行GWAS逐渐兴起。SNPA不患病SNPA患病SNPB不患病SNPB患病统计分析评价该SNP与该病是否有关联及关联程度GWAS患病人群正常人群遗传易感性研究常见变异假说Commondisease--Commonvariants:常见疾病主要是由常见基因的常见变异累积引起的。利用基因芯片进行GWAS研究问题:1.有效性:难以检测到罕见变异(探针设计及低频问题)2.可靠性:GWAS主要依赖统计分析,因此可能会出现比较多的假阳性和假阴性结果,大量功能实验的验证才是根本解决办法3.重复性:不同的群体、不同的研究一致性差4.精确性:GWAS可以确定与性状或疾病相关的位点而非直接确定基因本身高通量测序优势1.有效性:高通量测序技术,不局限于已知位点,能够检测未知突变及低频突变2.可靠性:测序准确性高于基因芯片技术,分析结果可靠性更高3.重复性:测序重复性较高4.精确性:测序不局限于已知位点,能够对特定基因的全部变异情况进行全面分析,更有利于将疾病与基因关联1.全基因组测序:对基因组最全面的分析2.外显子组:有效信息率高,利于分析和验证3.转录组:基因变异和表达量两个维度的分析•Whole-ExomeSequencingIdentifiesRareandLow-FrequencyCodingVariantsAssociatedwithLDLCholesterolLeslieA.Lange,YounaHu,HeZhang,etal.February,2014案例1•对2005个美国人(其中554个为低密度脂蛋白-胆固醇LDL-C水平最高307个和最低247个的2%内的极端个体)进行了外显子组测序。•Illumina测序平台双端76bp测序,平均测序深度为127X。材料与方法发现了LDL-C水平与PNPLA5基因中的罕见低频突变有关证实了以往研究中通过传统GWAS方法发现的PCSK9、LDLR及APOB三个基因与LDL-C水平的关系,而且在这三个基因中发现了更多的相关位点。相关基因变异文章通过关联分析找出了LDL-C相关的PNPLA5、PCSK9、LDLR及APOB基因上的变异,也侧面说明了利用外显子组测序进行GWAS分析比传统研究更高效更全面,发现更多编码区的相关位点。PNPLA5变异与LDL-CGenome-wideassociationstudyimplicatesNDST3inschizophreniaandbipolardisorder案例2文章利用904个患有精神分裂症和1640个正常的德系犹太人,进行GWAS分析。针对最相关的SNP,在已有研究的数据(5,415schizo-phreniacases,4,785bipolarcasesand12,991controls)中进行筛选。针对此SNP,利用转录组测序手段分析其相关的关键基因。Nov,2013Manhattanplot4q26:该区段包含16个强相关SNPs,其中rs11098403相关性最高Rs11098403:Pgwas=6.55*10-9,oddsratio(OR)forminor(G)allele=1.41Replicationandmeta-analysis利用39个精神分裂症病人,36个躁郁症患者及44个正常对照的小脑组织进行eQTL研究发现,rs11098403与NDST3的表达量明显相关,而NDST3编码一个硫酸乙酰肝素代谢过程中的关键酶。Rs11098403与NDST3表达对31个人,20个恒河猴和16个大鼠海马组织进行转录组测序,发现所有人的rs11098403附近会产生一个新转录本,这个转录本与NDST3的一个内含子保留的剪接变体有高度同源性。可能的机制发生发展机制RarecodingvariantsinthephospholipaseD3geneconferriskforAlzheimer’sdisease为了分析迟发性阿尔兹海默症(LOAD)的相关基因,作者对14个LOAD家族(每个家族至少4个患者)进行了研究,每个家族中选取2个患者和1个未受影响的对照进行外显子组测序。测序采用IlluminaHiSeq2000平台双端测序,平均每个患者获得160M的reads数。Jan,2014案例1两个不相干的家族中共同出现了PLD3基因上的Val232Met变异,在大量数据库共4,998阿尔兹海默症患者及6,356对照中进行的调查也发现阿尔兹海默症患者中存在多种形式的PLD3基因变异,这些变异增高阿尔兹海默症的患病风险。PLD3基因变异PLD3蛋白通常在脑组织中高表达,尤其是海马和大脑皮层,而在阿尔兹海默症患者的神经元细胞中表达量则明显降低。将PLD3过表达于小鼠成神经细胞瘤N2A细胞系中,细胞间淀粉样蛋白-B前体蛋白APP明显降低,而利用shRNA敲低PLD3则使APP表达升高,说明PLD3基因参与APP的表达过程,而APP的过表达正是阿尔兹海默症发病的重要原因。PLD3表达降低Jun,2014mRNA-seqrevealsnovelmolecularmechanismsandarobustfingerprintinGraves’disease.JClinEndocrinolMetab.Graves‘disease又叫弥漫性毒性甲状腺肿,是一种自身免疫病,是甲状腺功能亢进的主要原因。文章对9例Graves‘disease患者及12例正常的甲状腺组织进行了转录组测序,测序采用Illumina’sHiSeq2000平台单端100nt测序。案例2正常对照样本中参与免疫过程的基因占10.1%,而在患病样本中则增长至18.3%,表明Graves‘disease导致免疫应答增强;应激反应基因由6.8%增长至14.7%,代谢过程基因由47.3%降低至34.0%,推测是免疫应答增强的下游反应。差异基因注释Graves‘disease中最明显上调的基因有15个,包括6个HLA基因,4个细胞因子和趋化因子相关基因,4个生长合成相关基因及1个未知功能基因。差异表达基因最为相关的通路为免疫应答,另外病原体感染、甲状腺生长、应激反应和第二信使信号通路的上调也较为明显,而这些高表达基因的互做网络显示,NFkB复合物可能是这些通路相互作用中的关键分子。差异基因互做网络案例3取pilocarpine诱导癫痫12周后的大鼠海马组织(PIlO,n=4)及正常对照(CTrl,n=5).DeepsequencingrevealsincreasedDNAmethylationinchronicratepilepsyNov,2013差异甲基化分析差异甲基化分析差异表达基因关键基因分子标志物分子标志物是生物过程的指示物。根据分子标志物可以指示判断生物过程、发病过程以及治疗过程中药理反应。现在的分子标志物技术很大程度上应用于临床疾病诊断以及愈后预测。分子标志物案例1ComparativeMicroRNAExpressionProfilesofCynomolgusMonkeys,Rat,andHumanRevealthatmiR-182IsInvolvedinT2DPathogenicProcesses将食蟹猕猴分为两组,一组正常饮食,一组高脂饮食(HFD)诱导糖尿病发生;根据饮食和最后是否发生T2D,将样本分为四组:intact、intact-T2D、HFD、HFD-T2D,每组取3只进行miRNA测序,寻找与T2D相关的miRNA。Nov,2014T2D组和对照组间的差异miRNA在3个尺度进行比较:所有样本、intact组样本、HFD组样本,共发现24个差异表达的miRNAs,其中13个都是曾在大小鼠中发现的T2D相关miRNAs。差异miRNAsIntact组VSHFD组HFD相关差异miRNAs关键miRNA:miR-182案例2Identificationofalongnon-codingRNAasanovelbiomarkerandpotentialtherapeutictargetformetastaticprostatecancer从同一病人身上穿刺的不同克隆LTL-313BandLTL-313H,进行小鼠成瘤实验,LTL-313B在4个月内均在局部生长,未表现远处转移,而LTL-313H则在侵袭至肾脏,并在3个月内发生肺部转移。差异lncRNAsPCAT18特异性其他肿瘤雄激素与PCAT18功能验证疾病治疗案例BerberineamelioratesnonalcoholicfattyliverdiseasebyaglobalmodulationofhepaticRNAandlncRNAexpressionprofiles非酒精性的脂肪肝(NAFLD)黄连素(盐酸小檗碱)high-fatdiet(HFD)-inducedsteatoticanimalmodel黄连素对脂肪肝的治疗作用差异表达RNA聚类分析共表达网络MRAK052686与Nrf2共表达MRAK052686表达变化