网址:基因测序行业发展机遇及投资前景预测一、基因测序是精准医疗的基础,具广阔应用和增长空间随着人类基因组测序技术的飞速提升、生物医学分析技术的快速发展和大数据分析工具的日益完善,我们正进入全新的医疗健康时代——精准医疗。精准医疗是一种基于“个人”的定制医疗模式,其以个体的组学信息和遗传信息为基础,以环境、生活方式、既往病史及诊疗方式等为跟踪对象,搜集全方位、可量化、有前瞻性和时效性的个体数据,通过数据的综合分析、挖掘形成有价值的医学信息,最终设计出针对个体的最优解决方案。基因测序为个体提供连续基因大数据,是精准医疗的基础和重要实现途径,制药、器械、IT等行业巨头纷纷布局该领域。基因测序技术凭借灵敏度高、精度和通量高、价格低廉等优势,成为基因检测技术中获取人体基因组数据的主流技术,通过将基因组数据与无线生物传感器获取的生命体征信息(如血压、心跳、脑电波、体温等),成像设备中的个体信息(如CT、MRI、超声等)以及传统医学数据相结合,精准医疗为个体提供全新的定制医疗。(一)“一刀切”治疗时代已过时,启动精准医疗刻不容缓传统医学痛点催生精准医疗需求。传统的循证医学是结合临床医生的个人实践经验和客观的科学研究证据,对于症状相同的病人使用相同剂量的同种药物进行治疗,但治疗效果却千差万别。传统治疗方案显示,肿瘤的无效率高达75%,糖尿病无效率43%,抑郁症无效率也有38%。人们逐渐意识到大多数疾病的发生是自身遗传密码和外界环境共同作用的结果。精准医疗借助可监测的遗传信息和环境信息,针对个体提供定制的优化治疗方案,提升现有治疗水平,并尽量在发病前就有望有效预防。(二)基因测序是精准医疗的基础1、基因测序是建立“组学”大数据库和分析的基础,推动精准医疗实现“同病异治”和“异病同治”精准医疗旨在向患者提供疾病精确诊断和个性化的治疗方案,并将医疗技术提升到病前预防水平。相关技术的发展有两个要素:1)构建“组学”大数据样本库,如基因组学、转录组学、蛋白组学等;2)探究基因型与样本表型的关联,通过生物信息学分析和遗传诊断,建立遗传信息与临床检验和影像学等数据的关联关系,实现精确的疾病分类和诊断,制定个性化的疾病预防和治疗方案,做到“同病异治”和“异病同治”。网址:上述两要素都与基因测序密不可分。2、个体间基因组0.5%的差异可被基因测序捕捉人体基因组由30亿对碱基组成,不同人之间基因组的差别只有千分之五。正是这不到1%的差别与外部环境共同决定着人体表型,如高矮胖瘦、酒量、乳糖耐受以及疾病等。基因测序是通过采集血液、体液或细胞,使用测序仪器获取被检测者的DNA序列,然后利用生物信息学方法将该基因信息与已知的基因突变数据库进行比对,并分析其中的异常突变信息,进而诊断疾病,甚至用于患病风险的预测。人体基因组测序内容主要包括靶向重测序、外显子测序、转录组测序和全基因组测序。通过与正常序列的比对,发现异常突变。异常突变信息按发生突变的碱基数量分为3类:(1)单个碱基的突变:单核苷酸多态性(SNP),(2)20bp以下碱基的变异:插入-缺失(Indel),(3)20bp以上碱基变异:插入(Insertion)、删除(Deletion)、拷贝数变异(CNV)以及基因组结构变异(SV)等。3、基因测序是基因检测的基础和主流技术基因检测技术,应用分子生物学的方法检测患者体内遗传物质的结构或表达水平的变化,以实现精准诊断,从而指导更优的治疗方案。目前基因检测常见手段包括聚合酶链式反应(PCR)、荧光原位杂交技术(FISH)、基因芯片技术(GeneChip)、转录介导的扩增(TMA)和基因测序技术等,其中基因测序是其他四种检测方法的基础和主流技术。(三)供需两端共同驱使基因测序飞速发展1、测序成本和测序耗时成指数级下降测序的成本和耗时呈指数级下降。随着二代测序技术(NextGenerationSequencing,NGS)的不断革新,测定一个人全基因组数据的成本,由原来的上亿美金,快速下降到目前1000美元,测序时间也降至3天。2、人类基因组大数据累积初级阶段完成经过10多年的累积,人体基因组数据库已经初步形成规模。2003年,由美中等6国科学家历时13年、耗资30亿美金的“人类基因组计划”(HumanGenomeProject)宣布完成。同年,“DNA元件百科全书计划”启动,并于2012年公开发表研究成果,对人类疾病相关的基因序列研究有重大影响。随后,“国际千人基因组计划”、英国“十万基因组计划”、美国“百万基因组计划”先后于2008年、2014年和2015年启动,为人类基因组样本的累积和探究疾病与基因的关系提供了扎实的基础。3、基因组数据分析方法应运而生人体基因组的分析已初步流程化和标准化。生物信息学自1987年首次提出后,经过近30年的发展,从最初的基因组数据的收集和存储,到利用数学建模和人工智能思想,挖掘网址:数据背后的生物学意义、对样本数据进行合理分类、建立合理的二级和三级数据库,再到利用比较基因组学的方法,通过短读序列拼接、基因预测和功能注释,已有一定的能力用于处理庞大复杂的基因组数据。4、疾病预防和个性化治疗需求远未满足现代科学证实,大部分疾病是基因与外部环境共同作用的结果,几乎所有疾病(除外伤)的发生均与基因有关。人类基因组研究成果表明绝大部分人群携带有某些类疾病的易感基因,当人群接触某些不良因子和环境时,其发病几率远高于非携带易感基因人群。因此,人们逐渐意识到只有真正了解自身的基因情况,才能通过改善客观环境、定期体检等方式尽可能地延缓或阻止疾病的发生。我国慢性病患者人数快速增长,对精准医疗有着迫切需求。推动精准医疗需求。目前我国每年310万癌症新增案例,高血压患者达2.6亿,糖尿病患者超过1亿人,糖尿病潜在人群1.5亿;每年220万癌症死亡案例和300万心血管疾病死亡案例。上述疾病通过传统方法难以根治或治愈,对精准医疗有着迫切需求。越来越多的人意识到基因测序对自身健康的重要性。2011年去世的苹果公司创始人史蒂芬•乔布斯患癌时,曾接受过全基因组测序。2013年5月,奥斯卡影后安吉丽娜•朱莉通过基因检测和相应的切除手术,将患乳腺癌风险从87%降到5%。5、基因测序市场每年有望保持20%以上增速精准医疗市场增速将远超医药行业整体水平。据BCCResearch预测,2015年全球精准医疗市场规模近600亿美元,今后5年年增速预计为15%,是医药行业整体增速的3至4倍。其中,全球基因测序市场规模从2007年的800万美元增长至2013年约45亿美元,预计未来几年将保持超过20%的增速,至2018年将达到约117亿美元。Marketsandmarkets预测中国的基因测序产业2012-2017年间CAGR有望达20%-25%。二、基因测序全产业链:上游测序仪器制造、中游测序服务与下游数据分析共同构成基因测序全产业链划分为上游的测序仪器与试剂耗材市场,中游的基因测序服务市场和下游的生物信息学分析市场。中下游市场面向群体包括医院、药厂、科研机构以及消费者等,可分为医疗和非医疗两个领域。医疗领域可分为人体基因组和人体微生物基因组两个子领域。针对人体基因组的主要产品有肿瘤学(诊断筛查与治疗、靶向用药、伴随诊断等)、生育(无创产前诊断、胚胎植入前检测、新生儿遗传病排查、亲子鉴定等)、遗传学疾病和新药研发指导等。目前人体微生物基因组与宿主健康的关系也已被重视,如2007年和2008年,美国国立卫生研究院(NIH)和欧盟先后启动了人体微生物组计划(HMP)和人体肠道宏基因组计划(MetaHIT),可通网址:过分析人体微生物基因组检测宿主的肠道疾病、神经系统疾病、肝病、糖尿病、肥胖以及腹腔肿瘤等。在非医疗领域中,可以通过环境微生物基因组研究治理环境污染的新方法、探测石油存储和地质学研究,也可以用于农牧业配种和司法鉴定等。本篇报告主要讨论基因测序在医疗领域中针对人体基因组的应用。(一)欧美公司垄断测序仪器与耗材市场1、二代测序是目前主流测序技术,Illumina占最大市场份额测序技术是测序仪器的核心所在,迄今为止已历经四代发展。其中主要的是前三代测序技术:第一代测序技术,即Sanger测序技术;第二代测序技术是当今主流技术,主要有Illumina公司的Solexa和HiSeq技术,LifeTech公司的Solid技术和Roche的454技术;第三代PacificBiosciences公司的SMRT测序技术。第四代测序技术正向着测序仪器体积更小的方向发展,如OxfordNanoporeTechnologies公司的MinIon纳米孔单分子测序技术。主要公司有IlluminaLifeTech(被ThermoScientific以136亿美元收购)和Roche。其中Illumina凭借其超高通量和相对较长读长的优势,占有超过70%的市场份额。2、三四代测序技术10年内凭借超长序列读长取代二代测序技术我们预计10年后二代测序技术会被三、四代测序技术所取代。各代测序均有不足之处,一代测序的主要缺陷是低通量和高成本,二代的缺陷是序列长度较短,三四代测序在准确率方面有严重缺陷。由于NGS技术面临的短序列缺陷可以通过生物信息学工具在一定程度上进行弥补,因此二代测序技术是现今最稳定,应用范围最广泛的测序技术。但目前科学家正在通过减缓DNA序列通过纳米孔速度的方式提高第三代测序的准确度,相关成果已发表在《Nature》子刊。我们预计10年内三、四代测序的准确度将会显著提升,届时将在保证测序通量的基础上,凭借着超长序列读长的优势取代二代测序。基因测序全产业链划分为上游的测序仪器与试剂耗材市场,中游的基因测序服务市场和下游的生物信息学分析市场。中下游市场面向群体包括医院、药厂、科研机构以及消费者等,可分为医疗和非医疗两个领域。(二)基因测序服务市场百家争鸣,积极向上下游延伸目前全球有上千家厂商提供测序服务,中国有超过200家。美国拥有全世界最多得测序仪,中国测序仪数量不超过500台。随着市场对测序的需求不断提升,中游市场提供测序服务的对象包括医院、疾控中心、科研机构等,提供包括用于无创产前诊断、肿瘤诊断与治疗、遗传学诊断以及辅助生殖等相关的基因测序服务。我国测序服务提供商积极地向产业链上游延伸。国内在测序仪器市场的开发策略分为两类:网址:(1)第一类是通过与国外仪器生产商合作,买断产品在国内的全部权利。如贝瑞和康与Illumina合作生产的新型测序仪、华大基因收购美国基因测序仪公司CompleteGenomics后基于该平台开发BGISEQ1000测序仪、达安基因与LifeTech合作的DA8600测序仪。这种模式虽然使用国外的仪器技术,但通过国内的仪器设备通道申报CFDA,申报和审批相对较快。(2)第二类是自主研发模式,如紫鑫药业与中科院基因组所合作的自主研发的二代测序仪器已于2014年4月18日发布,数据产出量与Roche454相当。中下游市场结合非常紧密,测序服务公司往往会提供有偿的生物信息学分析服务。美国大型的测序服务公司有:Sequenom,CardioDx和FoundationMedicine等,国内的主流测序服务公司有华大基因、诺禾致源、贝瑞和康、达安基因以及北陆药业等。不同公司根据提供服务的内容有所区分。二代测序技术凭借通量大、精度高、价格相对低廉等优势,已成为目前主流测序技术。由于专利保护力度大和技术门槛高,二代测序仪器制造市场壁垒较高,已被欧美公司垄断。(三)下游数据解读能力需进一步发展人体基因组共有23对染色体,包含超过30亿个碱基,而目前仅有3%能从临床给予解释。由测序服务公司提供的原始序列文件在经过系统地分析处理前,无法提供任何有效的信息。数据有效分析的三要素包括高性能计算平台、专业的分析软件和高质量的大样本数据库。计算平台用于对测序仪器得出的原始序列文件进行质量剔除、序列匹配等一系列分析的基础工作,分析