2015年.第30卷.第1期战略与决策研究Strategy&PolicyDecisionResearch*修改稿收到日期:2014年12月29日【摘要】文章分析了国内外超级计算机研发的现状,介绍了曙光系列高性能计算机的产业化历程,总结了我国超算产业发展的成功经验,提出了进一步发展超算技术和产业的策略建议,并对我国超算产业的未来进行了展望。【关键词】超级计算,高性能计算机,超算产业DOI10.16418/j.issn.1000-3045.2015.01.003文/历军曙光信息产业股份有限公司北京100049中国超算产业的发展现状与展望*超级计算的发展水平是国家综合国力的重要体现,是国家创新体系的重要组成部分,已成为世界各国特别是发达国家竞相争夺的战略制高点。发展超级计算不但可以带动计算技术本身向更高水平发展,更重要的是可以解决在经济建设、社会发展、科技创新、产业升级、国家安全等方面的一系列挑战性问题。《国家中长期科学和技术发展规划纲要(2006—2020年)》将超级计算(也称高性能计算)列为国家重点发展的技术方向和重点培育的信息产业群,并指出需加强具有自主知识产权的应用软件的研发,确保与超级计算机系统协调、平衡发展。1国际超级计算领域的发展情况超级计算机指当前时代运算速度最快的大容量大型计算机,是计算机领域的“珠穆朗玛峰”,世界上多数国家均积极部署了超级计算机发展规划。2014年11月世界超级计算机500强(TOP500)排行榜,我国国防科技大学研制的“天河二号”超级计算机再次位居榜首,获得世界超算“四连冠”。前5名分别为中国“天河二号”(运算速度为每秒33.86千万亿次)、美国能源部下属橡树岭国家实验室的“泰坦”(每秒17.59千万亿次)、美国劳伦斯-利弗莫尔国家实验室的“红杉”(每秒17.17千万亿次)、日本理化研究所的“京”(每秒10.51千万亿次)、美国阿贡国家实验室的“米拉”(每秒8.59千万亿次)。前10名中,中国、日本、瑞士和德国各占一席,美国占据其余6席。美国能源部还公布了“珊瑚(CORAL)”计划,将投资3.25亿美元建造两台超级计算机,其运算速度将达到“天河二号”的3—5倍。2我国超级计算领域的发展情况近年来,在国家“863”等多个科技计划的持续支持下,我国在超级计算领域取得了长足发展:从16院刊技术上看,以“曙光星云”、“天河”等为代表的超级计算机的性能在TOP500排行榜中处于世界领先位置;从市场上看,曙光系列高性能计算机已经连续6年在中国TOP100排行榜中超越IBM,占据最大市场份额,国产平台的市场份额在2013年首次超越了国外平台,2014年国产平台市场份额更是超过85%。(1)目前整机研制达到世界领先水平。“十一五”期间,在国家“863”计划“高效能计算机及网格服务环境”重大项目的支持下,我国先后研制成功若干台百万亿次和千万亿次超级计算机系统。2008年,联想公司和曙光公司分别研制成功“深腾7000”和“曙光5000”百万亿次计算机;2009年,国防科技大学研制成功“天河一号”千万亿次计算机,使我国成为继美国之后世界上第二个研制成功千万亿次计算机的国家;2010年6月,曙光公司研制成功“星云”千万亿次计算机,性能列世界TOP500第二位;2010年11月,升级后的“天河-1A”系统创造了超级计算机全球排名第一的最好成绩。基于自主CPU芯片研制超级计算机也取得了重大突破,“神威蓝光”于2010年底成为第一个全部采用国产CPU的千万亿次超级计算机。进入“十二五”以来,我国超级计算机研制持续发展,“天河二号”连续4次位居TOP500第一名。预计到“十二五”末,我国还将推出2套峰值性能超过10亿亿次(100PFLOPS)的超级计算机系统,有望继续在TOP500排行榜中名列前茅。(2)自主核心技术有所突破。我国在超级计算机系统相关的基础性支撑技术方面也有了很大进步。在处理器方面,国内自主研制的“龙芯”、“申威”、“飞腾”等系列的多核处理器已有重要突破,相关的生态环境正在逐步完善,新的更高性能的多核和众核处理器研究工作也在“核高基”项目的支持下顺利推进。在互联技术方面,国防科大在“天河”系统中研制了定制的高性能互联网络,自主设计的精简通信协议和网络接口芯片及交换芯片、系统带宽和延迟均达到国际先进水平。在结点设计方面,曙光TC4600刀片实现了业界最高密度的计算结点。在异构协同与并行优化方面,中科院北京基因组所、中科院生物物理所、中国石油天然气集团东方地球物理勘探有限责任公司(BGP)等研究机构合作开展CPU/GPU混合结构的应用研究,在生命科学领域的基因比对和电子断层三维重构、石油勘探领域的叠前时间偏移等应用方面取得突破。在系统软件及环境方面,以曙光系列高性能计算机为代表,我国在大规模异构系统的管理和监控、大规模系统的快速部署以及高效系统虚拟化等关键技术上也取得了很大进展。(3)应用开发持续推进。国家“863”计划等相关重大项目先后支持了化学、天文、气象、生物医药、流体、激光聚变、大飞机、石油勘探和地震成像等领域的超级计算应用,形成了若干可利用数千以上的处理器核进行并行计算模拟的应用实例。预计到“十二五”末,可利用到万核乃至十万核进行并行计算的应用数量会进一步增加。3曙光高性能计算机的产业化我国高性能计算机的产业化以曙光为代表。现将曙光高性能计算机的发展历程简要地回顾如下:1991—2001年,是曙光高性能计算机的起步和探索阶段,开展了技术探索和产业化探索。在国家的指导和支持下,先后成功研制了“曙光一号”全对称共享存储多处理机系统、“曙光1000”大规模并行计算机系统、“曙光2000-I”大规模并行计算机系统、“曙中国超算产业的发展现状与展望172015年.第30卷.第1期战略与决策研究Strategy&PolicyDecisionResearch光2000-II”大规模并行计算机系统、曙光3000超级计算机。在一系列技术突破的同时,开始探索高性能计算机产业化的道路。2001—2005年,“曙光4000”系列高性能计算机的技术研发和产业化工作取得重要进展。“曙光4000A”于2001年启动预研,2003年完成系统设计,2004年6月研制成功。在2004年6月第23届全球高性能计算机TOP500排行榜中,“曙光4000A”位列第十,成为当时国内速度最快的商用高性能计算机系统,中国超级计算机首次进入TOP500排行榜前十名。2006—2010年,“曙光5000”和“曙光6000”高性能计算机的技术研发和产业化工作取得重要进展。“曙光5000A”于2006年9月启动研制,2008年研制成功。在2008年11月发布的第32届全球高性能计算机TOP500排行榜上,“曙光5000A”位列第十,成为当时除美国以外世界上运算速度最快的高性能计算机。“曙光6000”于2009年1月启动研制,2010年12月研制成功,它是一款拥有自主知识产权的超千万亿次超级计算机,是中国首台实测性能超千万亿次的超级计算机,其每秒系统峰值达3000万亿次(3PFlops),每秒实测Linpack值达1271万亿次,在世界TOP500榜中排名第二,超越欧洲和日本的同类产品。同时以每瓦能耗实测性能4.98亿次的成绩在当年的全球高性能计算机能效比排行榜(Green500)中排名第四,成为中国最绿色的超级计算机。“曙光6000”具有“四高两低”的特点:高性能、高效能、高可靠、高密度、低功耗、低成本。2011至今,曙光高性能计算机的技术研发和产业化工作不断深化。以曙光高性能计算机为依托,成立了国家高性能计算工程中心、国家智能计算机研发中心、国家级企业技术中心等,致力于高性能领域的研发和产业化。由曙光发起,国内30多家单位参与,成立了中国高性能计算标准委员会,占据了高性能计算领域的制高点。曙光系列高性能计算机多次获得国家科技进步奖一等奖、二等奖和国家十大科技进展等重要成果,已服务于航天、航空、能源、电力、气象、生物、金融、国防等众多领域。曙光高性能计算机,担负了“神舟五号”、“神舟六号”、“神舟七号”载人飞船从发射到回收的全过程的目标轨道计算、空间碎片定轨计算、控制飞船入轨、发射气象气候监测、飞船发射窗口分析等任务。2013年12月15日,“嫦娥三号”在月面成功软着陆,曙光高性能计算机对其轨道设计、实时计算以及快速、毫秒必争的预报起到重要保障作用。2008年8月8日,“曙光5000A”助力创意厂商水晶石公司,圆满完成北京奥运会开幕式实时的“卷轴”渲染及大量数字媒体效果。2004年,刚刚研发成功的“曙光4000”用于SARS的药物研制;在曙光高性能计算机上,华大基因在全球率先完成了水稻基因测序工作,并被美国Science封面报道。4我国发展超级计算的成功经验我国超级计算技术取得重大突破,首先要归功于国家政策的有力支持。近年来,党中央、国务院对科技工作的重视程度达到前所未有的高度,地方政府和社会各界支持科技创新的热情空前高涨,走中国特色自主创新道路已经成为全社会的共识。超级计算作为一项战略技术,可以充分发挥社会主义国家集中力量办大事的体制优势。同时,超级计算对相关信息技术的辐射力,也有助于我们探索市场经济条件下新的举国体制。超级计算作为国家实力的重要体现,是一个国家最尖端的信息技术综合体,涉及到从处理器芯片、结点设计、互联通信、整机制造、系统软件、编程环境、并行算法到应用软件的全过程,集成了信息技术和相关领域的核心技术。由于超级计算具有探索性、引领性、超前性以及投资大等特征,单纯依靠市场化机制难于保证其可持续发展。超级计算只有在国家的支持下才能获得长期的可持续发展,这已成为世界强国政府的普遍共识。美、日、欧等发达国家的政府普遍将发展超级计算作为国家战略,给予高度重视并进行持续投入。我国国家科技计划对超级计算关键技术研发和整机18院刊中国超算产业的发展现状与展望系统研制的长期持续投入,是我国超级计算水平急剧提高的重要保障之一。我国科技人员发挥自主创新的精神,不盲目跟踪国外技术,而是立足中国的战略需求,敢为天下先,这是我国超级计算技术取得跨越式发展的重要原因之一。当前,我国正在推进国家创新体系建设,积极探索,大胆尝试,坚持脚踏实地与志存高远相结合,既着眼当前、解决经济发展中的瓶颈制约;又放眼未来、超前部署抢占未来制高点的重点领域,是我国超级计算技术进一步发展的关键。超大规模的超级计算系统研制难度大、需要突破大量关键技术,但市场容量相对较小。若开发过程中取得的相关技术不能为衍生产品所利用,则巨大的投入难以获得回报,长此以往,不能持续发展。因此,需要把高精尖的大系统技术下移到中、小规模系统,从而形成高性价比、具备强市场竞争力的批量产品。国家科研项目如何与企业产品开发相协调、相统一,是决定我国超级计算技术走向何处的重要因素之一。曙光公司的经验是:在关键核心技术向产品转化过程中,以市场为导向,以企业为主体,产学研用相结合。既要面向国家需求,也要面向市场需求。从宏观上看,国家需求也是一种市场需求。坚持科学发展,既要面向国际大环境,也要面向我国国情,要坚持与国情相适应。我国在建设和谐社会,积极应对资源短缺、城市化进程等过程中出现了许多新情况和新挑战,信息技术在应对这类挑战方面,有其独特的优势。曙光公司基于超级计算技术,积极从事城市云计算技术的应用和服务工作,在信息安全、公共安全、城市管理等方面,探索了一条新的道路。这也充分证明,坚持遵循市场规律办事,面向产业和用户的需求,可以充分发挥科技对经济社会发展的支撑作用。5存在的问题和相关启示进入21世纪后的一系列成绩,意味着中国超级计算机的整机硬件研制水平已经从国际先进行列步入世界领先水平。但这些辉煌成就的取得,并不意味着我国的超级计算技术总体上已经领先欧美,跃居世界第一。事实上,我国在超级计算机的核心技术、超级计算的应用水平等方面与美国、日本等发达国家相比仍有较大差距。(1)核心关键技术积累不足。研制仍然主要依靠国外处理器和关键器件,在核心关键技术例如高性能处理器、高速互连、存储器件、并行系统软件、大规模并行算法等