Platform系列软件产品与方案介绍公司介绍(AboutCompany)1992年成立,总部加拿大多伦多,全球20多个运营部门16年专注于分布式资源管理和高性能计算分布式资源管理和高性能计算的先驱与领导者下一代互联网网格计算的先驱与领导者公司全球拥有600+员工,其中中国拥有250+员工公司全球拥有2200+客户,其中中国拥有100+客户1996年成立Platform北京公司,负责亚太区市场、销售、咨询与支持1998年北京公司升级为全球技术支持中心2005年成立西安研发中心,参与全线产品研发与测试产品介绍(AboutProducts)1992发布LSFBatch,实现作业调度1995发布LSFHPC,支持HPC1996发布LSFMulti-Cluster,实现多集群计算1997发布LSFReports,提供报表分析2000发布PlatformAnalytics,提供计费与IT分析2001发布PlatformSymphony(ProcessManager),提供自动流程与实时任务调度2002发布PlatformGlobuskits,提供互联网网格支持2004发布PlatformOCS,PlatformLSF6.0,提供Linux环境HPC堆栈2005发布PlatformSymphony2.2,PlatformLSFLicenseScheduler,提供许可证调度2006发布PlatformEGO与VMO,实现企业网格平台与虚拟资源管理2007发布PlatformLSF7.0,收购ScaliManager,实现完整HPC基础架构解决方案PlatformComputing公司简介Platformcomputing是世界上最大的独立网格软件开发商,致力于为用户提供简单、易用、灵活、自管理、自调度、可靠、易扩展的、低成本的虚拟高性能计算解决方案。它针对航天、航空、汽车、兵器、造船、电子、物理、化学、生命科学、三维动画、核工业、石油天然气以及气象、地震等高性能计算应用领域,将一个或多个高性能计算机群,以及工作站、服务器和大型主机等有机地组合成一体,统一管理、统一调度,形成一“虚拟超级计算机“,从而为用户提供可以想象的超级计算能力。在为世界所公认的网格计算技术中,Platform拥有最广泛的实现由“桌面机变为超级计算机”的网格软件解决方案。Platformcomputing提供的LSF(LoadSharingFacility)解决方案,是目前市场上领先的作业调度系统解决方案。自1992年推出以来,得到了市场极大反响,显著地提高了高性能计算机群的处理能力,加速了科研、生产进度,提高了设计、仿真、测试、验证速度,缩短了产品面向市场的时间。如AMD公司加州设计管理部门经理ChrisMotta认为“产品面市时间是至关重要的,K6设计时间缩短3~6个月主要是由于好的设计方法和LSF“。十六年来,Platformcomputing坚持用户至上。在用户使用的过程中,根据用户的实际情况和需求,不断发展完善产品的功能、性能。比如LSF的网络级、机器级、作业级三级容错体系,作业执行环境的自适应技术,并行作业管理的防止“逃逸”进程技术,内存预约和管理技术,机器故障的自动隔离技术,作业异常的自管理技术等等都是在用户使用的过程中提炼并发展完善的。在过去的的十多年中,世界上最大的最有创新意识的的公司,包括计算机制造业,金融,政府,生命科学和工业制造业都已确信只有PlatformComputing才能将技术与人力相容,并与其共同设计,构建,运行和管理网格。目前许多知名公司包括Samsung、TexasInstruments、Toshiba、STMicro、InfineonTechnologies、RenesasTechnology、NEC、PhillipsSemiconductor、FreescaleSemiconductor、Hynix、MicronTechnology、Sony、Matsushita、Qualcomm、AMD、Sharp、IBM、Broadcom、Apaptec、ARM、ATI、Cadence、Synopsys、Cisco、HP、Motorola以及通用汽车、福特汽车、戴姆勒克莱斯勒、丰田汽车、大众汽车、本田汽车、日产汽车、标致、联合技术、洛克西德-马丁、雷神、欧洲航空防务与航天(空中客车的母公司)、TRW、英宇航系统、通用动力等均选择LSF解决方案构建其高性能计算平台,并且每年都自动将新购买的高性能计算平台计算机加入到LSF机群中。PlatformLSF已经成为这些知名企业作业调度系统和网格计算软件事实上的标准。Platform中国公司(即Platform软件(北京)有限公司)于1996年在北京中关村高科技园区注册,成为国家规划布局内最早的重点软件企业之一,并连年获“双软”证书。曾被中国计算机报评为“2003年度中国信息技术创新最具潜力企业”。Platform中国公司进入中国10年以来,已在电子、政府、教育、科研、石油和工业制造等行业取得很大成功,并在北京建立了PlatformComputing亚太区研发中心和技术支持中心。Platform在中国的客户主要有上海超级计算中心、中科院网络中心、国家气象卫星中心、南开大学“南开之星”、清华大学、国防科技大学、中国科技大学、西北工业大学、北京航空航天大学、华中师范大学、中央电视台动画中心、航天科技集团和科工集团、航空工业一集团和二集团、核工业集团、兵器集团、中国石油、中国石化、Phillips、Motorola、Fujitsu、STMicro、MicronTechnology、InfineonTechnologies等。在中国国家级高科技项目863计划中,Platform中国公司还与中国有关工业集团合作承担了工业制造网格项目。Platform公司的使命是帮助分析师,工程师和科学家们充分开发、利用高性能计算(HPC)的能力。Platform的目标是,成为用户可依赖的合作伙伴,为其提供富有创造力的,可靠的,高效益的高性能计算系统的软件解决方案。Platform拥有业界最完整的高性能计算解决方案PlatformLSFSuitePlatformLSFAPIPlatformEGOAPIPlatformLSFPlatformLSFMultiClusterProcessManagerPlatformEGOEnginFrameLSFLicenseSchedulerPlatformRTMPlatformLSFAnalyticsPlatform(Scali)ManagePlatformReportsDevelopRunManage市场介绍(AboutMarket)全球2200多家客户遍布20多个行业与领域全球500强公司66%全球最大20家汽车企业90%,全球最大9家中有8家全球最大30家制造企业93%全球最大30家电子企业83%全球最大20家化学与制药企业65%TOP500集群超级计算机前22名45%全球最大10家航空航天领域企业中有8家PLATFORMLSF产品特性PlatformLSF十多年来,全球80%世界前500强企业都共同选用了LSF系列的产品,与业界领先企业Dell,HP,IBM,SGI,SAS等建立了紧密的合作伙伴关系,在各行业都有进行专门研究的小组和专家,在LSF产生后的这十几年里,技术不断提高,在保证产品稳定性的同时,技术上进行了不断的创新。在PLATFORMLSF7.x中,提高了产品的性能和管理的透明性,对软件许可证的使用率也大大提高,资源配置更加合理,使共同合作更加便利,最大可能加强服务器管理的简便性。在提供更好服务的同时,仍然提供您所希望的高安全性能。Platform的LSF是安全,高效的网格解决方案,经过数年来发展完善,现在已经是一个完全符合企业在网格应用解决方案的需求。而且现在还开放了部分源代码,从而给企业更广泛的应用带来了可能。PlatformComputing作为全球分布式资源管理和网格计算的领先企业,致力于分布式资源管理系统的全面解决方案,包括工作负载管理,资源管理及性能管理等。功能强大,满足用户的各式各样的需求。从产品的设计,开发到升级,PlatformLSF的功能得到了不断的强化。通过同用户的应用紧密结合,产品功能几乎能够覆盖到所有用户的应用场景,并且能够真正方便于用户的使用,从而提高效率。强大的作业调度,管理和高可靠性功能强大的执行控制资源限制:资源限制防止资源被过度使用,以优化系统资源保障高优先级作业的完成。作业挂起、恢复:保障高优先级作业被及时调度,而不用担心删除已经运行的低优先级作业。作业断点保存、迁移:保障长时间运行的作业可以从断点处开始执行。进程组跟踪:完整的进程控制保证在作业结束时所有进程被中止,避免孤儿进程,减少系统管理员的负荷。JobI/O处理:监视应用进程的能力,提供在作业异常退出时的问题分析和故障隔离。并行作业的跟踪和控制:并行作业各个任务的跟踪和控制,从而为并行作业的记帐和作业控制提供可能。丰富的调度策略资源排序和优先控制:允许高优先级作业在速度更快的机器上运行,以保障高优先级项目优先处理。时间窗口:时间窗口允许动态分配系统资源,从而可以简化计算资源的管理,提高资源的利用率。基于目标的调度:通过定义作业的deadline,吞吐量和响应时间需求,简化系统管理,为保障服务公约提供更好支持。基于网络拓扑的调度:基于网络拓扑的调度通过优化资源分配,减少网络延迟,提高并行作业的吞吐量。高级处理器预约:通过处理器预约,保障高优先级项目的特殊资源需求。CPU选择:灵活的CPU资源定义以优化并行作业的资源分配。支持第三方调度。优秀的可管理性基于队列的资源管理:系统可以设置多个队列,在每个队列上都可以设置相应的资源,从而更好的支持用户的应用。作业异常处理及主机异常处理:通过预先定义的作业、主机异常处理减少管理成本。作业等待原因支持:了解作业等待原因,从而可以进行相应的处理便于技术人员更好地管理自己的作业。运行时资源使用收集支持:监视实际的资源消耗并探测“失控”作业,从而可以提供的更好的作业管理。工作负载分析支持:工作负荷的可视化分析便于项目的计划决策,使项目经理可以更好地协调项目,评估项目完成时间,并管理项目资源使用。IT资源使用分析支持:系统地收集并分析IT资源使用及性能情况,为IT规划提供科学依据。切合用户需求的HPC支持动态资源发现、预约和分配:并行作业被优化地分配到较快且性能相近的CPU或服务器上,以提高系统吞吐量,减少额外的并行作业管理成本。完整的作业控制:确保每个并行作业的每个任务都可以被完全控制,从而有效地减少并行作业管理的无序状态,确保整个机群系统快速有效工作。支持多种并行环境LamMPl,Mplpro,SCALIMPI,MPICH,MPICH-GM,MPI-QS,MVAPICH,INTELMPI有效的并行作业支持并行调度:丰富的并行调度算法:基于拓扑的调度,高级预约调度,处理器预约及backfill调度,最小/最大CPU,span限制。调度器提供根据相关计算结点性能动态地分配并行作业的能力。提交作业时间不随作业数的增加而增加。记帐对并行作业提供了全部或部分的并行作业记帐功能。可以通过PlatformLSFReports或PlatformLSFAnalytics对记帐数据进行分析以优化系统使用,并提供运行报告。PlatformLSF对串并行作业提供详细而精确的记帐,同时提供详细的错误信息以调查作业退出原因。还提供了等待调度原因的数据分析。许可证调度提供商业软件许可证管理以确保其根据优先级被正确的使用。执行提供了完整的并行作业启动和控制,包括运行时的资源使用收集以及单个进程的跟踪。可以捕获并行作业各个任务的标准输入充分满足高性能计算需求支持多种并行环境,支持PVM,MPI,支持MPICH,LAM等多种MPI。支持多种网络,Myrinet、QuadricsQsNet、SGINumaFlex、SGlNumaLin