曙光A440r-WY图形工作站产品设计中心07年8月•真正意义的工作站产品•新技术架构带来系统性能的提升•曙光工作站产品介绍内容什么是真正意义上的图形工作站•系统性能–处理器:双路、四路、HPC–内存:2G\4G\双通道、ECC–IO:SCSI/SAS/SATA/RAID/NAS/SAN–网络:千兆、infiniband•显示–更高的性能:OpenGL\DirectX–更好的效果:分辨率、大画幅–特殊应用:双头、多头、拼图•性能–OpenGL/DirectX•品质–源自厂家的专业服务•测试认证–众多专业图形处理软件的认证–专业的驱动程序–确保了良好的性能和兼容性•持久的生命线以及完整产品升级计划–确保用户的投资、以及未来的发展为什么选择专业的图形卡机械设计自动化(MechanicalDesignAutomation-MDA)用户群汽车行业(AshokLeyland,TVS…)机器工具行业(LMW,PSG,Textool…)第1-2-3级的供应商(ACCL,Visteon…)OEM供应商(Pricol,MRF,TVScompanies…)重工业(BHEL,BEL,Caterpillar…)白色家电制造商(Whirlpool,Butterfly,Philips…)关键词CAD/CAM/CAEMechanicalDesignAutomation(MDA)机械设计自动化SolidModeling实体建模FiniteElementAnalysis(FEA)CrashAnalysis碰撞分析SurfaceModeling(Styling)表面建模ProductLifecycleManagement(PLM)产品生命周期管理Pre-Processing前处理Post-Processing后处理GridComputing网格计算AssemblyVisualization可视化集成专业工作站所涉及的领域专业工作站所涉及的领域DigitalContentCreation(DCC)数字内容创意用户群动漫制作Animationhouses(Pentamedia,TEMediaWorks,Crest…)编辑Editinghouses(EditPoint,AccrisTech…)广播机构BroadcastCorporations(DD,SunTV,StarGroup…)出版机构PublishingHouses(VasanPublications,TimesofIndia…)广告代理AdvertisingAgencies(O&M,LINTAS,Contract,RediffDY&R…)关键词Animation动画/动漫Multimedia多媒体Composing合成UVMappingNonLinearEditing非线编MixingSkinningPublishingFinishing专业工作站所涉及的领域专业工作站所涉及的领域专业工作站所涉及的领域专业工作站所涉及的领域专业工作站所涉及的领域专业工作站所涉及的领域用户对工作站的期望提供满足下列使用者所要求的性能和稳定性:工程师制造业的设计人员(模型设计)视频编辑人员(电视台)大学培训中心(用于动漫设计,美术编辑等)高端办公用户(如用于电力系统的监控系统)用户要求:专业的工作站产品专业的服务和支持队伍(5年质保)良好的行业应用背景新技术架构带来系统性能的提升采用新一代AMD皓龙™处理器的曙光工作站产品将继续支持先进的商业计算平台……建立在统一架构基础上的AMD皓龙™处理器可以:降低总拥有成本一次性迁移到新插座架构。在相同散热范围内实现从双核到四核的无缝升级。先进的x86虚拟化技术AMD虚拟化™(AMD-V™)硬件辅助的支持。业内领先的直连架构。继续保持领先的性能功耗比高性能、低功耗的DDR2内存始终如一的95W设计功率及更低功率的选择架构对比传统的x86架构•已经存在20年的前端总线架构•CPU、内存和I/O共享同一个总线•主要的性能瓶颈•更快的CPU或者更多的核心≠性能采用直连架构的AMD64技术•符合行业标准的AMD64技术•具有革命意义的AMD直连架构消除了FSB的瓶颈•HyperTransport™互联技术可以提供更高的带宽和更低的延时I/OHubUSBPCIPCIc™BridgePCIc™BridgeSRQCrossbarHTMem.CtrlrSRQCrossbarHTMem.Ctrlr8GB/S8GB/S8GB/S8GB/SPCI-EBridgeI/OHubCPUCPUCoreCoreCoreCoreI/OHubPCI-EBridgePCI-EBridgePCIc™BridgeMemoryControllerHubINTEL前端总线驾构AMD直连架构I/OHubCPUCPU双核英特尔至强(‘Woodcrest’)•处理器130瓦(每个65瓦)•芯片组44.8瓦•内存83.2瓦每年362美元(1个服务器)每年180,806美元(500个服务器)7%MoreI/OHub83.2wattsMemoryControllerHubI/OHubUSBPCIPCI-EBridge双核AMD皓龙™处理器2000系列•处理器190瓦(每个95瓦)•芯片组16瓦•内存是35.2瓦每年338美元(1个服务器)每年169,033美元(500个服务器)SRQCrossbarHTMem.CtrlrSRQCrossbarHTMem.Ctrlr8GB/S8GB/S8GB/S8GB/SNativeDual-CoreNativeDual-Core190watts(95wperCPU)17.6watts17.6watts258watts241wattsCORECORECORECORE12.4W32.4W130W(65WperCPU)10W6WTDP(热设计功耗)功耗对比AMD皓龙™处理器每瓦特性能的领先新一代AMD皓龙™处理器的每瓦特性能得益于DDR2内存和和AMDPowerNow!™技术性能的改善右图中AMD双核同INTEL双核的TDP对比显示,AMD皓龙™处理器的每瓦特性能绝对领先于INTEL。192273170167103239257328281230050100150200250300350IntelXeon5160based-system(2x3.0GHz,8x1GB)PrincipledTechnologyResultsAMDOpteron™285based-system(2x285,8x1GB)PrincipledTechnologyResultsIntelXeon5160based-system(2x3.0GHz,8x1GB)IntelXeon5150based-system(2x2.66GHz,8x1GB)AMDOpteron™2218based-system(2x2.6GHz,8x1GB)WATTS192273170167103239257328281230050100150200250300350IntelXeon5160based-system(2x3.0GHz,8x1GB)PrincipledTechnologyResultsAMDOpteron™285based-system(2x285,8x1GB)PrincipledTechnologyResultsIntelXeon5160based-system(2x3.0GHz,8x1GB)IntelXeon5150based-system(2x2.66GHz,8x1GB)AMDOpteron™2218based-system(2x2.6GHz,8x1GB)WATTS80WTDP65WTDP95WTDPAMD测量结果新一代AMD皓龙™处理器附加的总拥有成本效益每个DIMM每年的瓦数和耗电费用*DDR2:~4.4W/DIMM$5.01/年备援地址奇偶校验DDR1:~6.3W/DIMM$7.17/年FBDIMM:~10.4W/DIMM$11.84/年内存的RAS特性将得到提升•增加容错度的备援特性可以减少系统停机时间。•地址奇偶校验保护特性增强了系统可靠性。降低平台成本•由于DDR2内存的耗电量少于其他技术生产的内存,因此减少了运营成本。-DDR2内存耗电量比DDR1内存减少30%*。-DDR2内存耗电量比FBDIMM内存减少58%*。•由于A620r-F的主板上共有16条DDR2的DIMM插槽,有充分的内存扩展性,可以选择廉价的小容量内存来控制成本,例如:配置是8GB,选配8条1GB内存的价格要低于选配4条2GB内存。*根据DDR1,DDR2和FBDIMM内存的平均功率测定;每年的耗电费用按照国际能源署2003、2004年报告的全球平均能源费用$0.13/千瓦时计算。新一代AMD皓龙™处理器的AMD虚拟化™技术基于硬件的AMD虚拟化™技术将全面提升x86虚拟化水平。AMD虚拟化效益:•新增的指令减少了虚拟化软件的复杂性。•选择性地拦截去往客户机的信息减少了系统开销。•允许客户机操作系统不加修改地运行,以简化执行和支持。•新增的隔离特性提高了虚拟机的安全性。•架构功能增强。提高了管理程序和客户机操作系统之间的切换效率。管理程序主机操作系统虚拟机客户机操作系统应用虚拟机客户机操作系统应用虚拟化指令AMD虚拟技术&INTEL虚拟技术MemoryControllerHubCPUCPUCPUCPUVMVMVMVMVMVMVMVMVMVMVMVMCPUVMVMVMCPUVMVMVMCPUVMVMVMCPUVMVMVMMemoryControllerMemoryControllerMemoryControllerMemoryController共享内存产生瓶颈专有内存性能增加•直连架构可以提高虚拟机的请求性能•TaggedTLB意味着虚拟机间数据交换的效率会很高•基于硬件的内存管理和安全(集成内存控制器)能够全面改善虚拟性能和效率•共享前端总线会导致虚拟机的请求性能降低•UntaggedTLB意味着虚拟机间数据交换的效率很低•基于软件的内存管理和安全(经外部内存控制器)会降低虚拟的性能和效率190W35W130W160W190W38W38W38W83W83W35W260W83W四核Quad-CoreXeon‘Dempsey’Xeon‘Wood-Crest’’Xeon‘Clover-Town’’DDR2双核无缝的四核处理器迁移途径功耗保持不变这里的瓦数是包含8个DIMM的双路系统的最大CPU功耗。Dempsey’,‘Woodcrest’和‘Clovertown’的瓦数基于当前发布的值(见=2)评估,并可能发生更改。这里的例子仅用来传递信息,实际的功耗可能受到其他因素的影响。WattsFrom:MemoryCPUNorthbridge•AMD已在未来四核处理器产品的竞标中获胜--橡树岭国家实验室为Cray超级计算机选用了四核AMD皓龙™处理器•四核AMD皓龙处理器采用真正的四核设计--英特尔在Clovertown的MCM中包含两块Xeon5100处理器•AMD提供全面的四核处理器性能--英特尔将Clovertown前端总线的带宽调低20%(1066对比Xeon5100的1333)•AMD的功耗和散热尺度不变--而英特尔的功耗和散热水平估计将上升约23%到50%详细了解AMD四核服务器和工作站架构可扩展的共享L3高速缓存IPC增强的CPU核心•32B指令获取•增强的分支预测•乱序负载执行•每周期可完成高达4条双精度浮点指令•双重128位SSE数据流•每个周期双重128位负荷•位处理扩展(LZCNT/POPCNT)•SSE扩展(EXTRQ/INSERTQ,MOVNTSD/MOVNTSS)增强的直连架构和北桥•HT链接(高达8GB/秒)•增强型