APU异构架构介绍

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

KAVERI基于异构计算架构全新APU2|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIALAGENDAWhatisKaveriandHSAHowKaveribenefitsapplicationsKaveriperformanceanddemosSummaries3|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIAL“KAVERI”计算能力和特点一览全新APU-全新新计算性能设计856GFLOPS的浮点计算能力,相当于目前中端显卡和CPU的计算能力12处理核(4CPU核+8GPU核)第一款支持HSA标准支持下一代4K分辨率超高清显示ULTRAHDPCIEXPRESSGEN3第三代支持独特AMDTRUEAUDIO真环绕立体声2.4BTransistors@28nm4|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIALKAVERIAPU内CPU核心介绍重新设计的CPU核心FetchDecodeDecodeIntegerSchedulerIntegerSchedulerSharedL2CacheFPSchedulerPipelinePipelinePipelinePipelinePipelinePipelinePipelinePipelineMMXUnit128-bitFMAC128-bitFMACL1DCacheL1DCache“Steamroller”DualCoreUnit6%13.00%10%18%18%8%CinebenchR15CinebenchR11.5Lame3.99.5POVRay3.7Blender2.697-Zip全新架构每时钟周期指令数比上一代提升18%更加适合多任务运行5|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIALGCN架构相比上一代VLIW架构,为图形和计算重新设计核心架构成为AMD未来GPU基础平台矢量/标量计算指令效率提高,流处理效率提高,缓存加大撤消了来自超长字节指令的限定,不再需要打包和解包的过程。硬件支持的指令调度和发射,而不在依赖于编译器优化。更易编程和调优,计算效率更高。每个CU内部包含4组SIMDCORE(单指令流多数据流),每组SIMDCORE由16个标准ALU构成。强大的计算能力。由Branch(分支)和Scheduler(调度)构成的二级线程控制机制ScalarUnit,Scalar单元中包含单独的标量ALU单元,可以用来处理整数指令以及特殊函数。另外,对线程效率至关重要的原子操作(Atomic)也在该单元中执行KAVERI内核独显架构GCN(GRAPHICCORENEXT,次世代显卡核心)6|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIALKAVERI内核独显架构GPUEVOLUTION同样GCN架构用在AMD最新的独立显卡上作为核心设计平台,下图展示基于GCN架构的显卡的performance和上一代架构的性能比较单位指令效率倍数提高UTILIZATIONANDEFFICIENCY0x1x2x3x4x5xMandelbrotDPAES256SHA256LuxMarkSmallptGPUAMDRadeonHD6970AMDRadeonHD7970UtilizationimprovementGFLOPSincrease(1.4x)图像渲染能力显著提高,适合3D绘图和游戏应用适合利用到数据并行计算的应用,尤其是基于大数据量和密集型技术的软件场合,比如excel中的复杂函数和加密算法等7|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIALGCN架构–为游戏和图形而生PCwithAMDIntelorNvidiaPCGameContentGameEnginesGameConsolesIntelDriverNvidiaDriverIntelEPGNvidiaGPUAMDGPU/APUMantleLow-levelprogramminginterfacethatexposesAMDGPUhardwaretodevelopersAMDGPU/APUAMDGPU/APU全新GCN架构和基于HAS架构的技术部分应用在XBOXONE和PS4的定制化芯片中,使得市场上基于游戏的终端统一到AMD的处理器技术上,其背后原因是1)基于HSA和GCN的架构对于游戏尤其是3D游戏的性能起到质的提高2)AMD基于HSA游戏API接口(mantle)直接利用AMD的GCN架构内核,同时可以兼容流行的DX11和OpenGL游戏技术例如,Mantle的基本绘图指令比先前的提高了9倍的效率来降低CPU的负载全新渲染器使得3D渲染软件直接受益2014年,AMD全力统一从游戏终端到PC游戏硬件!8|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIALKAVERI–世界第一款基于HSA异构标准的APU,同时是GCN架构hUMACPUGPUCPUGPUhQ•GPU和CPU统一内存物理地址,根本上消除显卡内存限制。GPU可以访问全部系统内存。•HSA任务队列使得CPU和GPU平等交互,GPU成为协处理器而不仅仅是加速器。•GPU和CPU可以同等的创造和调度工作负载•HSA将GPU的GCN和CPU的Streamroller核心统一在一可处理器中-Kaveri•GPU参与数据并行计算–图形,图像,密集计算访问性能提高•HSA架构协调–数据无需拷贝,同时需要GPU并行计算和CPU处理的应用效率提高,如很多中间件需要的极大数据处理能力的人脸识别,编解码,声音处理,物理模拟得以实现9|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIALAGENDAWhatisKaveriHowKaveribenefitsapplicationsKaveriperformanceanddemosSummaries10|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIAL11|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIAL异构计算是满足人类对处理器功耗不断降低但需求无尽增长的硬件革命•系统体积更小•功耗更低•更便宜的价格•更方便使用95W65W35W10w15WDOSXPWin8MultiOSAPP/Browser90年代现在•系统处理能力更高•更大的屏幕•更快的速度•更高的分辨率•更复杂易用的特性•趋向人体自然交互的操作•待机时间更长未来PC功耗应用需求没啥应用简单上网,看片,office12|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIAL如何提高处理器性能,降低功耗?增加核数和异核,多核互联技术提高提高CPU指令效率提高工艺技术变CPU并行处理为GPU并行处理器提高内存,Cache效率去除向前兼容指令集(X86)提高数据在系统内部交换效率HSA将系统中的GPU作为协处理器来专门应对复杂,大数据并行计算要求,加入专门视频,音频,DSP,安全加密等专有处理器提高CPU效率,去除不适合CPU效率做的工作,是任务数据处理在CPU和GPU件能够无缝切换,统一在一个内存中13|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIALHSA和GCN架构对应用开发和用户体验支持改变13HSA将GPU的计算能力解放出来HAS对于CPU和GPU的交互效率大幅度提升HAS使得原来在CPU不能做的复杂计算GPU可以轻松获得HAS为未来基于超高清的多媒体应用提供硬件技术平台而且功耗不会大幅提高从720p,1080p到轻松支持4K,和未来更超高清的图像,视频和内容对图像的模糊,降噪,美容,识别,轮廓计算等在HSA上性能大幅度提高,至少2-4倍基于CPU的加密算法如SHA,DES在CPU上很慢,在HAS架构下会提高几十倍,减少CPU负载原先从H.264到H.265/HEVC编解码勉强实现,CPU负载超高,在HSA下,CPU几乎无需增加HSA和GCN架构对于游戏和图形渲染天然加速,HSA开发套件专门为该类软件提供套件和性能API原来基于复杂识别如人脸识别的很多软件(OpenCV,全球使用最广的计算机视觉开源软件,大部分公司都在使用这个软件用在他们的产品中),利用HAS和AMDGPU的加速(开源项目已经支持)可以将原来基于CPU的算法直接用于GPU,提高运行速度,比如傅立叶变化,小波变换,对应的应用为人脸识别,人脸检测,模糊边界确定等等HSA还可以在科学和游戏上受益,比如物理运动轨迹的模拟器支持开源中间件软件为BulletHSA对于深度神经网络(DNN)的收敛具有天然的效率,现在各大互联网公司都在投入重金研究,研究。深度神经网络是语言识别,图像识别,计算机视觉,多媒体搜索,社交网络聚合应用的核心算法和基础14|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIALHSA对于软件厂家,在编程语言上原来只能利用专有GPU编程语言OPENCL扩展为可以支持JAVA/PYTHON的编程(甚至无需代码改动!),JAVA的程序员数以千万计,这样,HAS的硬件会使得软件和应用开发程序员轻松开发基于HAS和GPU的应用KernelFusionDriver(KFD)HSACoreRuntimeHSAFinalizerHSAHelperLibrariesOpenCLAppOpenCLRuntimeJavaSumatraAppJavaJVMRuntimePythonFabricAppFabricEngineRTHSAIL,MSAILorGSAIL15|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIALHSA不是AMD专属,是一个开放的标准,由异构基金会运作15FoundersPromotersSupportersContributorsAcademic16|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIALKAVERI基于HSA的关键FEATURE总结GameAPI:MantleTureAudiotechnologyMediaSDKTrustZoneSecurityhUMA/HSAStackenabledapplication高端应用可利用CPU和GPU统一内存互联获得性能游戏和图形渲染利用GCN核心API开发游戏应用,大幅度提升性能性能跨平台超保真音响控制器利用GPU处理。可获得更多参数和声效优化多媒体编解码,后处理控制器和开发SDK应用于视频基于ARM的Trustzone的安全运行环境提供安全机制17|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIALAGENDAWhatisKaveriHowKaveribenefitsapplicationsKaveriperformanceanddemosSummaries18|PRESENTATIONTITLE|JANUARY11,2020|CONFIDENTIALINITIALTESTRESULTS–A10BEATSI5-4670KONPCMARK8V2.0PCMARK8,V2.0SCORESAMDA10beatsi5-4670K•A10-6800K:upto15%onHome,3%onCreative,and6%onWork•A10-7850K:upto24%onHome,22%onCreative,14%onWorkSeebackupforconfigurationdataAMDtestsareperformedonoptimizedAMDreferencesystems.PC

1 / 35
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功