ARM_Cortex各系列处理器分类比较

amuro0000
1 ℃
2020-01-11

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

1ByHarleyCortex-M系列M0：Cortex-M0是目前最小的ARM处理器，该处理器的芯片面积非常小，能耗极低，且编程所需的代码占用量很少，这就使得开发人员可以直接跳过16位系统，以接近8位系统的成本开销获取32位系统的性能。Cortex-M0处理器超低的门数开销，使得它可以用在仿真和数模混合设备中。M0+：以Cortex-M0处理器为基础，保留了全部指令集和数据兼容性，同时进一步降低了能耗，提高了性能。2级流水线，性能效率可达1.08DMIPS/MHz。M1：第一个专为FPGA中的实现设计的ARM处理器。Cortex-M1处理器面向所有主要FPGA设备并包括对领先的FPGA综合工具的支持，允许设计者为每个项目选择最佳实现。M3：适用于具有较高确定性的实时应用，它经过专门开发，可使合作伙伴针对广泛的设备（包括微控制器、汽车车身系统、工业控制系统以及无线网络和传感器）开发高性能低成本平台。此处理器具有出色的计算性能以及对事件的优异系统响应能力，同时可应实际中对低动态和静态功率需求的挑战。M4：由ARM专门开发的最新嵌入式处理器，用以满足需要有效且易于使用的控制和信号处理功能混合的数字信号控制市场。M7：在ARMCortex-M处理器系列中，Cortex-M7的性能最为出色。它拥有六级超标量流水线、灵活的系统和内存接口（包括AXI和AHB）、缓存（Cache）以及高度耦合内存（TCM），为MCU提供出色的整数、浮点和DSP性能。互联：64位AMBA4AXI,AHB外设端口(64MB到512MB)指令缓存：0到64kB，双路组相联，带有可选ECC数据缓存：0到64kB，四路组相联，带有可选ECC指令TCM：0到16MB，带有可选ECC数据TCM：0到16MB，带有可选ECC2ByHarleyCortex-M系列规格对比类别M0M3M4M7体系结构ARMv6M（冯诺依曼）ARMv6M（哈佛）ARMv6M（哈佛）ARMv7-M（哈佛）ISA支持Thumb,Thumb-2Thumb,Thumb-2Thumb,Thumb-2Thumb,Thumb-2DSP扩展单周期16/32位MAC单周期双16位MAC8/16位SIMD运算硬件除法（2-12周期）单周期16/32位MAC单周期双16位MAC8/16位SIMD运算硬件除法（2-12周期）浮点单元单精度浮点单元符合IEEE754单和双精度浮点单元与IEEE754兼容流水线3级3级3级+分支预测6级超标量+分支预测DMISP/MHz0.9~0.991.25~1.501.25~1.522.14/2.55/3.23中断NMI+1-32物理中断NMI+1-240物理中断NMI+1~240物理中断NMI+1~240物理中断中断优先级8~2568~2568~256唤醒中断控制器最多240个最多240个最多240个内存保护带有子区域和后台区域的可选8区域MPU带有子区域和后台区域的可选8区域MPU可选的8/16区域MPU，带有子区域和背景区域睡眠模式集成的WFI和WFE指令和“退出时睡眠”功能。睡眠和深度睡眠信号随ARM电源管理工具包提供的可选的Retention模式集成的WFI和WFE指令和“退出时睡眠”功能。睡眠和深度睡眠信号。随ARM电源管理工具包提供的可选保留模式集成WFI和WFE指令和“退出时睡眠”功能。睡眠和深度睡眠信号。随ARM电源管理工具包提供的可选Retention模式集成WFI和WFE指令以及SleepOnExit功能。休眠和深度休眠信号。ARM电源管理工具包及可选Retention模式增强的指令硬件单周期(32x32)乘法选项硬件除法（2-12个周期）和单周期(32x32)乘法、饱和数学支持。调试可选JTAG和Serial-Wire调试端口。最多4个断点和2个观察点可选JTAG和串行线调试端口。最多8个断点和4个检测点。可选JTAG和Serial-Wire调试端口。最多8个断点和4个检测点。可选的JTAG和串行线调试端口。最多8个断点和4个观察点。跟踪可选指令跟踪(ETM)、数据跟踪(DWT)和测量跟踪(ITM)可选指令跟踪(ETM)、数据跟踪(DWT)和测量跟踪(ITM)可选指令跟踪(ETM)、数据跟踪(DWT)和测量跟踪(ITM)3ByHarleyCortex-A系列：ARMCortex-A系列是一系列用于复杂操作系统和用户应用程序的应用程序处理器。Cortex-A系列处理器支持ARM、Thumb和Thumb-2指令集。A5：一个高性能、低功耗的ARM宏单元，带有L1高速缓存子系统，能提供完全的虚拟内存功能。Cortex-A5处理器实现了ARMv7体系结构并运行32位ARM指令、16位和32位Thumb指令，还可在Jazelle状态下运行8位Java字节码。CortexA-5是最小以及最低功耗的Cortex-A处理器，但处理性能比其他A系列差。A7：Cortex-A7处理器的功耗和面积与超高效Cortex-A5相似，但性能提升15~20%，Cortex-A7是ARM的大小核设计中的小核部分，并且与高端Cortex-A15CPU体系结构完全兼容。Cortex-A7处理器包括了高性能处理器Cortex-A15的一切特性，包括虚拟化（virtualization）、大容量物理内存地址扩展（LargePhysicalAddressExtensions(LPAE)，可以寻址到1TB的存储空间）、NEON、VFP以及AMBA4ACEcoherency（AMBA4CacheCoherentInterconnect(CCI)）。Cortex-A7支持多核MPCore的设计以及Big+Little的大小核设计。小型高能效的Cortex-A7是最新低成本智能手机和平板电脑中独立CPU的理想之选，并可在big.LITTLE处理配置中与Cortex-A15结合。A8：第一个使用ARMv7-A架构的处理器，很多应用处理器以Cortex-A8为核心。Cortex-A8处理器是一个双指令执行的有序超标量处理器，针对高度优化的能效实现可提供2.0DhrystoneMIPS（每MHz），这些实现可提供基于传统单核处理器的设备所需的高级别的性能。Cortex-A8在市场中构建了ARMv7体系结构，可用于不同应用，包括智能手机、智能本、便携式媒体播放器以及其他消费类和企业平台。分开的L1指令和数据cache大小可以为16KB或者32KB，指令和数据共享L2cache，容量可以到1MB。L1和L2cache的cache数据宽度为128比特，L1cache是虚拟索引，物理上连续，而L2完全使用物理地址。Cortex-A8的L1cache行宽度为64byte，L2cache在片内集成。另外和Cortex-A9相比，由于Cortex-A8支持的浮点VFP运算非常有限，其VFP的速度非常慢，往往相同的浮点运算，其速度是Cortex-A9的1/10。Cortex-A8能并发某些NEON指令（如NEON的load/store和其他的NEON指令），而Cortex-A9因为NEON位宽限制不能并发。Cortex-A8的NEON和ARM是分开的，即ARM核和NEON核的执行流水线分开，NEON访问ARM寄存器很快，但是ARM端需要NEON寄存器的数据会非常慢。A9：Cortex-A9MPCore或者单核处理器单MHz性能比Cortex-A5或者Cortex-A8高，支持ARM,Thumb,Thumb-2,TrustZone,JazelleRCT，JazelleDBX技术。L1的cache控制器提供了硬件的cache一致性维护支持多核的cache一致性。核外的L2cache控制器(L2C-310,orPL310)支持最多8MB的cache。Cortex-A9的L1cache行宽度为32byte，L2cache因为多核的原因在核外集成，即通过SCU来访问多核共享的L2cache。常见的Cortex-A9处理器包括nVidia's双核Tegra-2,以及TI'sOMAP4平台。使用Cortex-A9处4ByHarley理器的设备包括Apple的ipad2（appleA5处理器），LGOptimus2X（nVidiaTegra-2），SamsungGalaxySII等A15：Cortex-A15MPCore处理器是目前Cortex-A系列中性能最高的处理器，一个突出的特性是其硬件的虚拟化技术(Hardwarevirtualization)以及大物理内存的扩展(LargePhysicalAddressExtension(LPAE),能寻址到1TB的内存)。目前集成Cortex-A15的处理器量产的只有Samsung的Exynos5系列处理器，但TI的OMAP5系列处理器也采用Cortex-A15的核。具体的设备有ArndaleBoard。A17:A12的提升版，也就将A12合并到A17中，最新的高性能ARMv7-A核处理器，以更小和更节能的优势，提供与A15相仿的性能。相比A9有60%的性能提升。仍为32位ARMv7Cortex-A17处理器提供了优质的性能和高端的特性使它理想的适合每一个屏幕,从智能手机到智能电视。Cortex-A17处理器架构上与广泛使用Cortex-A7处理器一致，促使下一代中档设备基于big.LITTLE技术。A53：最低功耗的ARMv8处理器，能够无缝支持32和64位代码。是世界上能效最高，面积最小的64位处理器。使用高效的8-stage顺序管道和提升的获取数据技术性能平衡。Cortex-A53提供比Cortex-A7更高的性能，并能作为一个独立的应用处理器或在big.LITTLE配置下，搭配Cortex-A57处理器，达到最优性能、可伸缩性和能效。A57：最高效的64位处理器，用于扩展移动和企业计算应用程序功能，包括计算密集型64位应用，比如高端电脑、平板电脑和服务器产品。性能比A15提升一倍。A72：Cortex-A72是ARM性能最出色、最先进的处理器。于2015年年初正式发布的Cortex-A72是基于ARMv8-A架构、并构建于Cortex-A57处理器在移动和企业设备领域成功的基础之上。在相同的移动设备电池寿命限制下，Cortex-A72能相较基于Cortex-A15处理器，28纳米工艺节点的设备，提供3.5倍的性能表现，展现优异的整体功耗效率。Cortex-A72的强化性能和功耗水平重新定义了2016年高端设备为消费者带来的丰富连接和情境感知（context-aware）的体验。Cortex-A72可在芯片上单独实现，也可以搭配Cortex-A53处理器与ARMCoreLinkTMCCI高速缓存一致性互连（CacheCoherentInterconnect）构成ARMbig.LITTLETM配置，进一步提升能效。5ByHarleyCortex-A列规格对比类别Cortex-A5Cortex-A7Cortex-A8Cortex-A9Cortex-A15发布时间2009年12月2011年10月2006年7月2008年3月2011年4月时钟频率~1GHz~1GHzon28nm~1GHzon65nm~2GHzon40nm~2.5GHzon28nm执行顺序顺序执行顺序执行顺序执行乱序执行乱序执行多核支持1to41to411to41to4MIPS/MHz1.61.922.53.5VFP/NEON支持VFPv4/NEONVFPv4/NEONVFPv3/NEONVFPv3/NEONVFPv4/NEON半精度扩展(16-bitfloating-point)是是否,只有32-bit单精度和64-bit双精度浮点是是FP/NEON寄存器重命名否否否否是GP寄存器重命名否否否是是硬件的除法器否是否否是LPAE(40-bitphysicaladdress)否否否否是硬件虚拟化否是否否是big.LITTLENoLITTLENoNoBig融合的MAC乘累加是是否否是流水线级数pipelinestages88