1CPU体系结构的技术现状分析谭艳娟沈昌梅冉娅华邓皓阳(重庆师范大学数学与计算机科学学院,重庆400047)摘要:中央处理单元(CentralProcessingUnit,简称CPU)从存储器或高速缓冲存储器中取出指令,放入指令寄存器,并对指令译码。其所有的计算、接受命令、存储命令、处理数据都由运算核心执行。运算核心作为中央处理单元(CentralProcessingUnit,简称CPU)的重要组成部分,在提高计算机运算速率方面起着举足轻重的作用。计算机上不断涌现的新兴使用模式让最终用户对处理器的处理能力提出了更高的要求,也即是说最终用户对处理单元执行指令的速率提出了更高的要求。但功耗等方面问题限制了单核处理单元不断提高性能的发展途径,因此,多核技术成为目前提升指令执行速率的最行之有效的方法。介于此,为了研究CPU体系结构中多核技术的发展现状,通过对比分析、举例说明,从整体上把握其主要内容及深远意义。中央处理单元(CentralProcessingUnit,简称CPU)作为计算机的核心部件,单芯片多处理器已经成为处理器体系结构发展的一个重要趋势。关键词:中央处理单元体系结构单核多核现状分析中央处理单元(CentralProcessingUnit,简称cpu),它是整个计算机系统的核心,是计算机的“心脏”。它负责整个系统指令的执行、数字与逻辑运算、数据的传送以及数据的输入输出控制等。它的发展决定了微机的发展。进入新世纪以来,CPU进入了更高速发展的时代,以往可望而不可及的1Ghz大关被轻松突破了,在市场分布方面,仍然是Intel跟AMD公司在两雄争霸,它们分别推出了Pentium4、Tualatin核心PentiumⅡ和Celeron、Tunderbird核心Athlon、AthlonXP和Duron等处理器,竞争日益激烈。在Intel方面,在上个世纪末的2000年11月,Intel发布了旗下第四代的Pentium处理器,也就是我们天天都能接触到的Pentium4。第一个Pentium4核心为Willamette,全新的Socket423插座,集成256KB的二级缓存,支持更为强大的SSE2指令集,多达20级的超标量流水线,搭配i850/i845系列芯片组,随后Intel陆续推出了1.4GHz-2.0GHz的WillametteP4处理器,而后期的P4处理器均转到了针角更多的Socket478插座。在AMD方面,在2000年中发布了第二个Athlon核心——Tunderbird。Tunderbird核心的Athlon不但在性能上要稍微领先于奔腾III,而且其最高的主频也一直比奔腾III高,1Ghz频率的里程碑就是由这款CPU首先达到的。不过随着Pentium4的发布,Tunderbird开始在频率上落后于对手,不过,后来AMD又推出了第三个Athlon核心——Palomino。随着网络时代的到来,网络通信、信息安全和信息家电产品将越来越普及,对cup的处理速度要求也越来越高,多处理器成为了cup发展的需要。在这种情况下,Intel和AMD都不约而同地将投向了多核心的发展,没过几年,cup由单核发展到双核、4核、8核、16核,不久将来还会发展到64核。1发展史在计算机体系结构中,CPU一直充当着计算机大脑的角色,总瞻其发展史,CPU经历了从单核到双核再到多核的历程。单核是指CPU内部只集成了一个运算核心。在单核时代,计算机一直把CPU频率作为其性能的发展标准。CPU频率就是CPU的时钟频率,简单说是CPU运算时的工作频率(1秒内发生的同步脉冲数)的简称,单位HZ。它决定计算机的运行速度,随着计算机的发展,主频由过去MHZ发展到了现在的GHZ(1G=1024M)。通常来讲,在同系列微处理器,主频越高就代表计算机的速度越快。但由于主频并不直接代表运算速度,所以在一定情况下,可能会出现主频较高的CPU实际运算速度较低的现象。因此主频仅仅是CPU性能表现的一个方面,而不代表CPU的整体性能。倍频与外频是与处理器主频密切相关的两个概念,外频是CPU的基准频率,单位也是MHz。外频是CPU与主板之间同步运行的速度,而且目前的绝大部分电脑系统中外频也是内存与主板之间的同步运行的速度,在这种方式下,可以理解为CPU的外频直接与内存相连通,实现两者间的同步运行状态;倍频即主频与外频之比的倍数。主频、外频、倍频,其关系式:主频=外频×倍频。早期的CPU并没有“倍频”这个概念,那时主频和系统总线的速度是一样的。随着技术的发展,CPU速度越来越快,内存、硬盘等配件逐渐跟不上CPU的速度了,而倍频的出现解决了这个问题,它可使内存等部件仍然工作在相对较低的系统总线频率下,而CPU的主频可以通过倍频来无限提升(理论上)。我们可以把外频看作是机器内的一条生产线,而倍频2则是生产线的条数,一台机器生产速度的快慢(主频)自然就是生产线的速度(外频)乘以生产线的条数(倍频)了。在计算机科学与技术迅猛发展的今天,作为CPU运算核心,单核逐渐淡出了人们的视野,双核及多核逐一登场亮相,走进人们的生活。为什么会出现这种情况呢?究其原因如下:目前的技术水平令单核性能的继续提升遇到了瓶颈,4GP4的夭折让依靠频率提升性能的路子走进死胡同,不得已改走多核心路线,以核心数量来弥补处理能力的不足。2.现状分析双核及多核是指CPU内部集成了两个或两个以上的运算核心。从双核技术本身来看,到底什么是双内核?在双核、四核处理器风头正劲的时候,我们不禁会问,为什么要从单核过渡到双核、四核,甚至是更多的核心?然而这样在CPU内集成多个核心,究竟能给我们带来什么?AMD的双内核具备两个物理上的运算内核,Amdoperon处理器从一开始设计时就考虑到了添加第二个内核,两个CPU内核使用相同的系统请求接口SRI、hyperTransport术和内存控制器,兼容90纳米单内核处理器所使用的940引脚接口。可以说,AMD的解决方案是真正的“双核”。AMD的技术架构为实现双核和多核奠定了坚实的基础。AMD直连架构(也就是通过超传输技术让CPU内核直接跟外部I/O相连,不通过前端总线)和集成内存控制器技术,使得每个内核都自己的高速缓存可资遣用,都有自己的专用车道直通I/O。AMD基于CMP设计的四核处理器支持HyperTransport(超传输总线)技术实现处理器与处理器、处理器与I/O以及处理器与协处理单元(FPGA)的连接。在处理器内部通过高速的XBAR实现核心之间,核心与内存和核心与HTX的高速数据交换在多核的不断发展下,英特尔也给出了一个答案-万亿级计算(结构)。它将实现80个内核,256GB/s的移动运算。跟传统的单核CPU相比,多核CPU带来了更强的并行处理能力、更高的计算密度和更低的时钟频率,并大大减少了散热和功耗。目前,在几大主要芯片厂商的产品线中,双核、四核甚至八核CPU已经占据了主要地位。为什么微处理器要从单核转向多核?计算机上不断涌现的新兴使用模式让最终用户对处理器的处理能力——即性能——提出了更高的要求,而多核技术是目前行之有效的方法。为什么不能用单核的设计达到用户对处理器性能不断提高的要求呢?答案是功耗问题限制了单核处理器不断提高性能的发展途径。作为计算机核心的处理器就是将输入的数字化的数据和信息,进行加工和处理,然后将结果输出。假定计算机的其他子系统不存在瓶颈的话,那么影响计算机性能高低的核心部件就是处理器。反映在指令上就是处理器执行指令的效率。提高处理器性能就是两个途径:提高主频和提高每个时钟周期内执行的指令数(IPC)。处理器微架构的变化可以改变IPC,效率更高的微架构可以提高IPC从而提高处理器的性能。但是,对于同一代的架构,改良架构来提高IPC的幅度是非常有限的,所以在单核处理器时代通过提高处理器的主频来提高性能就成了唯一的手段。不幸的是,给处理器提高主频不是没有止境的,从下面的推导中可以看出,处理器的功耗和处理器内部的电流、电压的平方和主频成正比,而主频和电压成正比。如果通过提高主频来提高处理器的性能,就会使处理器的功耗以指数(三次方)而非线性(一次方)的速度急剧上升,很快就会触及所谓的“频率的墙”(frequencywall)。过快的能耗上升,使得业界的多数厂商寻找另外一个提高处理器性能的因子,用于提高IPC。Smithfield是Intel公司的第一款双核心处理器的核心类型,于2005年4月发布,基本上可以认为Smithfield核心是简单的将两个Prescott核心松散地耦合在一起的产物,这是基于独立缓存的松散型耦合方案,其优点是技术简单,缺点是性能不够理想。目前PentiumD8XX系列以及PentiumEE8XX系列采用此核心。Smithfield核心采用90nm制造工艺,全部采用Socket775接口,核心电压1.3V左右,封装方式都采用PLGA,都支持硬件防病毒技术EDB和64位技术EM64T,并且除了PentiumD8X5和PentiumD820之外都支持节能省电技术EIST。前端总线频率是533MHz(PentiumD8X5)和800MHz(PentiumD8X0和PentiumEE8XX),主频范围从2.66GHz到3.2GHz(PentiumD)、3.2GHz(PentiumEE)。PentiumEE和PentiumD的最大区别就是PentiumEE支持超线程技术而PentiumD则不支持。Smithfield核心的两个核心分别具有1MB的二级缓存,在CPU内部两个核心是互相隔绝的,其缓存数据的同步是依靠位于主板北桥芯片上的仲裁单元通过前端总线在两个核心之间传输来实现的,所以其数据延迟问题比较严重,性能并不尽如人意。按照Intel的规划,Smithfield核心将会很快被Presler核心取代。Intel酷睿2四核Q8200处理器采用了45nm工艺制造,接口为LGA775,它的主频为2.33GHz,外频为333MHz,倍频为7。它的前端总线为1333MHz,L2缓存容量高达4MB,供电需符合05A标准。核心属于Yorkfield,目前市场上的大部分P35主板都可3支持。酷睿2四核Q8200与酷睿2双核系列没有较大差别,但由于其基于45nm生产工艺,而且拥有较高的主频和L2缓存,相信其会带来更大的性能提升。现今,虽然双核处理器的价格便宜了,但并不算是完全的普及。只有当多核处理器的性能优势能够真正的体现在主流软件平台上时,才算是一次彻底的变革。多核处理器的普及需要硬件厂商以及软件厂商共同的支持才能够实现,而以更低的价格获得更实用、更具附加值的产品则是消费者永恒不变的迫切需求3展望随着网络通信,网络游游戏的进步,多核处理器将会进一步的发展。在2010年或者更远,万亿次计算产品问世的时候,人们可以看到每个核是具有一定程度的超线程能力,比如说每个核能够处理四条线程。如果让每个核都具有多线程的能力,便能让缓存带宽应用发挥得更加充分。在一个处理器当中会有不同类型的核,在万亿次级计算的处理器当中,虽然所有的核在架构上都具有兼容性,但这绝不意味着所有核都是相同的,英特尔一定会对不同核做专门任务的分配。比如有一些核是做了媒体和图形功能增强的,有一些核是做网络和通信功能增强的,还有一些核是负责安全。但是它们会共享同一套指令组和共同的架构的基础,这样的一个设计对于编程工作来说,可以让编程变得尽可能简单和具有前后一致性。在近期的台北电脑展上,intel公布了32nm的处理器,而AMD则推出了一款真核心的12核处理器产品。所以我们从AMD方面可以看出,多核心的CPU依然是目前cpu技术发展的方向,据我自己估计,可能2010年四核心的cpu将全面普及。十二核心的处理器,谁能估计全开程序占用率是多少。在COMPUTEX2009上,AMD实际展示了业界首款原生十二核处理器代号为Magny-Cours(马尼库尔,F1法国赛道)的运行系统。据AMD透露,这款代号为Magny-Cours的皓龙处理器采用了CPU原生多内核模块化核心架构,因而开发难度降低了很多,也得益于此,A