精品资料网()25万份精华管理资料,2万多集管理视频讲座精品资料网()专业提供企管培训资料硬件工程师培训教程(七)第六节新款CPU介绍一、Intel公司的新款CPU1.PⅢCoppermine(铜矿)处理器2000年最惹人注目的莫过于Intel公司采用0.18微米工艺生产的PⅢCoppermine处理器了。尽管Intel公司早在1999年10月25日便发布了这款代号为Coppermine的PentiumⅢ处理器,但其真正的普及是在2000年。虽然取名为“铜矿”,Coppermine处理器并没有采用新的铜芯片技术制造。从外形上分析,采用0.18μm工艺制造的Coppermine芯片的内核尺寸进一步缩小,虽然内部集成了256KB的全速On-DieL2Cache,内建2810万个晶体管,但其尺寸却只有106mm2。从类型上分析,新一代的Coppermine处理器可以分为E和EB两个系列。E系列的Coppermine处理器采用了0.18μm工艺制造,同时应用了Intel公司新一代On-Die全速256KBL2Cache;而EB系列的Coppermine不仅集合了0.18μm制造工艺、On-Die全速256KBL2Cache,同时还具有133MHz的外频速率。从技术的角度分析,新一代Coppermine处理器具有两大特点:一是封装形式的变化。除了部分产品采用SECC2封装之外,Intel也推出了FC-PGA封装及笔记本使用的MicroPGA和BGA封装;二是制造工艺的变化。Coppermine处理器全部采用了0.18μm制造工艺,其核心工作电压降到了1.65V(SECC2)和1.6V(FC-PGA),与传统的PⅢ相比大大降低了电能的消耗和发热量。PⅢCoppermine的整体性能与传统的PⅢ相比有了较大幅度的提高。作为新一代处理器,Coppermine强劲的高速On-DieL2Cache值得称道,而且PⅢCoppermine的可超频性也是非常出色的。2.PⅢCoppermine-T和Tualatin2001年末,PⅢCoppermine会进一步改进制造工艺采用0.13微米制造,新版本Tualatin也即将问世。其核心技术大致如下:最初时钟频率应该是1.13/1.26GHz;内核集成512KB二级缓存;采用新的总线结构;封装结构上采用FCPGA2替换FCPGA。我们注意到Tualatin在电压和总线规格上和过去的PⅢ处理器有了不同,因此未来似乎应该有全新的平台来支持PⅢ处理器。当前只有一款芯片组宣布支持Tualatin,它就是Almador或者被称之为i830。而PⅢCoppermine-T内核则可能是过渡产品,它既能运行于当前的i815、694X等产品,相信也能在Almador平台上使用。从时间表上看这两款处理器都在2001年三季度发布。但由于IntelPentium4战略的延展,也许它们会悄无声息地来临,甚至缩减至一款。3.CeleronⅡ处理器为了进一步扩大在低端市场的占领份额,2000年3月Intel终于发布了其代号为“Coppermine128”的新一代的Celeron处理器——CeleronⅡ(Intel仍称其为Celeron,但为了和前面的Celeron区分,我们暂且这样称呼)。CeleronⅡ与老Celeron最显著的区别在于采用了与PⅢCoppermine相同的核心及同样的FC-PGA封装方式,同时支持SSE多媒体扩展指令集。从技术角度分析,CeleronⅡ与PⅢCoppermine有着诸多明显的区别:一是CeleronⅡ的L2Cache容量只是PⅢCoppermine处理器的一半,并且缩减PⅢCoppermine的8路缓存通道为4路,延迟时间也由PⅢCoppermine的0变成了2。由此不难看出,相同主频的CeleronⅡ在性能方面比PⅢCoppermine要差很多;二是功耗方面。CeleronⅡ的核心电压只有1.5V(最新款有1.7V),而PⅢCoppermine的核心电压为1.65V,功耗相对较低;三是外频方面。CeleronⅡ出人意料地沿用了古老的66MHz外频,面对低端市场早已使用100MHz外频的AMDK6-2,Intel此举除了商业行为的理由外恐怕无法解释。而66MHz外频的CeleronⅡ与100MHz外频的PⅢCoppermine相比,也就注定了其要在性能方面牺牲更多。Celeron系列向来有着如奔腾系列一样优秀的浮点运算性能,CeleronⅡ集成的全速精品资料网()25万份精华管理资料,2万多集管理视频讲座精品资料网()专业提供企管培训资料缓存使得其整数性能也得以大幅度提高。但是,糟糕的66MHz外频可能会是CeleronⅡ最终不敌AMD同型产品的致命之处,不过如果将其与老Celeron放在一起,其实还是我们要求太高了。与Coppermine同样的FC-PGA封装方式必定会使CeleronⅡ的兼容性有所提高。正是由于高性能的二级缓存和低功耗,CeleronⅡ同样也具有良好的超频性能。4.Pentium4处理器美国东部时间2000年6月28日,Intel公司正式宣布将该公司开发的下一代微处理器命名为Pentium4。新一代的Pentium4处理器即原先研发代号为Willamette的Willy芯片,是Intel公司继Coppermine处理器之后推出的面向普通用户的主流产品。2000年11月20日,Intel公司正式发布Pentium4处理器。该处理器采用了不同于P6总线的全新NetBurst架构,其管线长度是P6架构的两倍,达到了20级。这将使Pentium4达到更高时钟频率。现在的PentiumⅢ处理器由于管线长度的限制,最高时钟频率在1.2GHz左右,PentiumⅢ1.13GHz处理器出现的问题就是最好的证明。不过,管线长度的加长,也意味着entium4每一个时钟周期执行的指令要比PentiumⅢ少,这就是为什么在相同的速度下,PentiumⅢ或Athlon处理器的性能看起来要比Pentium4处理器更强一些的原因。不过,随着Pentium4速度的提升,这一现象会逐渐消失。Pentium4处理器采用新的系统总线代替了原有的GTL+总线,总线速度达到400MHz。最初版本的核心频率为1.4GHz和1.5GHz,内部集成了8KB一级数据缓存和256KB同速二级缓存(Intel称之为L2超级传输缓存),带宽大于44.8GB/s,大大超过PentiumⅢ1GHz处理器的16GB/s。初期的Pentium4采用0.18μm工艺制造,包含4200万个晶体管,芯片面积为217mm2,核心电压为1.7V,目前采用Socket423接口,此外Intel还推出了一款Socket478接口的Pentium4,这才是最终版本。Pentium4的算术逻辑单元(ALU)以核心频率的两倍运行。此外,Pentium4还包含144条重新设计过的SSE2指令。Intel预计Pentium4将于2001年下半年占其CPU总产量的一半,并采用0.13μm铜工艺制造。Pentium4的架构被Intel称之为NetBurst。其中最容易被关注到的变化就是它的新系统总线。虽然真实时钟频率只有100MHz,位宽还是64位,但由于利用了与APG4x相同的工作原理,它的速度实际相当于400MHz是传统P6总线的四倍,可传输高达3.2GB/s。明显超过AMDThunderbird处理器266MHz(133MHz×2)2.1GB/s的数据传输率。Pentium4的二级缓存与PentiumⅢ的二级缓存大小相同,都是256KB并皆为8路联合方式运作。但Pentium4的二级缓存每线为128字节,并分成2个等量的64字节。当它从系统(无论是内存、AGP显卡或是PCI等)取出数据时,都是以64字节为单位,这样一来确保批量传输的最大性能。一级缓存方面,Pentium4仅有8KB的一级数据缓存,没有指令缓存,这样便于降低一级的延迟,采用4路联合方式,并使用64字节的缓存管道。双端口结构使得能在一个时钟内,一个读取而另一个写回的方式来同时运作。过去在PentiumⅢ或Athlon处理器中,都有一级指令缓存。代码会先被放入此块缓存中,直到要真正被处理单元执行时才会取出。糟糕的是某些x86指令非常复杂,因此解码过程可能会阻塞整个执行管道,同时这些指令中的部分重复频率很高,常常刚解码一次后又需要再次解码。基本上讲,Pentium4的执行追踪缓存就是在解码器底下的的一级指令缓存,如果缓存里存放有已经解码过的复杂指令,下一次它进入流水线时就不需要再解码,而只直接提取微指令即可。另外Pentium4新加有硬件预取的机制。这块新的处理单元可辨认Pentium4核心执行软件的数据存取样本,并依此猜测下次会被处理的数据,然后将这些数据预先载入缓存中。在应用大量的有规则数据情况下比如矩阵,Pentium4的硬件预取功能将大幅加速执行效能。还有Pentium4最有名的特性之一就是该处理器具有非常长的流水线工位。PentiumⅢ的流水线工位有10个,Athlon为11个,而Pentium4不少于20个。如此多的工位数量保证了每个工位执行精品资料网()25万份精华管理资料,2万多集管理视频讲座精品资料网()专业提供企管培训资料的任务足够简单,很显然Pentuim4已经做好了足够的准备向更高的GHz频率进军,这显然是PentiumⅢ和Athlon所不具备的,也是他们注定无法在更高频率上和Pentium4抗衡的致命伤。Pentium4的流水线能保留多达126个将要被执行指令,其中最多可包含48个载入及24个存储运算。而追踪缓存分支预测单元,就是用来确保清空整个管道内容的情况不会经常发生的。Intel声称用了这个单元后,可减少PentiumⅢ33%的预测失败。但一旦发生预测失败,所带来的损失也相当惊人。其余的新特性包括两组双速ALU及AGU。因为他们可以每半时钟内处理一个微指令,因此四个中的每一个时钟皆为处理器时钟的两倍。快速执行引擎无法处理的指令,将被送到唯一的SlowALU处处理。不过好在程序指令绝大部分都是一些简单的指令。加入流式单指令多数据扩展技术的第二版棗SSE2。这一次新开发的SIMD指令了包括浮点SIMD指令、整形SIMD指令、SIMD浮点和整形数据之间转换以及数据在XMM寄存器和MMX寄存器中转换等几大部分。其中重要的改进包括引入新的数据格式,比如128位SIMD整数运算和64位双精度浮点运算等等。为了更好的利用Cache,P4还另外增加了几条操作缓存的指令,允许程序员控制已经缓存过的数据。由于SSE2更多是在架构内部的加强和优化,其最大好处是并不需要因此而开发全新的操作系统,只要稍微打个补丁之类,就能享受到SSE2带来的好处。Intel公司于2001年8月底发布的1.9和2.0GHz的Pentium4仍然采用0.18微米的Willamette内核。我们曾经很希望看到此次发表的Socket478接口Pentium4采用代号为Northwood的新核心。不过,Intel可能在0.13微米制程上碰到了一些麻烦。5.Itanium处理器大多数熟悉计算机的爱好者一定都听过Merced这个名字,现在Intel已经正式把它命名为Itanium。这将是Intel第一款执行IA-64指令的微处理器。它采用了EPIC(ExplicitlyParallelIn-structionCode,显性并行指令计算)技术,可实现每时钟周期高达20次运算。Itanium有128个整数和多媒体寄存器,128个82位浮点寄存器,64个论断寄存器,8个分支寄存器。这么多的寄存器允许Intel整合动态寄存器堆栈引擎,这将大大提高处理能力。第一代IA-64的处理器通过它们的浮点单