硬件工程师培训教程（六）

m285518388
0 ℃
2018-06-30

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

精品资料网（）25万份精华管理资料，2万多集管理视频讲座精品资料网（）专业提供企管培训资料硬件工程师培训教程（六）第三节CPU的相关指标在深入了解了CPU的架构和生产过程后，接下来我们看看CPU的工作原理和相关指标。CPU的工作原理简单地说就像是一个工厂对产品的加工过程:进入工厂的原料(指令)，经过物资分配部门(控制单元)的调度分配，被送往生产线(逻辑运算单元)，生产出成品(处理后的数据)后，再存储在仓库(存储器)中，最后等着拿到市场上去卖(交由应用程序使用)。了解了这样一种工作原理，性能指标对CPU的影响自然也就显而易见了。一、主频、倍频和外频我们经常说“这款CPU的频率是多少多少”，其实这个泛指的频率是指CPU的主频，主频也就是CPU的时钟频率，英文全称叫做CPUClockSpeed，简单地说也就是CPU运算时的工作频率。一般说来，主频越高，一个时钟周期里完成的指令数也越多，当然CPU的速度也就越快了。由于各种CPU的内部结构不尽相同，所以并非时钟频率相同性能就一样。外频是系统总线的工作频率。倍频则是指CPU外频与主频相差的倍数。三者有十分密切的关系:主频=外频×倍频。二、内存总线速度内存总线速度的英文全称是Memory-BusSpeed。CPU处理的数据都是由主存储器提供的，而主存储器也就是我们平常所说的内存了。一般我们放在外存(磁盘或者各种存储介质)上面的资料都要通过内存，然后再进入CPU进行处理，所以与内存之间的通道，也就是内存总线的速度对整个系统的性能就显得尤为重要。由于内存和CPU之间的运行速度或多或少会有差异，因此便出现了二级缓存，来协调两者之间的差异。内存总线速度是指CPU二级(L2)高速缓存和内存之间的通信速度。三、扩展总线速度扩展总线速度的英文全称是Expansion-BusSpeed。扩展总线指的是微机系统的局部总线，如VESA或PCI总线。平时用户打开电脑机箱时，总可以看见一些插槽般的东西，这些东西又叫做扩展槽，上面可以插显卡、声卡之类的功能模块，而扩展总线就是CPU用以联系这些设备的桥梁。四、工作电压工作电压的英文全称是SupplyVoltage，即CPU正常工作所需的电压。早期CPU(286～486时代)的工作电压一般为5V，那是因为当时的制造工艺相对落后，以至于CPU的发热量太大，弄得寿命减短。随着CPU的制造工艺与主频的提高，近年来各种CPU的工作电压呈逐步下降的趋势，以解决发热过高的问题。五、地址总线宽度应当说地址总线宽度决定了CPU可以访问的物理地址空间，换句话说就是CPU到底能够使用多大容量的内存。16位的微机我们就不用说了，但是对于386以上的微机系统，地址线的宽度为32位，最多可以直接访问4096MB(4GB)的物理空间。六、数据总线宽度数据总线负责整个系统的数据流量的大小，而数据总线宽度则决定了CPU与二级高速缓存、内存以及输入/输出设备之间一次数据传输的信息量。七、数学协处理器486以前的CPU没有内置数学协处理器，由于数学协处理器的主要功能就是负责浮点运算，因此386、286和8088等CPU的浮点运算性能都相当落后，相信接触过386的朋友都知道主板上可以另外加一个外置数学协处理器，其目的就是为了增强浮点运算的能力。486以后的CPU一般都内置了数学协处理器，功能也不再局限于增强浮点运算，含有内置数学协处理器的CPU，可以加快特定类型的数值计算，某些需要进行复杂计算的软件系统，如高版本的AutoCAD就需要数学协处理器支持。八、超标量超标量是指在一个时钟周期内CPU可以执行一条以上的指令。这在486或者以前的CPU上是很难想精品资料网（）25万份精华管理资料，2万多集管理视频讲座精品资料网（）专业提供企管培训资料象的，只有Pentium级以上CPU才具有这种超标量结构。486以下的CPU属于低标量结构，即在这类CPU内执行一条指令至少需要一个或一个以上的时钟周期。九、L1高速缓存L1高速缓存也就是大家经常说到的一级高速缓存。CPU内置高速缓存可以提高运行效率，这也是486DX比386DX-40快的原因。内置的L1高速缓存的容量和结构对CPU的性能影响较大，容量越大，性能也相对会提高不少，这也正是一些公司力争加大L1高速缓存容量的原因。不过高速缓冲存储器均由静态RAM组成，结构较复杂，在CPU管芯面积不能太大的情况下，L1级高速缓存的容量不可能做得太大。十、采用回写(WriteBack)结构的高速缓存采用回写结构的高速缓存对读和写操作均有效，速度较快。而采用写通(Write-through)结构的高速缓存，仅对读操作有效。十一、动态处理动态处理是应用在高能奔腾处理器中的新技术，创造性地把3项专为提高处理器对数据的操作效率而设计的技术融合在一起。这3项技术是多路分支预测、数据流量分析和猜测执行。动态处理并不是简单执行一串指令，而是通过操作数据来提高处理器的工作效率。1.多路分支预测即通过几个分支对程序流向进行预测，采用多路分支预测算法后，处理器便可参与指令流向的跳转。它预测下一条指令在内存中位置的精确度可以达到惊人的90%以上。这是因为处理器在读取指令时，还会在程序中寻找未来要执行的指令。这个技术可加速向处理器传送任务。2.数据流量分析抛开原程序的顺序，分析并重排指令，优化执行顺序。处理器读取经过解码的软件指令，判断该指令能否处理或是否需与其他指令一道处理。然后，处理器再决定如何优化执行顺序以便高效地处理和执行指令。3.猜测执行通过提前判读并执行有可能需要的程序指令的方式提高执行速度。当处理器执行指令时(每次5条)，采用的是“猜测执行”的方法。这样可使PentiumⅡ处理器超级处理能力得到充分的发挥，从而提升软件性能。被处理的软件指令是建立在猜测分支基础之上，因此结果也就作为“预测结果”保留起来。一旦其最终状态能被确定，指令便可返回到其正常顺序并保持永久的机器状态。第四节CPU指令集为了提高计算机在多媒体、3D图形方面的处理和应用能力，与CPU处理器相对应的，各种处理器指令集应运而生，其中最著名的3种便是Intel公司的MMX、SSE和AMD的3DNow!指令集。一、MMX指令集MMX(MultiMediaeXtension，多媒体扩展指令集)指令集是Intel公司于1996年推出的一项多媒体指令增强技术。MMX指令集中包括有57条多媒体指令，通过这些指令可以一次处理多个数据，在处理结果超过实际处理能力的时候也能进行正常处理，这样在软件的配合下，就可以得到更高的性能。MMX的益处在于，当时存在的操作系统不必为此而做出任何修改便可以轻松地执行MMX程序。但是，问题也比较明显，那就是MMX指令集与x87浮点运算指令不能够同时执行，必须做密集式的交错切换才可以正常执行，这种情况就势必造成整个系统运行质量的下降。二、SSE指令集SSE(StreamingSIMDExtensions，单指令多数据流扩展)指令集是Intel在PentiumⅢ处理器中率先推出的。其实，早在PⅢ正式推出之前，Intel公司就曾经通过各种渠道公布过所谓的KNI(KatmaiNewInstruction)指令集，这个指令集也就是SSE指令集的最早名称，并一度被很多传媒称之为MMX指令集的下一个版本，即MMX2指令集。究其背景，原来“KNI”指令集是Intel公司最早为其下一代芯片命名的指令集名称，而所谓的“MMX2”则完全是硬件评论家们和媒体凭感觉和印象对“KNI”的评价，Intel公司从未正式发布精品资料网（）25万份精华管理资料，2万多集管理视频讲座精品资料网（）专业提供企管培训资料过关于MMX2的消息。而最终推出的SSE指令集也就是所谓胜出的“互联网SSE”指令集。SSE指令集包括了70条指令，其中包含提高3D图形运算效率的50条SIMD(单指令多数据技术)浮点运算指令、12条MMX整数运算增强指令、8条优化内存中连续数据块传输指令。理论上这些指令对目前流行的图像处理、浮点运算、3D运算、视频处理、音频处理等诸多多媒体应用起到全面强化的作用。SSE指令与3DNow!指令彼此互不兼容，但SSE包含了3DNow!技术的绝大部分功能，只是实现的方法不同。SSE兼容MMX指令，它可以通过SIMD和单时钟周期并行处理多个浮点数据来有效地提高浮点运算速度。三、3DNow!指令集由AMD公司提出的3DNow!指令集应该说出现在SSE指令集之前，并被AMD广泛应用于其K6-2、K6-3以及Athlon(K7)处理器上。3DNow!指令集技术其实就是21条机器码的扩展指令集。与Intel公司的MMX技术侧重于整数运算有所不同，3DNow!指令集主要针对三维建模、坐标变换和效果渲染等三维应用场合，在软件的配合下，可以大幅度提高3D处理性能。第五节当前CPU的技术特点一、制造工艺——更细的线宽近两年来主流CPU最显著的技术特征之一就是CPU制造工艺的进步。早期的CPU处理器采用的大多是0.5微米制造工艺。随着CPU频率的提高，0.35微米及曾经普遍使用的0.25微米工艺成为CPU市场的主流。从PⅢCoppermine(铜矿)处理器开始，采用0.18微米制造工艺的CPU开始出现。由于采用了更精细的工艺，使得原有晶体管门电路更大限度地缩小，因此在同样的面积内可以集成更多的晶体管。晶体管越做越小，能耗自然也就随之降低，CPU也可以更省电。另一方面，传统的芯片内部大多使用铝作为导体，由于芯片速度不断提高，面积不断缩小，铝线的性能极限已达临界，在这种情况下，铜导线技术初显端倪。铜导线技术与铝导线技术相比，优势在于导电性能更佳，发热量更小，可以有效提高CPU芯片的稳定性。在0.18微米制造工艺之后，采用0.13微米制造工艺的CPU也即将上市，更快的处理器频率必将推进铜导线技术全面取代铝导线技术。二、封装方式——Socket架构是主流SECC2封装、FC-PGA封装、BGA封装;SlotA、Socket370、Socket462……现在，如果您有一段时间不关注IT媒体或者隔两个月再去一趟配件市场，您必定会惊奇地发现，CPU又变了。以市场上最常见的Socket系列为例，主流的FC-PGA封装对应的自然是Socket370接口，这种插脚接口是一种方形的多针角零插拔力插座，插座上有一根拉杆，在安装和更换CPU时只要将拉杆向上拉出，就可以轻易地插进或取出CPU芯片了。在Socket370插座上可以安装最新的PⅢCoppermine处理器、Celeron系列处理器和VIA的CyrixⅢ处理器等。再来看看Slot系列的Slot1和SlotA。Slot1接口方式是由Intel公司最早提出来的一种狭长的242引脚插槽，可以支持采用SEC(单边接触)封装技术的早期PentiumⅡ、PentiumⅢ和Celeron处理器。除了接口方式不同外，Slot1所支持的特性与Super7系统没有太大的差别。SlotA接口标准则是由AMD提出的，支持AMD的K7处理器。虽然从外观上看SlotA与Slot1十分相像，但是由于它们的电气性能不同，两者并不兼容。进入2000年，随着Athlon将自己的L2Cache放入Die(芯片内核)，Socket接口的Athlon出现也成为可能，于是伴着AMDThunderbird(雷鸟)处理器的诞生，SocketA(也称Socket462)封装随之出现。SocketA接口的大小与Socket7和Socket370类似，但其接口在整体的布局中缺了一些针脚，这就是为了防止在将Socket370处理器插入插槽时发生意外的错误。但并不是所有的Thunderbird(雷鸟)处理器都是SocketA封装，为了支持其OEM的SlotA系统设计，市场上SlotA封装的Thunderbird和SocketA的雷鸟都可以见