高级计算机体系结构作业学号:2220120336姓名:刘永继11.ExplaintheConceptsComputerArchitecture系统结构由程序设计者所看到的一个计算机系统的属性。即计算机系统的软硬件界面。AdvancedCA高级系统结构新型计算机系统结构。基于串行计算机结构,研究多指令多数据计算机系统,具有并发、可扩展和可编程性。为非冯式系统结构。AmdahllawAmdahl定律系统中某部件由于采用某种方式时系统性能改进后,整个系统性能的提高与该方式的使用频率或占的执行时间的比例有关。SCALARPROCESSING标量处理机在同一时间内只处理一条数据。LOOK-AHEAD先行技术通过缓冲技术和预处理技术,解决存储器冲突,使运算器能够专心与数据的运算,从而大幅提高程序的执行速度。PVP向量型并行计算处理机以流水线结构为主的并行处理器。SMP对称多处理机系统任意处理器可直接访问任意内存地址,使用共享存储器,访问延迟、带宽、机率都是等价的。MPP大规模并行计算机系统物理和逻辑上均是分布内存,能扩展至成百上千处理器,采用专门设计和定制的高通信带宽和低延迟的互联网络。DSM分布式共享存储系统内存模块物理上局部于各个处理器内部,但逻辑上是共享存储的。COW机群系统每个节点都是一个完整的计算机,各个节点通过高性能网络相互连接,网络接口和I/O总线松耦合连接,每个节点有完整的操作系统。GCE网格计算环境利用互联网上的计算机的处理器闲置处理能力来解决大型计算问题的一种科学计算。CISC复杂指令集计算机高级计算机体系结构作业学号:2220120336姓名:刘永继2通过设置一些复杂的指令,把一些原来由软件实现的常用功能改用硬件实现的指令系统实现,以此来提高计算机的执行速度。RISC精简指令集计算机尽量简化计算机指令功能,只保留那些功能简单,能在一个节拍内执行完的指令,而把复杂指令用段子程序来实现。VMM虚拟机监视器作为软硬件的中间层,在应用和操作系统所见的执行环境之间。SUPERCOMPUTER超级计算机数百数千甚至更多的处理器组成的能计算普通计算机不能完成的大型复杂问题的计算机。SVM共享虚拟存储器存储器虚拟化为一个共享的存储器,并提供单一的地址空间。MAINFRAME大型计算机作为大型商业服务器,一般用于大型事务处理系统,特别是过去完成的且不值得重新编写的数据库应用系统方面。COMPUTERSYSTEMONCHIP片上计算机系统在单个芯片上集成的一个完整系统。PARALLELARCHITECTUREINTOSINGLECHIP单片并行结构在单个芯片上采用的并行体系结构MOORElawMoore定律当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。UMA一致存储访问采用集中式存储的模式,提供均匀的存储访问。NUMA非一致存储访问内存模块局部在各个结点内部,所有局部内存模块构成并行机的全局内存模块。COMA全高速缓存存储访问采用分布式存储模式,通过高速缓存提供快速存储访问。CC-NUMA全高速缓存非一致性均匀访问存在专用硬件设备保证在任意时刻,各结点Cache中数据与全局内存数据的一致性。NORMA非远程存储访问高级计算机体系结构作业学号:2220120336姓名:刘永继3利用私有的存储器通过互联网络进行消息传递。SHELLARCHITECTUREShell结构用专门定制的Shell电路将商用微处理器和节点的其它部分(包括板级Cache、局存、NIC和DISK)连接起来。PRAM随机存取并行机器模型共享存储的SIMD模型,假定存在一个容量无限大的共享存储器,有有限或无限个功能相同的处理器,且他们都具有简单的算术运算和逻辑判断功能,在任何时刻处理器都可以通过共享存储单元相互交互数据。BSP整体同步并行计算模型分布存储的MIMD计算模型,将处理器和路由器分开,强调了计算任务和通信任务的分开。采用障碍同步的方式以硬件实现的全局同步是在可控的粗粒度级,从而提供了执行紧耦合同步式并行算法的有效方式。LOGP分布存储的、点到点通信的多处理机模型L(Latency)表示信息从源到目的地所需的时间;O(Overhead)表示处理器接受或发送一条消息所需额外开销,并且在此期间处理器不能做作任何操作;G(Gap)表示处理器连续进行两次发送或接收消息之间必须有的时间间隔;P(Processor)表示处理器的数目。2.ExplaintheFlynnclassifyanditssemantics.1)单指令流单数据流(SingleInstructionStreamSingleDataStream,SISD)SISD其实就是传统的顺序执行的单处理器计算机,其指令部件每次只对一条指令进行译码,并只对一个操作部件分配数据。2)单指令流多数据流(SingleInstructionStreamMultipleDataStream,SIMD)SIMD以并行处理机为代表,结构如图,并行处理机包括多个重复的处理单元PU1~PUn,由单一指令部件控制,按照同一指令流的要求为它们分配各自所需的不同的数据。3)多指令流单数据流(MultipleInstructionStreamSingleDataStream,MISD)MISD的结构,它具有n个处理单元,按n条不同指令的要求对同一数据流及其中间结果进行不同的处理。一个处理单元的输出又作为另一个处理单元的输入。4)多指令流多数据流(MultipleInstructionStreamMultipleDataStream,MIMD)MIMD的结构,它是指能实现作业、任务、指令等各级全面并行的多机系统,多处理机就属于MIMD。3.WherearethedifficultiesofParallelProcessing?Whatis‘Parallel(并行)、concurrent(并发)andSimultaneous(同时)’separately?1)并行处理的难度:a)处理单元的多少以及其功能的强弱;b)处理单元的连接方式以及其处理结构;c)同步与互斥的实现;d)处理单元之间的数据传输;高级计算机体系结构作业学号:2220120336姓名:刘永继4e)不同存储层次上的数据一致性。2)并行:两个或多个事件在同一时刻发生;并发:两个或多个事件在同一时间间隔内发生;同时:两个或多个事件在同一时间内完成。4.Assumethatasystemcomponentbespeededto10times,Itspastprocessingtimeaccountsfor40%ofthesystem,howmuchwillbethesystemperformanceimproved?1;40%,101Spfnffn11.56250.410.410Sp5.PleasedrawthememoryHierarchychart。6.ExplainingConceptionsRISC精简指令集计算机尽量简化计算机指令功能,只保留那些功能简单,能在一个节拍内执行完的指令,而把复杂指令用段子程序来实现。CISC高级计算机体系结构作业学号:2220120336姓名:刘永继5复杂指令集计算机通过设置一些复杂的指令,把一些原来由软件实现的常用功能改用硬件实现的指令系统实现,以此来提高计算机的执行速度。VLIW超大规模集成电路指几毫米见方的硅片上集成上万至百万晶体管、线宽在1微米以下的集成电路。SUPER-SCALAR超标量通过内置多条流水线来同时执行多个处理器,其实质是以空间换取时间。SUPER-PIPELINE超流水线通过细化流水、提高主频,使得在一个机器周期内完成一个甚至多个操作,其实质是以时间换取空间。SUPER-SCALAR-SUPER-PIPELINE超标量超流水线在一个基本时钟周期内能够分时发送多组指令,并且每组指令又可包涵一条或多条指令。IPC单位时钟周期内所执行的指令数SINGLEISSUE单发射结构在一个时钟周期内只从存储器中取出一条指令,并且只对一条指令进行译码,只执行一条指令,只写一个运算结果。MULTIPLEISSUE多发射结构在一个基本时钟周期内同时从指令Cache中读出多条指令,同时对多条指令进行译码。OOO乱序执行结构能够不按照程序提供的顺序完成计算任务,是一种加快处理器运算速度的架构。Multi-Threading多线程同时运行多个轻量级任务。7.Inidealcase,pleasegivetheperformancesforSUPER-SCALAR,SUPERPIPELINE,SUPER-SCALAR-SUPER-PIPELINE,andgiveN=8examplesandtheiraverageIPC.1)性能超标量性能:S(m,1)=T(1,1)/T(m,1)=(K+N-1)/(K+(N-m)/m)超流水性能:S(1,n)=T(1,1)/T(1,n)=n(k+N-1)/nk+N-1超标量超流水性能:S(m,n)=T(1,1)/T(m,n)=(K+N-1)/(K+(N-m)/(mn))其中,N表示不相关指令数,m表示指令的并行度,n表示指令流水线的并行度,K表示指令流水线的阶段数2)N=8的周期图超标量:F-D-E-W高级计算机体系结构作业学号:2220120336姓名:刘永继6F-D-E-WF-D-E-WF-D-E-WF-D-E-WF-D-E-WF-D-E-WF-D-E-W1234567IPC=8/7=1.14超流水:F|D|E|W||||F|D|E|W|||||F|D|E|W||||F|D|E|W|||||F|D|E|W||||F|D|E|W|||||F|D|E|W||||F|D|E|W|1234567IPC=8/7=1.14超标量超流水:F|D|E|W||F|D|E|W||F|D|E|W||F|D|E|W|||F|D|E|W||F|D|E|W||F|D|E|W||F|D|E|W|12345IPC=8/5=1.608.PleasedescribetheCPUtechnologyinrecentyears,andgiveanexampletoillustratetheirtechnicalparameters.1)HyperthreadingThreadsareindependentpartsofacomputerprogram.Multi-taskingoperatingsystems(e.g.WindowsorLinux)workbyallocatingeachthreadacertainamountofCPUtimeinwhichtoexecutesomeinstructions.Thismeansthattheycanrundozensofprogramsatthesametime.Multi-processorsystemsallowtheOStoliterallyruntwoormoreprogramthreadssimultaneouslyondifferentCPUs.ThismeansthatthereislesscompetitionforCPUtimeandthereforethecomputershouldoperatemorequickly.However,multiprocessorsystemsare高级计算机体系结构作业学号:2220120336姓名:刘永继7expensive.Hyper-ThreadingTechnology(HTT)wasintroducedbyInteltogiveacost-effectivecompromise.Byduplicatingsomeofthepartsofthemaincoreitpretendstobetwoprocessors.Thisgivesasmallspeedincrease(upto30%).2)DualCore&multi-coreDualcoredesignshavetwo