计算机系统结构姓名:学号:一、简答题(每小题10分,共20分)1.简述使用物理地址进行DMA存在的问题,及其解决办法。2.从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较(列表)。二、(60分)现有如下表达式:Y=a×X其中:X和Y是两个有64个元素的32位的整数的向量,a为32位的整数。假设在存储器中,X和Y的起始地址分别为1000和5000,a的起始地址为6000。1.请写出实现该表达式的MIPS代码。2.假设指令的平均执行时钟周期数为5,计算机的主频为500MHz,请计算上述MIPS代码(非流水化实现)的执行时间。3.将上述MIPS代码在MIPS流水线上(有正常的定向路径、分支指令在译码段被解析出来)执行,请以最快执行方式调度该MIPS指令序列。注意:可以改变操作数,但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图,计算调度前和调度后的MIPS代码序列执行所需的时钟周期数,以及调度前后的MIPS流水线执行的加速比。4.根据3的结果说明流水线相关对CPU性能的影响。三、(20分)请分析I/O对于性能的影响有多大?假设:1.I/O操作按照页面方式进行,每页大小为16KB,Cache块大小为64B;且对应新页的地址不在Cache中;而CPU不访问新调入页面中的任何数据。2.Cache中95%被替换的块将再次被读取,并引起一次失效;Cache使用写回方法,平均50%的块被修改过;I/O系统缓冲能够存储一个完整的Cache块。3.访问或失效在所有Cache块中均匀分布;在CPU和I/O之间,没有其他访问Cache的干扰;无I/O时,每1百万个时钟周期中,有15,000次失效;失效开销是30个时钟周期。如果替换块被修改过,则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。试题二计算机系统结构姓名:学号:一、名词解释(每题3分,共15分)1.Cache2:1经验规则3.同构型多处理机5.堆栈型机器2.计算机体系结构4.通道处理机二、填空(每空1分,共20分)1.设计I/O系统的三个标准是()、()和()。2.存储器层次结构设计技术的基本依据是程序的()。3.相联度越高,()失效就越少;()失效不受Cache容量的影响,但()失效却随着容量的增加而减少。4.在虚拟存储器中,一般采用()地址映象方法和()更新策略。5.计算机系统中提高并行性的技术途径有()、()和()三种。在高性能单处理机的发展中,起主导作用的是()。6.在处理机中,若指令序列完成的顺序总是与它们开始执行的顺序保持一致,则只可能出现()相关,否则就有可能出现()、()和()相关。7.对向量的处理有()方式、()方式、()方式。三、简答题(每题6分,共24分)1.任写出三种Cache的优化技术,并简述其基本思想。2.在指令集结构设计中,应该考虑哪些主要问题?3.数据相关有哪几种类型?解决数据相关有哪些主要方法?4.试以系列机为例,说明计算机体系结构、计算机组成和计算机实现三者之间的关系。四、计算题1.给定以下的假设,试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU的性能。由计算结果能得出什么结论?(1)理想Cache情况下的CPI为2.0,时钟周期为2ns,平均每条指令访存1.4次。(2)两者Cache容量均为128KB,块大小都是32字节。(3)组相联Cache中的多路选择器使CPU的时钟周期增加了10%。(4)这两种Cache的失效开销都是80ns。(5)命中时间为1个时钟周期。(6)128KB直接映象Cache的失效率为1.0%,128KB两路组相联Cache的失效率为0.7%。(15分)2.计算机系统字长64位,包含三个选择通道和一个多路通道,每个选择通道上连接了两台磁盘机和三台磁带机,多路通道上连接了了两台行式打印机,两台读卡机、10台终端,假定各设备的传输率如下:磁盘机:600KBps,磁带机:200KBps,行打机:6.6KBps,读卡机:1.2KBps,终端:1KBps。计算该计算机系统的最大I/O数据传输率。(6分)3.某计算机系统采用浮点运算部件后使浮点运算速度提高到原来的20倍,而系统运行一程序的整体性能提高到原来的10倍,试计算该程序中浮点操作所占的比例。(5分)4.动态多功能流水线由6个功能段组成,如下图所示:s1s6s5s3s4s2其中,s1、s4、s5、s6组成乘法流水线,s1、s2、s3、s6组成加法流水线,各个功能段时间为:s1、s3、s4、s6为△t,s2、s5为2△t,假设该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算:∏(Ai+Bi)(其中i=1..4,∏为连乘符号)(1)画出其处理过程的时空图。(2)计算其实际的吞吐率和效率。(15分)试题三计算机系统结构姓名:学号:一、名词解释(每题3分,共15分)8.VictimCache9.RAID10.累加器型机器11.透明性12.向量处理机二、填空(每空1分,共20分)1.Cache失效可以分为()、()和()三种。2.说出三种对计算机发展非常关键的实现技术:()、()和()。3.2:1Cache经验规则是指大小为N的()Cache的失效率约等于大小为N/2的()Cache的失效率。4.单机和多机系统中并行性发展的技术途径有:()、()和()。5.通道分为()通道、()通道和()通道三种类型。6.在处理机中,若指令序列完成的顺序总是与它们开始执行的顺序保持一致,则只可能出现()相关,否则就有可能出现()、()和()相关。7.输入/输出系统包括()和()。三、简答题(每题6分,共24分)1.任写出三种降低Cache失效开销的方法,并简述其基本思想。2.指令集结构设计中表示寻址方式的主要方法有哪些?简述这些方法的优缺点。3.软件兼容有几种?其中哪一种是软件兼容的根本特征?4.造成流水线“断流”的主要原因是哪三种相关?简述三种相关的基本思想。四、计算题1.在伪相联中,假设在按直接映象找到的位置处没有发现匹配,而在另一个位置才找到数据(伪命中)需要2个额外的周期;直接映象的命中时间为1个时钟周期,两路组相联的命中时间为1.2个时钟周期,直接映象情况下失效开销为80个时钟周期,当Cache容量为64KB时,直接映象的失效率为1.4%,两路组相联的失效率为1%,问:直接映象、两路组相联和伪相联这三种组织结构中,哪一种速度最快?(15分)2.将计算机系统中某一功能的处理速度加快15倍,但该功能的处理时间仅为整个系统运行时间的30%,则采用此增强功能方法后,能使整个系统的性能提高多少?(5分)3.计算机A和计算机B具有相同的指令系统。执行同一个程序时,计算机A的时钟周期为1ns,CPI为2.0,计算机B的时钟周期为2ns,CPI为1.2。请问执行这个程序时,哪台计算机更快?(6分)4.动态多功能流水线由6个功能段组成,如下图:s1s6s5s3s4s2其中,s1、s4、s5、s6组成乘法流水线,s1、s2、s3、s6组成加法流水线,,各个功能段时间为:s1、s3、s4、s6为△t,s2、s5为2△t,假设该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算:41iiiBA(1)画出时空图。(2)计算实际的吞吐率、加速比和效率。(15分)试题四计算机系统结构姓名:学号:一、名词解释(每题3分,共15分)13.通用寄存器型机器14.虚拟Cache15.通道处理机4.机群5.定向技术二、填空(每空1分,共20分)1.流水线中的相关有()相关、()相关和()相关三种。2.设计I/O系统的三个标准是()、()和()。3.对向量的处理有()方式、()方式、()方式。4.同构型多处理机和异构型多处理机所采用的提高并行性的技术途径分别是()和()。5.地址映象方法有()、()和()等三种,其中()的冲突率最低。6.软件兼容有()、()、()和()四种。其中()是软件兼容的根本特征。三、简答题(每题6分,共24分)1.计算机体系结构设计和分析中最经常使用的三条基本原则是什么?并说出它们的含义。2.任写出三种降低失效率的方法,并简述其基本思想。3.指令集结构设计中,应该考虑哪些主要问题?4.通道分为哪三种类型?它们分别适合为哪种外围设备服务?四、计算题1.假定Cache的失效开销为50个时钟周期,当不考虑存储器停顿时,所有指令的执行时间都是2.0个时钟周期,访问Cache失效率为2%,平均每条指令访存1.33次。求没有Cache和有Cache两种情况下的平均指令执行时间。(12分)2.在三级Cache中,第一级Cache、第二级Cache和第三级Cache的局部失效率分别为4%、30%和50%。它们的全局失效率各是多少?(8分)3.计算机A和计算机B具有相同的指令系统。执行同一个程序时,计算机A的时钟周期为1.1ns,CPI为2.0,计算机B的时钟周期为2ns,CPI为1.3。请问执行这个程序时,哪台计算机更快?(6分)4.静态多功能流水线由6个功能段组成,如下图所示:s1s6s5s3s4s2其中,s1、s4、s5、s6组成乘法流水线,s1、s2、s3、s6组成加法流水线,各个功能段时间均为△t,假设该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算:∏(Ai+Bi)(其中i=1..4,∏为连乘符号)(3)画出时空图;(4)计算实际的吞吐率、加速比和效率。(15分)乘法12345加法试题五计算机系统结构姓名:学号:一、名词解释(每题3分,共15分)16.系列机3.强制性失效5.失效率2.定向技术4.通道处理机二、填空(每空1分,共20分)1.数据相关有三种,分别是:()、()和()。2.从处理数据的角度,并行性等级可以分为字串位串、()、()和全并行。3.在存储层次中,映象规则有()、()和()。4.计算机系统中提高并行性的技术途径有()、()和()三种。在高性能单处理机的发展中,起主导作用的是()。5.设有一个“Cache-主存”层次,Cache为4块,主存为8块;试分别对于以下2种情况,计算访存块地址为5时的索引(index)。(1)组相联,每组两块;索引为()。(2)直接映象;索引为()。6.对向量的处理有()方式、()方式、()方式。7.根据CPU内部存储单元类型,可将指令集结构分为()型指令集结构、()型指令集结构和()型指令集结构。三、简答题(每题5分,共25分)1.调度分支延迟指令有哪三种常用方法?它们各有什么优缺点。2.表示寻址方式的主要方法有哪些?简述它们的优缺点。3.简述“Cache-主存”层次与“主存-辅存”层次的区别。4.试举例说明DLX流水线中存在不能依靠定向技术解决的数据相关及其解决方法。5.试从3C失效的关系分析增加块大小对Cache性能的影响。四、(20分)有一条静态多功能流水线由5段组成(如下图所示),加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t,其余各段时间均为△t,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。若在该流水线上计算f=(A1+B1)*(A2+B2)*(A3+B3)*(A4+B4),(1)画出处理过程的时空图。(2)计算其吞吐率、加速比和效率。(3)该流水线的瓶颈段是哪一段?可用哪几种方法消除该瓶颈?画出改进后的流水线。五、(10分)(1)根据Amdahl定律写出系统加速比的公式。(2)某计算机系统有两个部件可以改进,这两个部件的加速比为:部件加速比1=30;部件加速比2=20;如果部件1和部件2的可改进比例分别为30%和40%,求整个系统的加速比。六、(10分)给定以下的假设,试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU时间。(1)理想Cache(命中率为100%)情况下的CPI为2.0,时钟周期为2ns,平均每条指令访存1.2次。(2)两种Cache