计算机系统结构试题

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第一章:1.试述Flynn分类的4种计算机系统结构有何特点。2.假设高速缓存Cache工作速度为主存的5倍,且Cache被访问命中的概率为90%,则采用Cache后,能使整个存储系统获得多高的加速比?3.某工作站采用时钟频率为15MHz、处理速率为10MIPS的处理机来执行一个已知混合程序。假定每次存储器存取为1周期延迟,试问:(1)此计算机的有效CPI是多少?(2)假定将处理机的时钟提高到30MHz,但存储器子系统速率不变。这样,每次存储器存取需要两个时钟周期。如果30%指令每条只需要一次存储存取,而另外5%每条需要两次存储存取,并假定已知混合程序的指令数不变,并与原工作站兼容,试求改进后的处理机性能。4.处理机的时钟30MHz(1)计算在单处理机上用上述跟踪数据运行程序的平均CPI。(2)根据(1)所得CPI,计算相应的MIPS速率。1、解释图中各控制信号的作用。2、各流水级存放控制信号的流水线寄存器有何异同?3、设流水线模型机采用load前推和数据前推,按时钟周期画出以下指令序列的时序图,标示出前推示意。loadr2,12(r3)addir4,r2,10andr1,r2,r4storer1,10(r5)4、给出A.3节PPT中图1.39的BDEPEN控制信号的真值表。半期:1、试分析采用哪种设计方案实现求浮点数除法FPMUL对系统性能提高更大。假定FPMUL操作占整个测试程序执行时间的15%。一种设计方案是增加专门的FPMUL硬件,可以将FPMUL操作的速度加快到10倍;另一种设计方案是提高所有FP运算指令的执行速度,使得FP指令的执行速度加快为原来的1.4倍,设FP运算指令在总执行时间中占40%。(3分)解:对这两种设计方案的加速比分别进行计算。增加专门FPDIV硬件方案:Fe=15%=0.15,Se=10SFPDIV=1/((1-0.15)+0.15/10)=1/0.865=1.156提高所有FP运算指令速度方案:Fe=40%=0.4,Se=1.6SFP=1/((1-0.4)+0.4/1.4)=1/0.886=1.13增加专门FPDIV硬件方案的加速比更高,对系统性能提高更大。2.设流水线模型机结构如下图所示,采用load前推和数据前推(包括store指令)。假设模型机使用subicc指令,它将根据减法结果设置标志寄存器Z的内容为0或为1;其它的ALU计算指令不影响Z。指令bne的控制相关处理采用插入nop指令的策略。(7分)带有内部前推及load相关暂停功能的流水线处理机设有以下指令序列:Lop:loadr1,100(r3)addir2,r1,10storer2,100(r3)subiccr5,r5,1bner5,lop;如果r5的内容不为0,则转Lop(1)按时钟周期画出以上指令序列第1次循环执行及转移到“loadr1,100(r3)”指令,在模型机中执行的时序图,标出内部前推示意。(3分)(2)如果以上指令序列在流水线CPU执行,当第2条指令“addir2,r1,10”进入EXE级时,试给出ADEPEN、BDEPEN信号的值、WB级信号SLD的值。(2分)ADEPEN=BDEPEN=SLD=(3)设模型机采用延迟转移,调整以上指令序列的顺序,使得指令序列在模型机中执行时只有最小停顿,写出调整后的指令序列(不需要画时序图)。(2分)解:(1)(2)ADEPEN=3或(11)BDEPEN=1或(01)SLD=1(3)Lop:loadr1,100(r3)subiccr5,r5,1addir2,r1,10bner5,lopstorer2,100(r3)第四章:1、浮点流水线延迟如PPT例4-1,将下面的循环展开并进行指令调度,直到没有任何延迟。LOOP:LDF0,0(R1);MULDF0,F0,F2;LDF4,0(R2);ADDDF0,F0,F4;SDF0,0(R2);DSUBIR1,R1,#8;DSUBIR2,R2,#8;BNEZR1,R0,LOOP;2、按PPT例4-4中的一段指令代码和记分牌信息初始状态,试给出SUBD指令写结果前各记录表的状态。LDF6,34(R2)LDF2,45(R3)MULTDF0,F2,F4SUBDF8,F6,F2DIVDF10,F0,F6Storer3,100,r2addMEMADDDF6,F8,F23、采用Tomasulo算法,按PPT例4-6中的一段指令代码和各表的初始状态,试给出SUBD指令写结果前的指令状态、保留站状态和寄存器状态。第五章:5.1某个计算机系统有128字节的高速缓存。它采用每块有8个字节的4路组相联映射。物理地址大小是32位,最小可寻址单位是1个字节。(1)画图说明高速缓存的组织并指明物理地址与高速缓存地址的关系;(2)可以将地址000010AFH分配给高速缓存的哪一组?(3)假如地址000010AFH和FFFF7AxyH可以同时分配给同一个高速缓存组,地址中的x与y的值为多少?5.2假设对指令Cache的访问占全部访问的75%,而对数据Cache的访问占全部访问的25%。Cache的命中时间为1个时钟周期,失效开销为50个时钟周期,在混合Cache中一次LOAD或STORE操作访问Cache的命中时间都要增加一个时钟周期,32KB的指令Cache的失效率为0.39%,32KB的数据Cache的失效率为4.82%,64KB的混合Cache的失效率为1.35%。又假设采用写直达策略,且有一个写缓冲器,并且忽略写缓冲器引起的等待。试问指令Cache和数据Cache容量均为32KB的分离Cache和容量为64KB的混合Cache相比,哪种Cache的失效率更低?两种情况下平均访存时间各是多少?5.3给定以下的假设,试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU的性能。由计算结果能得出什么结论?(1)理想Cache情况下的CPI为2.0,时钟周期为2ns,平均每条指令访存1.2次。(2)两者Cache容量均为64KB,块大小都是32B。(3)组相联Cache中的多路选择器使CPU的时钟周期增加了10%。(4)这两种Cache的失效开销都是80ns。(5)命中时间为1个时钟周期。(6)64KB直接映象Cache的失效率为1.4%,64KB两路组相联Cache的失效率为1.0%。思考题:数据Cache容量为16KB,块大小为32B,最小寻址单位1字节,采用两路组相联映像方式。设Cache的物理地址为36位。计算索引位数、标识位数、块内偏移量。

1 / 5
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功