计算机系统结构第五章课后习题答案武汉大学

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1计算机系统结构第5章作业解答第2题解:(1)顺序执行需要的时间如下:(2)取指令和执行重叠,即一次重叠执行方式,我们假设第n+1条指令的取指令和第n条指令的执行同时结束,那么所需要的时间为:(3)取指令、分析和执行重叠(4)先行控制方式第4题解:(1)K与K+1之间存在寄存器R1先写后读相关(RAW);K+1与K+2之间存在寄存器R0写与写相关(WAW);K与K+1之间存在寄存器R0先读后写相关(WAR)。(2)前二种相关会引起流水线的停顿。(3)流水线完成这三条指令的时空图如下。共用了9个时钟周期。t6nnt)3t2t(TttnntttT5)32(ttntntttT53)1(3)32(tnttT33tn1ii1执行分析取指分析执行取指分析执行取指分析执行取指分析执行取指分析执行取指分析执行2第6题[分析]为了减少运算过程中的操作数相关,A*B*C*D应改为采用((A*B)*(C*D))的算法步骤进行运算。[解答]按图(A)组织,实现A*B*C*D的时空关系如下图(A)所示。图(A)吞吐率TP=3/(13⊿t)效率E=(3×5⊿t)/(3×13⊿t)=5/13图(B)流水线按图(B)组织时,实现A*B*C*D的时空关系如图(B)吞吐率TP=3/(11⊿t)IFIDM1M2IFIDU1U2U3U4IFIDA1A2A3读R0写R1读R1、R2写R0读R2、R3写R0KK+1K+2125764891011输出13输入ABCDA*BC*DA*BC*DA*B*C*D规格化尾乘阶加(A)规格化尾乘3尾乘2尾乘1阶加11输入输出ABCDA*BC*DA*BC*DA*B*C*D(A)3效率E=(3×5⊿t)/(5×11⊿t)=3/11第8题解:(1)流水线时空图如下:%8.21266)8263(265ETP31.126)8263(pS第11题解:禁止表F={1,3,4,8};原始冲突向量C=(10001101);状态转移图如下:调度方案平均延时(2,5)3.5(2,7)4.5(6,5)5.5(6,7)6.5(5,6)5.5(5)5(6)6(7)7(注:可以不全部列出所有调度方案,但平均延时最小的调度方案必须写出)最佳调度方案(2,5)下的最小平均延时为3.5拍。最大吞吐率为:TPmax=1/[3.5(拍)]。123456m101826τ100011011010111125,75,71000111165,764当按(2,5)方案输入8个任务时的实际吞吐率为:拍拍328)3542(98TP第13题解:(1)A机的CPI为4(时钟周期为1/25=40ns,4CPI=160ns),B机的CPI为1(时钟周期为1/20=50ns)B机对A机的加速比S=160/50=3.2(2)A机的MIPS=25/4=6.25B机的MIPS=20/1=20第17题解:(1)三条指令可并行执行。T=1+7+1+64-1=72(拍)。(2)前二条指令可并行执行,第三条指令只能串行执行。因为前二条指令的执行时间不等。T=(1+7+1+63)+(1+6+1+63)=143(拍)。如果能控制第一条指令较第二条指令提前一拍启动,则可以实现与第三条指令间的链接,这时的执行时间为:T=(1+7+1+1+6+1)+63=80(拍)。(3)4条指令的串行执行时间为:T=(8+63)+(9+63)+(8+63)+(8+63)=285(拍)。如果能够控制存储器中的第一个分量元素到达V0直至乘法部件的时间,与V1中的第一个分量元素到达乘法部件的时间相等,则前二条指令间可以链接。这样,执行时间为:T=(8+9+63)+142=222(拍)。第三条指令与第二条指令存在着先写后读相关,第四条指令与第三条指令也存在着先写后读相关,但它们都可链接执行。这四条指令总执行时间为:T=(8+9+8+8)+63=96(拍)。(4)条件同(3),4条指令实现链接的时间为:T=(8+16+9+8)+63=104(拍)。

1 / 4
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功