大连理工大学实验报告计算机系统结构实验实验三指令调度和延迟分支学院(系):电子信息与电气工程学部专业:计算机科学与技术学生姓名:班级:学号:大连理工大学DalianUniversityofTechnology实验三指令调度和延迟分支一、实验目的和要求(1)加深对指令调度技术的理解。(2)加深对延迟分支技术的理解。(3)熟练掌握用指令调度技术解决流水线中的数据冲突的方法。(4)进一步理解指令调度技术对CPU性能的改进。(5)进一步理解延迟分支技术对CPU性能的改进。二、实验步骤与操作方法1、启动MIPSsim。2、根据前面的相关知识中关于流水线各段操作的描述,进一步理解流水线窗口中各段的功能,掌握各流水寄存器的含义。3、选择“配置”-“流水方式”选项,使模拟器工作于流水方式下。4、用指令调度技术解决流水线中的数据冲突。(1)启动MIPSsim。(2)加载schedule.s。(3)关闭定向功能。(4)执行所载入的程序。通过查看统计数据和时钟周期图,找出并记录程序执行过程中各种冲突发生的次数、发生冲突的指令组合以及程序执行的总时钟周期数。(5)采用指令调度技术对程序进行指令调度,消除冲突。将调度后的程序存到after-schedule.s中。(6)载入after-schedule.s。(7)执行该程序。观察程序在流水线中的执行情况,记录程序执行的总时钟周期数。(8)根据记录结果,比较调度前和调度后的性能。论述指令调度对于提高CPU性能的作用。5、用延迟分支减少分支指令对性能的影响。(1)启动MIPSsim。(2)载入branch.s。(3)关闭延迟分支功能。(4)执行该程序。观察并记录发生分支延迟的时刻。(5)记录执行该程序所用的总时钟周期数。(6)假设延迟槽有1个,对branch.s进行指令调度,然后保存到“delayed-branch.s”中。(7)载入delayed-branch.s。(8)打开延迟分支功能。(9)执行该程序。观察其时钟周期图。(10)记录执行该程序所用的总时钟周期数。(11)对比上述两种情况下的时钟周期图。(12)根据记录结果,比较没采用延迟分支和采用了延迟分支的性能之间的不同。论述延迟分支对于提高CPU性能的作用。三、实验结果与分析1、指令调度(1)schedule.s程序执行所载入的schedule.s程序。统计数据和时钟周期图如下。程序总周期数为33,总停顿17次,其中RAW(先写后读)停顿16次,自陷停顿1次。图1schedule.s统计数据图2schedule.s时钟周期图对于指令调度进行优化。优化有三种方式:从前调度、从目标处调度和从失败处调度。在此,我们采用了从前调度和从目标处调度两种方式。对比发现,从前调度的优化效果比从目标处调度好。下图是源程序和改好的after_schedule.s程序。图3scheduld.s图4after_schedule.s(2)after_schedule.s程序执行after_schedule.s程序。统计数据和时钟周期图如下。执行周期总数是18个时钟周期,共停顿2次,其中RAW停顿1次,自陷停顿1次。图5after_schedule.s统计数据图图6after_schedule.s时钟周期图(3)调度前后比较与分析实验数据表明调度前总周期33条,停顿17次;调度后总周期为18,停顿2次。性能提升将近一倍。可以看出在一定条件下,指令调度对于CPU性能的提升有很大的作用。当然这提升同运行的程序及指令调度的方法有很大的关系。对于不同的程序可以提升的最大性能是不一样的。而不同的指令调度方法对于CPU性能的提升也有很大的影响。所以使用有效的正确的算法来进行指令调度是很有必要的,这样既能节约安排指令调度的时间,又能使CPU的性能尽可能的得到提升。2.延迟分支(1)branch.s程序:执行程序,发生分支延迟的时刻如图7中红线处。程序总时钟周期数为38,其中控制停顿为2。数据统计如图8所示。图7branch.s时钟周期图图8branch.s数据统计图(2)delayed_branch.s程序对branch.s进行延迟分支调度,调度后程序如下所示。其中程序将SW$r1,0($r2)设置为延迟槽指令。图9delayed_branch.s程序打开延迟分支功能,执行程序。时钟周期总数为32,控制停顿为0。图10时钟周期图图11统计数据图(3)调度前后比较与分析实验数据表明调度前总周期38条,控制停顿2次;调度后总周期为32,停顿0次。控制停顿已消除。可以看出在一定条件下,采用延迟分支可以提升CPU的性能。对于不同的程序可以提升的最大性能是不一样的。不同的调度方法对于CPU性能的提升也有的影响,从前调度,从目标代码处调度,从失败处调度,对于不同的程序这几种方法提升的性能是不同的。同时可以看到在设置延迟分支前数据冲突为16次,设置后数据冲突为12次。这是因为在使用延迟分支同时恰好相当于使用了指令调度,减少了一部分数据冲突。所以可见设置延迟分支与调度指令都可以较好地提高CPU性能。四、讨论、建议、质疑