计算机组成原理课程设计报告5级流水无cacheCPU实验1.1实验内容:无cache流水CPU的分析与改造1.理解无cache流水CPU的工作原理,明确系统总体结构和数据通路图,分析解决各种相关用到的主要信号,以及详细分析各流水段的功能和实现。2.将16位的指令系统改为8位,设计新的指令系统,并修改相应的数据通路。3.修改规则文件(cpu.txt),并编写测试程序验证系统改造的正确性。1.2总体基本信息1.深刻理解无cache流水cpu的工作原理。在详细分析了各流水段的功能实现、3种相关的产生原因和解决方法的基础上,完成了以下后续工作。2.修改指令系统。具体包括:a)16位指令改为8位,重新编写了指令OP码。b)新增了MOVI指令。由于原指令系统没有将立即数存进指定寄存器的指令,因此此处新增一条MOVI指令。指令的汇编语句为MOVIDR,IMM其中DR为目的寄存器,IMM为立即数。因为指令长度为8位,OP和DR共占了6位,因此IMM的大小不大于3(即二进制“00”至“11”)。c)修改及删除了部分指令。此处详见5.1。3.修改系统控制信号。在保持原有系统逻辑功能基本不变的情况下,修改各个模块里控制信号位数以及模块接口信号位数以和新的指令系统兼容。4.增加内存模块。使用vhdl编写了一个ram模块,根据读写信号来选择读写功能。reset时将事先写好的二进制形式程序写进内存。5.扩展了常量定义文件。在常量定义文件unitpack.vhd中,具体地:a)新增了ALU功能选择信号常量aluMOVI。b)新增了寄存器编号常量R0、R1、R2和R3。c)新增了ram类型。6.使用QuartusII进行功能仿真并debug。7.使用bdf构造顶层实体cpum。由于新增了内存模块,而原系统是使用vhdl编写的,为了方便对接,我们使用bdf的形式将无cache流水线cpu和内存模块连接起来构造顶层实体cpum,“m”的含义是“memory”,即带内存模块的无cache流水线cpu。8.重画数据通路图。我们使用了MicrosoftVisio软件在原有的系统总结结构图的基础上修改并新增了部分模块,详见2。22、系统总体结构及数据通路图总体结构图:3数据通路图:整个CPU由以下几个模块组成:取指模块(IF):给出内存地址,读取指令并送入指令寄存器,为下一级准备数据。由于PC控制模块处于取指模块中,因此控制相关的检测也置于取指模块。译码模块(ID):读取寄存器值和指令译码。我们采取一次译码,逐级传递的方式,译出后几级流水所需的控制信号和数据(如立即数等),在每次时钟上升沿到来时送入下一级。实际上,结构相关、控制相关、数据相关的检测都可归入译码部分。考虑到“相关检测”涉及到的信号分属不同阶段以及整体结构的清晰性,我们将“相关检测”独立出来。执行模块(Ex):完成算术逻辑运算、计算有效地址和提供数据通道。访存模块(Ma):选择地址线的数据来源和数据线的流向。访存和取指在功能上是独立的,但CPU对外只有一条地址线和数据线的事实决定了访存和取指是相互联系的。当执行LOAD/STORE指令时,地址线由ALU送入“访存段”的值提供;取指时,则由PC提供。当写内存时,CPU内部数据送数据线;当需要读内存时,CPU往数据线送高阻。回写模块(Wb):选择回写数据源和根据写使能信号wRegEn将数据回写到寄存器堆;HazardDetectUnit模块:检测结构相关;ForwardingUnit模块:检测数据相关。内存模块memory,根据访存地址mem_adr和读写信号wr来控制。43解决各种相关用到的主要信号的分析3.1控制相关控制相关是指因为程序的执行方向可能改变而引起的相关。当执行跳转指令时,就会发生这种情况。除JR外,JRZ等条件跳转需要根据当前状态位来决定是否跳转,而当前状态位是由前面最近的会影响状态位的指令(如算术指令)决定。常规的也是比较简单的做法是在碰到JRX之类的跳转指令时,延迟后边流水线的进入。但我们通过分析,认为可以一点都不必延迟,通过旁路处理把控制相关转为数据相关来处理。这样处理,不必延迟,可以提高流水线的性能。按我们的方式解决控制相关需要做两项工作:1)通过旁路,提供状态寄存器的值和临时状态位的值,为判断是否跳转作准备;2)选择PC更新的时机1.旁路处理在每条指令译码时,会产生一个信号setFlag,它决定了在执行阶段是否根据ALU计算结果改变状态位。从下面的时序图中可以发现,只要我们在JRX指令译码时提供以下3个信号就可作出是否跳转的决定:信号含义tFlagALU计算出的临时状态位,Flag状态寄存器输出,e_setFlag状态寄存器写使能表17处理控制相关信号若e_setFlag要写状态寄存器,则说明前一条指令会影响状态位,这时根据tFlag决定是否跳转;若e_setFlag要保持状态寄存器,则说明前一条指令不会影响状态位,这时根据Flag决定是否跳转。取指译码取指译码PC更新译码执行JR×前一条指令后一条指令5涉及到控制相关的关键信号是setFlag信号,产生于译码模块,作用于执行模块,即identity.vhdheexentity.vhd文件中。如下图所示。从上图可看出,凡是涉及到数值计算和关系运算的指令的低三位均为001,而不涉及的则为000。该信号传到执行模块中用于判断是否更新状态寄存器。63.2数据相关数据相关是指在执行本条指令的过程中,如果用到的操作数是前面指令的执行结果,则必须等待前面的指令执行完成,并把结果写回寄存器或主存之后,本条指令才能继续执行。此处采用设置专用数据通路来解决数据相关问题。但旁路技术并非一劳永逸。若前一指令为LOAD,而后一指令和它数据相关,如下图所示,当下一指令的执行阶段需要数据时,上一指令尚未给出,这种情况是无法用旁路技术来解决的。相关的类型有三种:1.2.73.主要用到的关键信号是m_wRegEn和w_wRegEn,主要使用是在数据相关检测模块forwardingentity.vhd中,在identity.vhd、exentity.vhd、memaccessentity.vhd中均有使用。具体的使用方法如下。相关的检测都置于“执行阶段”。信号wRegEn是寄存器写使能,SA,SB是寄存器组A,B口选择信号。信号前缀表示信号所处的阶段。如e_SA表示处于执行阶段的SA。1.相邻指令数据相关的检测若m_wRegEn=’1’,则表示前一指令要回写寄存器。此时,若e_SA或e_SB等于m_SA,则必然数据相关,这是因为我们规定,若回写寄存器,则寄存器A口选择信号所指定的即为目的寄存器。否则无关。2.中间隔1条指令的两指令数据相关的检测若w_wRegEn=’1’,则表示第一条指令要回写寄存器。此时,若e_SA或e_SB等于w_SA,则必然数据相关。否则无关。当然,上述两种情况可能会一同出现。这时,我们就按情况1处理。因为情况2可以理解为接连出现情况1。8下图为各个指令在译码时产生的wRegEn信号,可以发现凡是会写进寄存器的指令,该信号值都为1。93.3结构相关由于在设计中不包含缓存,因此会有取指和访存的冲突,即结构相关。如下图:取指译码执行访存取指译码关键信号是wrMem信号,表示是否读写内存。具体出现在结构相关冲突检测与问题解决模块Hazarddetectentity.vhd中,产生于译码模块identity.vhd中。具体使用方法如下:1)冲突检测只有执行访存指令(LOAD/STORE)时,才会出现冲突。因此,我们在译码时产生一个标志是否访存的信号wrMem。含义如下:wrMem意义00写内存(STORE)01读内存(LOAD)1×不占用内存表16wMEM控制信号通过检查“访存阶段”的m_wrMem就可确定是否冲突。2)取指延后在每次取指时,若有冲突,则往IR中写入空指令(NOP),并保持PC不变,使取指延后一个节拍。104各流水段功能和实现的详细分析4.1取指(IF)4.1.1实现功能列表取指模块实现的功能是:给定内存地址,读取内存中的指令将指令送入指令寄存器,提供给下一级的译码模块实现控制相关冲突检测根据读取到的指令是否为跳转指令来更新PC4.1.2输入、输出信号分析主要输入信号:Z,C状态寄存器tempZ,tempCALU计算出的临时状态位,用于相关冲突检测e_setFlag状态寄存器写使能端,产生于译码时。决定是否在执行阶段根据ALU计算出来的结果改变状态位PCStall决定是否保持PC不变,由结构相关冲突检测模块产生IFFlush决定是否往指令寄存器IR里写入空指令,来自结构相关检测模块OuterDB内存读取过来的数据主要输出信号:PC_addrPC作为内存地址输出,用于下一节拍的取指d_PCInc1PC+111d_IR指令寄存器输出4.1.3功能实现逻辑通过分析控制信号我们可以大概了解到取指模块的功能实现逻辑是如何的。广义上来说,取指模块包括结构相关冲突检测模块,因为PCStall信号(用来实现IF段对PC的更新)和IFFlush信号(对IR写入空指令)就来自结构相关冲突检测模块。结构相关检测模块叫HazardDetectEntity,其模块图如下:其中输入信号的含义是:m_wrMemwrMem在访存阶段的值w_rwMemwrMem在写回阶段的值d_IR指令寄存器通过检测访存阶段的wrMem信号即可确定是否发生了结构冲突。每次取指后,若有冲突,则往IR中写入空指令(NOP),并保持PC不变,使得取指延后一个节拍。除此之外,setFlag信号在此处的作用是,决定用状态寄存器输出Flag还是ALU计算出的临时状态位tFlag来判断跳转。4.2译码(ID)4.2.1实现功能列表译码模块实现的功能是:读取指令寄存器中的指令对指令进行译码,发送控制信号124.2.2输入、输出信号分析主要输入信号:d_IR从取指模块来的指令d_PCInc1从取指模块来的pc+1w_wbData写回数据,从写回模块里来w_destReg要写回的目标寄存器w_wRegEn寄存器写使能端主要输出信号:e_RAOut寄存器A输出值e_RBOut寄存器B输出值e_IMM立即数输出值e_ALUSrcALU输入端选择信号e_ALUOprALU运算选择信号e_SetFlag状态寄存器写使能信号e_wrMem访存信号e_wRegEn寄存器写使能信号13e_destReg目标寄存器e_MemToReg内存写入寄存器使能信号4.2.3功能实现逻辑译码模块内部写好了根据不同的指令发送不同的控制信号的代码,采取一次译码,逐级传递的方式,译出后几级流水所需的控制信号和数据(如立即数)。在每次时钟上升沿到来时送入下一级。实际上,结构相关、控制相关、数据相关的检测都可归入译码部分。考虑到“相关检测”涉及到的信号分属不同阶段以及整体结构的清晰性,作者将“相关检测”独立出来。4.3执行(EX)4.3.1实现功能列表执行模块实现的功能是:根据控制信号完成算术逻辑运算根据控制信号计算有效地址提供数据通道,将上一级传递过来的控制信号传到下一级144.3.2输入、输出信号分析主要输入信号:e_RAOut、e_RBOut、e_ALUSrc、e_ALUOpr、e_SetFlag、e_IMM、e_memToReg、e_wRegEn、、来自译码模块的控制信号forwardA、forwardB来自数据相关冲突检测模块的输出e_ALUOut上一个指令在执行模块产生的输出,作为下一条指令在执行模块执行的输入信号之一主要输出信号:m_SA、m_ALUOut、m_RBdata、i_tempZ、i_tempC、m_flag、m_wRegEn、m_memToReg、m_destReg、m_wrMem主要来自上一级模块传过来的控制信号4.3.3功能实现逻辑执行模块执行的功能很简单,和上个学期做的CPU综合性实验类似,主要是一些ALU逻辑运算和状态寄存器的更新操作。在这里还有向下一模块传递控制信号的作用。其中,forwardA和forwa