编译原理实验学院计算机学院专业计算机科学与技术年级班别11级计科7班学号3111学生姓名指导教师李小妹成绩2014年1月出错处理函数表格管理函数PL/0源程序目标代码生成程序程序目标代码生成程序程序目标代码生成程序程序目标代码生成程序程序目标代码生成程序程序一、实验目的与要求对PL/0作以下修改扩充:(1)增加单词:保留字ELSE,FOR,STEP,UNTIL,DO,RETURN运算符*=,/=,&,||,!(2)修改单词:不等号#改为(3)增加条件语句的ELSE子句,要求:写出相关文法,语法图,语义规则。二、实验环境与工具1、源语言:PL/0语言,PL/0语言是PASCAL语言的子集,它的编译程序是一个编译解析执行系统,后缀名为.PL0;2、目标语言:生成文件后缀为*.COD的目标代码3、实现平台:BorlandC++Builder64、运行平台:WindowsXP三、设计方案1、结构设计说明(1)PL/0语言编译器PL/0语言可看成是PASCAL语言的子集,它的编译程序是一个编译解释执行系统。PL/0的目标程序为假想栈式计算机的汇编语言,与具体计算机无关。(2)PL/0编译程序的语法分析过程BLOCK是整个编译过程的核心。这里根据编译程序的总体流程图,来弄清BLOCK过程在整个编译程序中的作用。总流程图如下图所示:PL/0的编译程序采用一趟扫描方式,以语法分析程序为核心,词法分析程序和代码生成程序都作为一个独立的过程,当语法分析需要读单词时就用词法分析程序,而当语法分析正确需生成相应的目标代码时,则调用代码生成程序。此外,用表格管理程序建立变量,常量和过程标识符的说明与引用之间的信息联系。用出错处理程序对词法和语法分析遇到的错误给出在源程序中出错的位置和错误性质。(3)各功能模块描述过程或函数名简要功能说明pl0主程序error出错处理,打印出错位置和错误编码getsym词法分析,读取一个单词getch漏掉空格,读取一个字符gen生成目标代码,并送入目标程序区test测试当前单词符号是否合法block分程序分析处理过程enter登录名字表position(函数)查找标识符在名字表中的位置constdeclaration常量定义处理vardeclaration变量说明处理启动置初值调用getsym取单词调用block过程是否为源程序结束符源程序是否有错误调用解释过程interpret解释执行目标执行目标程序结束出错打印错误NNYYlistode列出目标代码清单statement语句处理expression表达式处理term项处理factor因子处理condition条件处理interpret对目标代码的解释执行程序base(函数)通过静态链求出数据区的基地址2、主要成分描述○1符号表为了组成一条指令,编译程序必须知道其操作码及其参数(数或地址)。这些值是由编译程序本身联系到相应标识符上去的。这种联系是在处理常数、变量和过程说明完成的。为此,标识符表应包含每一标识符所联系的属性;如果标识符被说明为常数,其属性值为常数值;如果标识符被说明成变量,其属性就是由层次和修正量(偏移量)组成的地址;如果标识符被说明为过程,其属性就是过程的入口地址及层次。常数的值由程序正文提供,编译的任务就是确定存放该值的地址。我们选择顺序分配变量和代码的方法;每遇到一个变量说明,就将数据单元的下标加一(PL/0机中,每个变量占一个存贮单元)。开始编译一个过程时,要对数据单元的下标dx赋初值,表示新开辟一个数据区。dx的初值为3,因为每个数据区包含三个内部变量RA,DL和SL。○2运行时存储组织和管理对于源程序的每一个过程(包括主程序),在被调用时,首先在数据段中开辟三个空间,存放静态链SL、动态链DL和返回地址RA。静态链记录了定义该过程的直接外过程(或主程序)运行时最新数据段的基地址。动态链记录调用该过程前正在运行的过程的数据段基址。返回地址记录了调用该过程时程序运行的断点位置。对于主程序来说,SL、DL和RA的值均置为0。静态链的功能是在一个子过程要引用它的直接或间接父过程(这里的父过程是按定义过程时的嵌套情况来定的,而不是按执行时的调用顺序定的)的变量时,可以通过静态链,跳过个数为层差的数据段,找到包含要引用的变量所在的数据段基址,然后通过偏移地址访问它。在过程返回时,解释程序通过返回地址恢复指令指针的值到调用前的地址,通过当前段基址恢复数据段分配指针,通过动态链恢复局部段基址指针。实现子过程的返回。对于主程序来说,解释程序会遇到返回地址为0的情况,这时就认为程序运行结束。解释程序过程中的base函数的功能,就是用于沿着静态链,向前查找相差指定层数的局部数据段基址。这在使用sto、lod、stoArr、lodArr等访问局部变量的指令中会经常用到。类PCODE代码解释执行的部分通过循环和简单的case判断不同的指令,做出相应的动作。当遇到主程序中的返回指令时,指令指针会指到0位置,把这样一个条件作为终至循环的条件,保证程序运行可以正常的结束。○3语法分析方法语法分析子程序采用了自顶向下的递归子程序法,语法分析同时也根据程序的语义生成相应三元代码,并提供了出错处理的机制。语法分析主要由分程序分析过程(BLOCK)、参数变量分析过程(ParaDeclaration)、参数变量处理过程(ParaGetSub)、数组处理过程(ParaGetSub)、常量定义分析过程(ConstDeclaration)、变量定义分析过程(Vardeclaration)、语句分析过程(Statement)、表达式处理过程(Expression)、项处理过程(Term)、因子处理过程(Factor)和条件处理过程(Condition)构成。这些过程在结构上构成一个嵌套的层次结构。除此之外,还有出错报告过程(Error)、代码生成过程(Gen)、测试单词合法性及出错恢复过程(Test)、登录名字表过程(Enter)、查询名字表函数(Position)以及列出类PCODE代码过程(Listcode)作过语法分析的辅助过程。○4中间代码表示目标代码类pcode是一种假想栈式计算机的汇编语言。四、测试用例1测试所有功能代码:PROGRAMEX01;VARA,B,C;BEGINA:=8;B:=5;IFABTHENWRITE(A)ELSEWRITE(B);*=;/=;&;||;!;FOR;STEP;UNTIL;RETURN;END.截图:五、开发过程和完成情况1.增加单词:保留字ELSE,FOR,STEP,UNTIL,DO,RETURN运算符*=,/=,&,||,!增加5个保留字和5个运算符,合计10个单词。其中保留字ELSE,FOR,TO,DOWNTO,RETURN分别对应ELSESYM,FORSYM,STEPSYM,UNTILSYM,RETURNSYM,运算符*=,/=,&,||,!对应TIMESBECOMES,SLASHBECOMES,ANDSYM,ORSYM,NOTSYM。增加保留字typedefenum{NUL,IDENT,NUMBER,PLUS,MINUS,TIMES,SLASH,ODDSYM,EQL,NEQ,LSS,LEQ,GTR,GEQ,LPAREN,RPAREN,COMMA,SEMICOLON,PERIOD,BECOMES,BEGINSYM,ENDSYM,IFSYM,THENSYM,WHILESYM,WRITESYM,READSYM,DOSYM,CALLSYM,CONSTSYM,VARSYM,PROCSYM,PROGSYM,ELSESYM,FORSYM,STEPSYM,UNTILSYM,RETURNSYM,TIMESBECOMES,SLASHBECOMES,ANDSYM,ORSYM,NOTSYM}SYMBOL;char*SYMOUT[]={NUL,IDENT,NUMBER,PLUS,MINUS,TIMES,SLASH,ODDSYM,EQL,NEQ,LSS,LEQ,GTR,GEQ,LPAREN,RPAREN,COMMA,SEMICOLON,PERIOD,BECOMES,BEGINSYM,ENDSYM,IFSYM,THENSYM,WHILESYM,WRITESYM,READSYM,DOSYM,CALLSYM,CONSTSYM,VARSYM,PROCSYM,PROGSYM,ELSESYM,FORSYM,STEPSYM,UNTILSYM,RETURNSYM,TIMESBECOMES,SLASHBECOMES,ANDSYM,ORSYM,NOTSYM};for(CH='';CH='^';CH++)SSYM[CH]=NUL;strcpy(KWORD[1],BEGIN);strcpy(KWORD[2],CALL);strcpy(KWORD[3],CONST);strcpy(KWORD[4],DO);strcpy(KWORD[5],ELSE);strcpy(KWORD[6],END);strcpy(KWORD[7],FOR);strcpy(KWORD[8],IF);strcpy(KWORD[9],ODD);strcpy(KWORD[10],PROCEDURE);strcpy(KWORD[11],PROGRAM);strcpy(KWORD[12],READ);strcpy(KWORD[13],RETURN);strcpy(KWORD[14],STEP);strcpy(KWORD[15],THEN);strcpy(KWORD[16],UNTIL);strcpy(KWORD[17],VAR);strcpy(KWORD[18],WHILE);strcpy(KWORD[19],WRITE);WSYM[1]=BEGINSYM;WSYM[2]=CALLSYM;WSYM[3]=CONSTSYM;WSYM[4]=DOSYM;WSYM[5]=ELSESYM;WSYM[6]=ENDSYM;WSYM[7]=FORSYM;WSYM[8]=IFSYM;WSYM[9]=ODDSYM;WSYM[10]=PROCSYM;WSYM[11]=PROGSYM;WSYM[12]=READSYM;WSYM[13]=RETURNSYM;WSYM[14]=STEPSYM;WSYM[15]=THENSYM;WSYM[16]=UNTILSYM;WSYM[17]=VARSYM;WSYM[18]=WHILESYM;WSYM[19]=WRITESYM;SSYM['+']=PLUS;SSYM['-']=MINUS;SSYM['*']=TIMES;SSYM['/']=SLASH;SSYM['(']=LPAREN;SSYM[')']=RPAREN;SSYM['=']=EQL;SSYM[',']=COMMA;SSYM['.']=PERIOD;//SSYM['#']=NEQ;注释掉SSYM[';']=SEMICOLON;SSYM['&']=ANDSYM;SSYM['!']=NOTSYM;然后在STATEMENT(SYMSETFSYS,intLEV,int&TX)函数中增加:caseFORSYM:GetSym();break;caseTOSYM:GetSym();break;caseDOWNTOSYM:GetSym();break;caseRETURNSYM:GetSym();break;增加运算符在GetSym()函数中增加:elseif(CH=='*'){GetCh();if(CH=='='){SYM=TIMESBECOMES;GetCh();}elseSYM=TIMES;}elseif(CH=='/'){GetCh();if(CH=='='){SYM=SLASHBECOMES;GetCh();}elseSYM=SLASH;}elseif(CH=='&'){SYM=ANDSYM;GetCh();}elseif(CH=='|'){GetCh();if(CH=='|'){SYM=ORSYM;GetCh();}elseError(