1课程设计班级:21301学号:1361080108姓名:马瑞泽百度2一.课程设计目的在分析理解一个教学型编译程序(如PL/0)的基础上,对其词法分析程序、语法分析程序和语义处理程序进行部分修改扩充。达到进一步了解程序编译过程的基本原理和基本实现方法的目的。二.课程设计要求1.基本内容(1)扩充赋值运算:+=和-=(2)扩充语句(Pascal的FOR语句):①FOR变量:=表达式TO表达式DO语句②FOR变量:=表达式DOWNTO表达式DO语句其中,语句①的循环变量的步长为2,语句②的循环变量的步长为-2。2.选做内容(1)增加运算:++和--。(2)增加类型:①字符类型;②实数类型。(3)扩充函数:①有返回值和返回语句;②有参数函数。(4)增加一维数组类型(可增加指令)。(5)其他典型语言设施。3.本人在课程设计中已实现的功能(1)增加单词:保留字ELSE,FOR,TO,DOWNTO,REPEAT,UNTIL,RETURN运算符+=,-=,++,--(2)修改单词:不等号#改为(3)增加条件语句的ELSE子句(4)扩充赋值运算:+=和-=(5)扩充语句①FOR变量:=表达式TO表达式DO语句②FOR变量:=表达式DOWNTO表达式DO语句(6)增加运算:++和--(包括前后++、--运算)(7)增加一维数组类型3(8)其他典型语言设施:REPEAT语句UNTIL语句三.课程设计环境与工具(1)计算机及操作系统:PC机,Win7(2)实现工具:VC++6.0,C语言(3)教学型编译程序:PL/0四.结构设计说明1)PL/0编译程序的结构图2)PL/0编译程序的过程或函数的功能表过程或函数名简要功能说明pl0主程序error出错处理,打印出错位置和错误编码getsym词法分析,读取一个单词getch漏掉空格,读取一个字符gen生成目标代码,并送入目标程序区test测试当前单词符号是否合法block分程序分析处理过程enter登录名字表position(函数)查找标识符在名字表中的位置constdeclaration常量定义处理vardeclaration变量说明处理listode列出目标代码清单statement语句处理expression表达式处理term项处理4factor因子处理condition条件处理interpret对目标代码的解释执行程序base(函数)通过静态链求出数据区的基地址3)PL/0编译程序的总体流程图4)词法分析词法分析是编译的第一个阶段,它的主要任务是从左向右逐个字符地对源程序进行扫描,产生一个个单词序列用于语法分析。PL/0词法分析程序GETSYM的功能是为语法分析提供单词用的,是语法分析的基础,把输入的字符串形式的源程序分割成一个个单词符号。经过词法分析程序分析出来的单词,对语言固有的单词只给出类别存放在全程变量SYM中,而对用户定义的单词(标识符或常数)既给出类别又给值,其类别放在SYM中,值放在全程变量ID或全程变量NUM中,全部单词种类由编译程序定义的纯量类型SYMBOL给出,称为语法词汇表。词法分析器的分析过程:调用GETSYM时,它通过GETCH过程从源程序中获得一个字符。如果这个字符是字母,则继续获取字符或数字,最终可以拼成一个单词,查保留字表,如果查到为保留字,则把SYM变量赋成相应的保留字类型值;如果没有查到,则这个单词应是一个用户自定义的标识符(可能是变量名、常量名或是过程的名字),把SYM置为IDENT,把这个单词存入ID变量。查保留字表时使用了二分法查找以提高效率。如果Getch获得的字符是数字,则继续用Getch获取数字,并把它们拼成一个整数或实数,然后把SYM置为INTEGER,并把拼成的数值放入NUM变量。如果识别出其它合法的符号(比如:赋值号、大于号、小于等于号等),则把SYM则成相应的类型。如果遇到不合法的字符,把SYM置成启动置初值调用getsym取单词调用block过程是否为源程序结束符源程序是否有错误调用解释过程interpret解释执行目标执行目标程序结束出错打印错误NNYY5NUL。词法分析程序GETSYM将完成下列任务:(1)滤空格(2)识别保留字(3)识别标识符(4)拼数(5)拼复合词(6)输出源程序5)语法分析PL/0编译程序的语法分析采用了自顶向下的递归的子程序法。语法分析同时也根据程序的语义生成相应三元代码,并提供了出错处理的机制。语法分析主要由分程序分析过程(BLOCK)、常量定义分析过程(ConstDeclaration)、变量定义分析过程(Vardeclaration)、语句分析过程(Statement)、表达式处理过程(Expression)、项处理过程(Term)、因子处理过程(Factor)和条件处理过程(Condition)构成。这些过程在结构上构成一个嵌套的层次结构。除此之外,还有出错报告过程(Error)、代码生成过程(Gen)、测试单词合法性及出错恢复过程(Test)、登录名字表过程(Enter)、查询名字表函数(Position)以及列出类PCODE代码过程(Listcode)作过语法分析的辅助过程。由PL/0的语法图可知:一个完整的PL/0程序是由分程序和句号构成的。因此,本编译程序在运行的时候,通过主程序中调用分程序处理过程block来分析分程序部分(分程序分析过程中还可能会递归调用block过程),然后,判断最程序分程序语句条件表达式项因子PL/0语法调用关系图6后读入的符号是否为句号。如果是句号且分程序分析中未出错,则是一个合法的PL/0程序,可以运行生成的代码,否则就说明源PL/0程序是不合法的,输出出错提示即可。76)语义分析PL/0的语义分析主要进行以下检查:(1)是否存在标识符先引用未声明的情况;(2)是否存在己声明的标识符的错误引用;(3)是否存在一般标识符的多重声明。7)中间代码生成目标代码类pcode是一种假想栈式计算机的汇编语言。自己添加覆盖了OPR014栈顶值输出至屏幕(字符型)OPR015栈顶值输出至屏幕(整数型)OPR016栈顶值输出至屏幕(实数型)OPR017屏幕输出换行OPR018从命令行读入一个字符输入置于栈顶OPR019从命令行读入一个整数输入置于栈顶OPR020从命令行读入一个实数输入置于栈顶8)语法错误处理PL/0编译程序对语法错误的处理采用两种办法:(1)对于一些易于校正的错误,如丢了逗号、分号等,指出出错的位置,加以校正,继续进行分析。(2)对于难于校正的错误,给出错误的位置与性质,跳过后面一些单词,直到下一个可以进行正常语法分析的语法单位。错误类型如下0过程开始部分说明不正确1常数说明中=写成:=2常数说明中=后应为整数或实数或字符3常数说明中的标识符后应是=84const,var,procedure后应为标识符5漏掉了,或;6过程说明后的符号不正确(应该是语句开始符,或过程定义符)7应是语句开始符8程序体内语句部分的后跟符不正确9程序结尾丢了句号.10语句间漏了;11标识符未说明12赋值语句中,赋值号左部标识符属性应是变量13变量后不能是此符号14call后应为标识符15call后标识符属性应为过程16条件语句中丢了then17丢了end或;18while型循环语句丢了do19语句后的符号不正确20应为关系运算符21表达式内标识符属性不能是过程22表达式中漏掉右括号(23因子后的非法符号24表达式的开始符不能是此符号31数越界补充说明了:32read或write语句括号中的标识符不是变量33read或write语句缺少右括号)34read或write语句缺少左括号(35read或write括号里应为变量自己增加了:45++或--后面应为变量46repeat缺少until47for语句错误48for语句缺少do49类型值不匹配50类型无法转换51只有整数能++或--52类型不正确9五.设计过程(一)实验内容1.增加单词:保留字ELSE,FOR,TO,DOWNTO,REPEAT,UNTIL,RETURN运算符+=(PLUSBK),-=(MINUSBK),++(INC),--(DEC)首先要扩展SYMBOL,在此基础上再进行其它细节的修改。要添加的SYMBOL为:typedefenum{NUL,IDENT,NUMBER,PLUS,MINUS,TIMES,SLASH,ODDSYM,EQL,NEQ,LSS,LEQ,GTR,GEQ,LPAREN,RPAREN,COMMA,SEMICOLON,PERIOD,BECOMES,BEGINSYM,ENDSYM,IFSYM,THENSYM,WHILESYM,WRITESYM,READSYM,DOSYM,CALLSYM,CONSTSYM,VARSYM,PROCSYM,PROGSYM,ELSESYM,FORSYM,TOSYM,DOWNTOSYM,REPEATSYM,UNTILSYM,RETURNSYM,PLUSBK,MINUSBK,INC,DEC}SYMBOL;char*SYMOUT[]={NUL,IDENT,NUMBER,PLUS,MINUS,TIMES,SLASH,ODDSYM,EQL,NEQ,LSS,LEQ,GTR,GEQ,LPAREN,RPAREN,COMMA,SEMICOLON,PERIOD,BECOMES,BEGINSYM,ENDSYM,IFSYM,THENSYM,WHILESYM,WRITESYM,READSYM,DOSYM,CALLSYM,CONSTSYM,VARSYM,PROCSYM,PROGSYM,ELSE,FOR,TO,DOWNTO,REPEAT,UNTIL,RETURN,PLUSBK,MINUSBK,INC”TESTSYM在S1中?打印出错编号nS1:=S1+S2SYM在S1中?GETSYM返回YYNNTEST测试过程流程图10DEC};其中黑斜体为新加入的SYMBOL。再将ELSE,FOR,TO,DOWNTO,,REPEAT,UNTIL,RETURN,PLUSBK,MINUSBK,INC,DEC关键字加到KWORD和将相应的SYM加到WSYM,按字母顺序排列。以及修改NEQ后如下void__fastcallTForm1::ButtonRunClick(TObject*Sender){for(CH='';CH='^';CH++)SSYM[CH]=NUL;strcpy(KWORD[1],BEGIN);strcpy(KWORD[2],CALL);strcpy(KWORD[3],CONST);strcpy(KWORD[4],DEC);strcpy(KWORD[5],DO);strcpy(KWORD[6],DOWHILE);strcpy(KWORD[7],DOWNTO);strcpy(KWORD[8],ELSE);strcpy(KWORD[9],END);strcpy(KWORD[10],FOR);strcpy(KWORD[11],IF);strcpy(KWORD[12],INC);strcpy(KWORD[13],MINUSBK);strcpy(KWORD[14],ODD);strcpy(KWORD[15],PLUSBK);strcpy(KWORD[16],PROCEDURE);strcpy(KWORD[17],PROGRAM);strcpy(KWORD[18],READ);strcpy(KWORD[19],REPEAT);strcpy(KWORD[20],RETURN);strcpy(KWORD[21],THEN);strcpy(KWORD[22],TO);strcpy(KWORD[23],VAR);strcpy(KWORD[24],UNTIL);strcpy(KWORD[25],WHILE);strcpy(KWORD[26],WRITE);WSYM[1]=BEGINSYM;WSYM[2]=CALLSYM;WSYM[3]=CONSTSYM;WSY