学年第学期《编译原理》实验报告学院(系):计算机科学与工程学院班级:11303070A学号:11303070***姓名:无名氏指导教师:保密式时间:2016年7月目录1.实验目的..............................................12.实验内容及要求........................................13.实验方案设计..........................................13.1编译系统原理介绍.................................13.1.1编译程序介绍................................23.1.2对所写编译程序的源语言的描述................23.2词法分析程序的设计................................33.3语法分析程序设计..................................43.4语义分析和中间代码生成程序的设计..................44.结果及测试分析........................................44.1软件运行环境及限制................................44.2测试数据说明......................................54.3运行结果及功能说明................................55.总结及心得体会........................................711.实验目的根据Sample语言或者自定义的某种语言,设计该语言的编译前端。包括词法分析,语法分析、语义分析及中间代码生成部分。2.实验内容及要求(1)词法分析器输入源程序,输出对应的token表,符号表和词法错误信息。按规则拼单词,并转换成二元形式;滤掉空白符,跳过注释、换行符及一些无用的符号;进行行列计数,用于指出出错的行列号,并复制出错部分;列表打印源程序;发现并定位词法错误;(2)语法分析器输入token串,通过语法分析,寻找其中的语法错误。要求能实现Sample语言或自定义语言中几种最常见的、基本的语法单位的分析:算术表达式、布尔表达式、赋值语句、if语句、for语句、while语句、dowhile语句等。(3)语义分析和中间代码生成输入token串,进行语义分析,修改符号表,寻找其中的语义错误,并生成中间代码。要求能实现Sample语言或自定义语言中几种最常见的、基本的语法单位的分析:算术表达式、布尔表达式、赋值语句、if语句、for语句、while语句、dowhile语句等。实验要求:功能相对完善,有输入、输出描述,有测试数据,并介绍不足。3.实验方案设计3.1编译系统原理介绍编译器逐行扫描高级语言程序源程序,编译的过程如下:(1).词法分析识别关键字、字面量、标识符(变量名、数据名)、运算符、注释行(给人看的,一般不处理)、特殊符号(续行、语句结束、数组)等六类符号,分别归类等待处理。(2).语法分析一个语句看作一串记号(Token)流,由语法分析器进行处理。按照语言的文法检查判定是否是合乎语法的句子。如果是合法句子就以内部格式保存,否则报错。直至检查完整个程序。(3).语义分析语义分析器对各句子的语法做检查:运算符两边类型是否相兼容;该做哪些类型转换(例如,实数向整数赋值要取整);控制转移是否到不该去的地方;是2否有重名或者使语义含糊的记号,等等。如果有错误,则转出错处理,否则可以生成执行代码。(4).中间代码生成中间代码是向目标码过渡的一种编码,其形式尽可能和机器的汇编语言相似,以便下一步的代码生成。但中间码不涉及具体机器的操作码和地址码。采用中间码的好处是可以在中间码上做优化。(5).优化对中间码程序做局部优化和全局(整个程序)优化,目的是使运行更快,占用空间最小。局部优化是合并冗余操作,简化计算,例如x:=0可用一条清零指令替换。全局优化包括改进循环、减少调用次数和快速地址算法等。(6).代码生成由代码生成器生成目标机器的目标码(或汇编)程序,其中包括数据分段、选定寄存器等工作,然后生成机器可执行的代码。3.1.1编译程序介绍编译程序是指把用高级程序设计语言书写的源程序,翻译成等价的机器语言格式目标程序的翻译程序。编译程序属于采用生成性实现途径实现的翻译程序。它以高级程序设计语言书写的源程序作为输入,而以汇编语言或机器语言表示的目标程序作为输出。编译出的目标程序通常还要经历运行阶段,以便在运行程序的支持下运行,加工初始数据,算出所需的计算结果。3.1.2对所写编译程序的源语言的描述Sample语言是一种类PASCAL语言,他以赋值语句为基础,包括顺序、条件和循环三种结构。有变量说明和常量说明,有多种数据类型、如整型、实型、字符型等。它包括如下一些语法成分:(1).数据类型:整型、布尔型、实型和字符类型。(2).表达式:可进行算术、布尔表达式的运算。(3).说明语句:常量说明(用const定义)、变量说明(用var定义)。(4).赋值语句。(5).控制语句:if语句、while语句,repeat语句和for循环语句。(6).Begin…end复合语句。(7).程序(program)语句和结束(end.)语句。33.2词法分析程序的设计初始化打开源文件源程序结束结束一行一行地处理用str[i]存储读到的每个单词根据第一个字符进行分类字母识别标识符/关键字处理注释和除号识别运算符isoperator(str[i])识别数值常数isdigit(str[i])识别界符isbound(str[i])是关键字?在符号表中?NN插入到符号表中在界符表中?N出错处理error注释号YYY图1词法分析总流程词法分析将源程序读入一个个的字符,根据一定的构词规则,识别出各类有用的单词。当输入字母时,开始识别标识符或关键宇,边拼写边从缓冲区读入下一符号,当读入一非字母数字符号时,标识符识别完成,但已多读入一个符号,所以列记数回退。然后查关键字表,判断拼出的符号串是否为关键字。若是关键字,输出其种别码。否则识别的单词就是标识符,同时输出标识符及其种别码。当输入数字时,开始识别整数或实数。边拼写边读入下一符号,当遇到“.”时,还要继续拼写该常数(实数情况)。如果遇到E,要识别带指数的常数,当遇到其它非数字符号时,数字常数拼写完毕,列计数也要退1。输出常数及其种别码。当输入“/”时,开始识别注解或除号,若是注解时,最后两个连续读出的符号是“*/”,不需再读下一符号,列计数不变。当判定是除号“/”时,已多读入一字符,列计数—1,输出“/”的种别码。43.3语法分析程序设计Token文件处理程序头部处理常量说明处理变量说明根据读取的前导字对语句进行分类处理赋值语句处理for语句处理if语句处理while语句处理程序结束部分输出文件end其他Program标识符Forifwhilevarconstbeginbeginvarbegin图2语法分析总流程不断地读入token文件中的单词,根据不同的语句,使用不同的方法进行分析,直到token文件的结束。程序头部以program开头,变量说明以var开头,常量说明是以const开头的,从begin开始就是可执行语句,可执行语句分为五种:for语句(以for语句开头),while语句(以while开头),if语句(以if开头),repeat语句(以repeat开头),赋值语句(以标识符开头)。每当读到前导词,表明一个新的语法结构的开始,以此识别该语法单位是否符合定义。3.4语义分析和中间代码生成程序的设计4.结果及测试分析4.1软件运行环境及限制程序是使用C#语言编写的,开发软件是VS2013。VS是一个基本完整的开发工具集,它包括了整个软件生命周期中所需要的大部分工具,如UML工具、代码管控工具、集成开发环境(IDE)等等。所写的目标代码适用于微软支持的所有平台。使用VS调试程序会很方便,可以实时观察程序的运行状态。用VS制作界面会显得非常地简单,但是也存在一定的缺点。VS的集成度比较高,所以要修改封装好的一些函数不会太简单。54.2测试数据说明输入数据:programexample1;consta:=1;b:=3;c:='fasdf';vara,b,c:integer;x:char;begina:=3;b:=12;if(a+3*cb)thenc:=3;whileabdoc:=5;repeata:=10;untila+3b;forx:=1+2to3dob:=100;end.这是sample语言的一个比较简单的测试程序,它有着sample语言最基本的格式,如函数头部、常量说明、变量说明、执行语句、条件语句,循环语句等等。用这个测试程序来观察程序的效果。4.3运行结果及功能说明图3词法分析结果图3是正常词法分析的结果,可以看出,程序会将每个单词显示到token文件显示区,同时显示单词在源文件的位置。并且会将标识符和常量添加到符号表6并显示到符号表显示区。下面的图4是当测试程序有错误时的情况。图4词法分析有错误的程序可以看到当我在b:=12;后面加上一个“’”后,会出现报错。并且if语句位置上少了个“)”也会出现报错,实现了词法分析的相关功能。图5语法分析结果7从图5看到,语法分析能够正确地处理token串,并分析出各类语句,直到程序的结束。输出结果的显示层次感不强,没有按照一级级地缩进,这里是语法分析的一点问题。下面的图6是语法分析处理错误的功能演示。图6语法分析错误处理我修改了程序的部分地方,通过语法分析就能够检测到错误的地方,并显示出错误可能的原因,并且能够在错误的前提下继续执行后面的程序,直到语法分析结束。5.总结及心得体会通过编译原理实验课,我掌握了什么是编译程序,编译程序工作的基本过程及其各阶段的基本任务,熟悉了编译程序总流程框图,了解了编译程序的生成过程、构造工具及其相关的技术对课本上的知识有了更深的理解,课本上的知识是机械的,表面的。通过把该算法的内容,算法的执行顺序在计算机上实现,把原来以为很深奥的书本知识变的更为简单,对实验原理有更深的理解。然而,我认为自己在实验课上做的并不够好。首先,在总体实验内容来说,我没能够完成所有的内容,只完成了词法分析和语法分析的程序;其次,就完成的两个实验来说,功能上还是不够完善,有一些bug。最后,运行界面上过于简陋,不够美观。由于时间的有限性,这些不足是无法继续改善了。这也让我意识到对于做每一件事,你的付出时间和你的成果是成正比的。所以,对于做一件事,要舍得花时间,肯花时间,这样最后的效果才会更好。对于编译原理,整体看下来自己做得不算好。意识到不足,我更加地明白自己能力不够强。在今后的学习里,需要更加地努力才行,能力越强,自己的提升空间就会越大,完成一件事的效率也才会更高。争取在以后做一个高效率,强能力的人。