实验一词法分析设计实验学时:4实验类型:综合实验要求:必修一、实验目的通过本实验的编程实践,使学生了解词法分析的任务,掌握词法分析程序设计的原理和构造方法,使学生对编译的基本概念、原理和方法有完整的和清楚的理解,并能正确地、熟练地运用。二、实验内容用VC++/VB/JAVA语言实现对C语言子集的源程序进行词法分析。通过输入源程序从左到右对字符串进行扫描和分解,依次输出各个单词的内部编码及单词符号自身值;若遇到错误则显示“Error”,然后跳过错误部分继续显示;同时进行标识符登记符号表的管理。以下是实现词法分析设计的主要工作:(1)从源程序文件中读入字符。(2)统计行数和列数用于错误单词的定位。(3)删除空格类字符,包括回车、制表符空格。(4)按拼写单词,并用(内码,属性)二元式表示。(属性值——token的机内表示)(5)如果发现错误则报告出错(6)根据需要是否填写标识符表供以后各阶段使用。单词的基本分类:关键字:由程序语言定义的具有固定意义的标识符。也称为保留字例如if、for、while、printf;单词种别码为1。标识符:用以表示各种名字,如变量名、数组名、函数名;常数:任何数值常数。如125,1,0.5,3.1416;运算符:+、-、*、/;关系运算符:、=、=、、=、;分界符:;、,、(、)、[、];三、实验要求1、编程时注意编程风格:空行的使用、注释的使用、缩进的使用等。2、将标识符填写的相应符号表须提供给编译程序的以后各阶段使用。3、根据测试数据进行测试。测试实例应包括以下三个部分:全部合法的输入。各种组合的非法输入。由记号组成的句子。4、词法分析程序设计要求输出形式:例:输入VC++语言的实例程序:Ifi=0thenn++;a﹤=3b%);输出形式为:单词二元序列类型位置(行,列)(单词种别,单词属性)for(1,for)关键字(1,1)i(6,i)标识符(1,2)=(4,=)关系运算符(1,3)0(5,0)常数(1,4)then(1,then)关键字(1,5)n(6,n)标识符(1,6)++ErrorError(1,7);(2,;)分界符(1,8)a(6,a)标识符(2,1)﹤=(4,=)关系运算符(2,2)3bErrorError(2,4)%ErrorError(2,4))(2,))分界符(2,5);(2,;)分界符(2,6)实验报告正文:功能描述:该程序具有词法分析功能,即面对一段程序源代码,通过该程序,能检查出源代码是否由词法错误。三、词法分析实验设计思想及算法:首先构造六个表,key[]={auto,break,case,catch,char,class,const,continue,default,delete,do,double,else,enum,float,for,if,int,long,new,private,protected,public,register,return,short,static,struct,switch,this,void,while,then};关键字表,单词种别码1;Delimiter[]={;,(,),[,],,,.,{,}};分界符表单词种别码2Operator[]={+,-,*,/};算术运算符表单词种别码3R_operators[]={,=,==,,=},关键字表,单词种别码1;stringNumber[100];常数表单词种别码5;stringIdentifier[100];标示符表单词种别码6;构造关键字判断函数Iskey(),字母判断函数Isletter(),数字判断函数Isnumber();构造标示符判别函数InsertId(),若输入的标示符在标示符数组Identifier[]中,返回其下标,若不在,将该标示符插到数组末尾。构造标示符判别函数InsertNumber(),若输入的数字在数字数组Number[]中,返回其下标,若不在,将该数字插到数组末尾。具体分析函数analyse()具体实现输入源代码的识别。anaiyse()构造思路,程序设计图:综合以上分析,画出整个程序的运行分析程序图,如下:开始输入源文件路径路径是否有效是初始化文件指针否将字符加入字符数组Word[]是空格,空白或换行吗是字母吗是数字吗否否是界符吗否打开源文件跳过该字符是是文件结束?否将字符加入字符数组Word[]否将字符加入字符数组Word[]是指向下一字符识别指针内容指向下一字符是字母惑数字吗是将word与关键字表key进行匹配否匹配?是输出word为关键字输出word为普通标示符否将字符加入字符数组Word[]指向下一字符输出word为常数识别指针内容回退是数字吗是否输出word为界符指向下一字符结束是输出Word内容为不可识别将字符加入字符数组Word[]整个程序的运行分析程序图软件的测试方法和测试结果:首先,将要分析的源代码写入一个文本,存于磁盘中,然后运行程序,输入源代码文件存放的路径,若输入路径正确,程序将自动分析源代码,若输入路径不正确,程序将显示,路径错误,请重新输入的提示。下面为具体的运行实例:源代码为:Ifi=0thenn++;a﹤=3b%)输出满足要求。实验总结(设计的特点、不足、收获与体会):通过此次实验,让我了解到如何设计、编制并调试词法分析程序,熟悉了构造词法分析程序的手工方式的相关原理,加深了对编译原理词法分析的理解,本次使用C++语言直接编写此法分析程序,也让我重新熟悉了C++语言的相关内容,加深了对C++语言的用途的理解。本程序的数据输入采取直接从文件中读取,而不是由键盘输入,因此在测试过程中,输入得到大大简化,但是本程序的关键字表只初始化了一部分关键字,还可继续扩充(只需扩大数组,向其中补充要添加的关键字),而且程序的测试数据存在不足,程序可能存在未发现的漏洞,以上两点有待改善。附录该程序的源代码:#includeiostream#includestringusingnamespacestd;//数据定义#defineMAX33charch='';staticintline=1,row=0;intNumberCount=0,IdCount=0;stringkey[]={auto,break,case,catch,char,class,const,continue,default,delete,do,double,else,enum,float,for,if,int,long,new,private,protected,public,register,return,short,static,struct,switch,this,void,while,then};//关键字表单词种别码1stringDelimiter[]={;,(,),[,],,,.,{,}};//分界符表单词种别码2stringOperator[]={+,-,*,/};//算术运算符表单词种别码3stringR_operators[]={,=,==,,=};//关系运算符表单词种别码4stringNumber[100];//常数表单词种别码5stringIdentifier[100];//标示符表单词种别码6//数据分析intIskey(stringc){//关键字判断inti;for(i=0;iMAX;i++){if(key[i].compare(c)==0)return1;}return0;}//判断是否为字母intIsLetter(charc){if(((c='z')&&(c='a'))||((c='Z')&&(c='A'))){if((ch='Z')&&(ch='A'))ch=ch+32;//转换成小写return1;}elsereturn0;}intIsNumber(charc){//判断是否为数字if(c='0'&&c='9')return1;elsereturn0;}//将arr中的标示符插入符号表并且返回符号表的指针intInsertId(strings){for(inti=0;iIdCount;i++){if(Identifier[i]==s){returni;break;}elseif(IdCount==i+1){Identifier[IdCount]=s;returnIdCount;IdCount++;}}}//将arr中的常实数插入常数表并且返回常数表的指针intInsertNumber(strings){for(inti=0;iNumberCount;i++){if(Number[i]==s){returni;break;}elseif(NumberCount==i+1){Number[NumberCount]=s;returnNumberCount;NumberCount++;}}}voidanalyse(FILE*fpin){//arr相当于课本中的strTokenstringarr=;while((ch=fgetc(fpin))!=EOF)//判断是否读取到文件末尾或者读取出错{arr=;if(ch==''||ch=='\t'||ch=='\n')//删除空格类字符,包括回车、制表符空格{if(ch=='\n'){line++;row=0;}}elseif(IsLetter(ch)){while(IsLetter(ch)||IsNumber(ch)){arr=arr+ch;ch=fgetc(fpin);}fseek(fpin,-1L,SEEK_CUR);//文件指针回移一个位置if(Iskey(arr)){row++;//识别出一个字符,列增加一coutarr\t\t(1,arr)\t\t关键字\t\t(line,row)endl;}else{row++;//识别出一个字符,列增加一InsertId(arr);coutarr\t\t(6,arr)\t\t标识符\t\t(line,row)endl;}}//处理常数elseif(IsNumber(ch)){while(IsNumber(ch))//||ch=='.'&&IsNumber(fgetc(fpin)){arr=arr+ch;ch=fgetc(fpin);}if(IsLetter(ch)){while(IsLetter(ch)||IsNumber(ch)){arr=arr+ch;ch=fgetc(fpin);}fseek(fpin,-1L,SEEK_CUR);row++;coutarr\t\tError\t\tError\t\t(line,row)endl;}else{InsertNumber(arr);row++;//识别出一个字符,列增加一coutarr\t\t(5,arr)\t\t常数\t\t(line,row)endl;}}//处理算符else{row++;arr=ch;switch(ch){case'+':{ch=fgetc(fpin);if(ch=='('||IsNumber(ch)||IsLetter(ch)){fseek(fpin,-1L,SEEK_CUR);cout+\t\t(3,+)\t\t算术运算符\t\t(line,row)endl;}elsecoutarr+ch\t\tError\t\tError\t\t(line,row)endl;}break;case'-':{ch=fgetc(fpin);if(ch=='('||IsNumber(ch)||IsLetter(ch)){fseek(fpin,-1L,SEEK_CUR);cout-\t\t(3,-)\t\t算术运算符\t\t(line,ro