辽宁师范大学计算机与信息技术学院综合性实验报告课程名称:编译原理实验题目:一个简单语言的词法分析器学生姓名:专业:计算机科学与技术学号:实验日期:【实验目的】1.理解正规式和有限自动机的作用;进一步理解自动机理论。2.用状态图和状态矩阵表示有限自动机;3.以程序实现有限自动机的运行过程;4.掌握正规式转换成自动机的技术及有穷自动机实现的方法。【实验内容】利用正规表达式和自动机手段,设计各类单词的自动机表示及组合自动机表示,生成并调试程序,实现词法分析。【实验要求】1.待分析的简单的词法(1)关键字:beginifthenwhiledoend所有的关键字都是小写。(2)运算符和界符:=+-*/===;()#(3)其他单词是标识符(ID)和整型常数(SUM),通过以下正规式定义:ID=letter(letter|digit)*NUM=digitdigit*(4)空格有空白、制表符和换行符组成。空格一般用来分隔ID、SUM、运算符、界符和关键字,词法分析阶段通常被忽略。2.各种单词符号对应的种别码:3.词法分析程序的功能:输入:所给文法的源程序字符串。输出:二元组(syn,token或sum)构成的序列。其中:syn为单词种别码;token为存放的单词自身字符串;sum为整型常数。例:对源程序beginx:=9;ifx9thenx:=2*x+1/3;end#的源文件,经过词法分析后输出如下序列:(1,begin)(10,x)(18,:=)(11,9)(26,:)(2,if)(10,x)(23,)(11,9)(3,then)(10,x)(18,:=)(11,2)(15,*)(10,x)(13,+)(11,1)(16,/)(11,3)(26,;)(6,end)(0,#)……【实验过程】程序思路:首先定义关键字数组,把题目设置的关键字存入;读入源程序,对其进行词法分析;从input串中一个字符一个字符的赋值给ch,并对其进行分析:当为空格符时跳过;为字母时将其存入token数组;继续判断它的下一个字符,若为字符或数字则存入token数组,直至出现空格符;当为数字时,存入token数组,并判断其下一字符;当为字符“+”、“-”、“/”、“;”、“(”、“)”、“#”时,则直接对应的种别码;然而当碰到字符“:”“”“”时,则需要判断它的下一字符是否为“=”“”,因为有可能是“:=”“”“=”“=”。程序代码如下:#includestdio.h#includestring.h#includeiostream.hchar*keyword[6]={begin,if,then,while,do,end};//关键字charinput[80];//输入串chartoken[8];//单词自身字符串charch;intsyn;//单词种别码intsum=0;//整型常数intp;//input下标intm=0;//token下标intn,i;voidautomata(){//自动机for(i=0;i8;i++)token[i]=NULL;ch=input[p++];while(ch=='')ch=input[p++];//跳过空格//标识符:字母或以字母开头和数字组成的ID=letter(letter|digit)*if((ch='a'&&ch='z')||(ch='A'&&ch='Z')){m=0;while((ch='0'&&ch='9')||(ch='a'&&ch='z')||(ch='A'&&ch='Z')){token[m++]=ch;ch=input[p++];//识别出一个标识符}token[m++]='\0';p--;//回退一位syn=10;//单纯的标识符(自定义的)for(i=0;i6;i++)//将识别出来的字符和关键字做比较if(strcmp(token,keyword[i])==0){syn=i+1;//关键字种别码break;}}//数字NUM=digitdigit*elseif(ch='0'&&ch='9'){sum=0;while(ch='0'&&ch='9'){sum=sum*10+ch-'0';ch=input[p++];//读取下一个字符}p--;//回退一下syn=11;//11标识数值类型}//符号elseswitch(ch){//其他字符case'#':syn=0;token[0]=ch;break;case'+':syn=13;token[0]=ch;break;case'-':syn=14;token[0]=ch;break;case'*':syn=15;token[0]=ch;break;case'/':syn=16;token[0]=ch;break;case':':m=0;token[m++]=ch;//读取下一个字符ch=input[p++];if(ch=='='){syn=18;//:=token[m++]=ch;//读取下一个字符}else{syn=17;//:p--;}break;case'':m=0;token[m++]=ch;ch=input[p++];//读取下一个字符if(ch==''){syn=21;//token[m++]=ch;//读取下一个字符}elseif(ch=='='){syn=22;//=token[m++]=ch;//读取下一个字符}else{syn=20;//p--;}break;case'':m=0;token[m++]=ch;//读取下一个字符ch=input[p++];if(ch=='='){syn=24;//=token[m++]=ch;//读取下一个字符}else{syn=23;//p--;}break;case'=':syn=25;token[0]=ch;break;case';':syn=26;token[0]=ch;break;case'(':syn=27;token[0]=ch;break;case')':syn=28;token[0]=ch;break;case'\n':break;default:break;}}voidmain(){coutPleaseinputstring:endl;cin.getline(input,80);p=0;do{automata();//自动机if(syn==11)cout(syn,sum)endl;//常数elsecout(syn,token)endl;//符号}while(syn!=0);//#}运行结果截屏:【实验结果分析】