王超-计科1-38-词法分析器实验报告词法分析器设计一、实验目的:对C语言的一个子集设计并实现一个简单的词法分析器,掌握利用状态转换图设计词法分析器的基本方法。利用该词法分析器完成对源程序字符串的词法分析。输出形式是源程序的单词符号二元式的代码,并保存到文件中。二、实验内容:1.设计原理词法分析的任务:从左至右逐个字符地对源程序进行扫描,产生一个个单词符号。理论基础:有限自动机、正规文法、正规式词法分析器(LexicalAnalyzer)又称扫描器(Scanner):执行词法分析的程序2.词法分析器的功能和输出形式功能:输入源程序、输出单词符号程序语言的单词符号一般分为以下五种:关键字、标识符、常数、运算符,界符3.输出的单词符号的表示形式:单词种别用整数编码,关键字一字一种,标识符统归为一种,常数一种,各种符号各一种。4.词法分析器的结构预处理子程序扫描器输入缓冲区扫描缓冲区单词符号列表输入5.状态转换图实现012*34*567*89101112:错误错误开始字符字符/数字数字数字字符/数字==其他其他+-*/#=,.;其中2,4,5,7,8,9,11是结束状态三、程序设计1.总体模块设计/*用来存储目标文件名*/stringfile_name;/*提取文本文件中的信息。*/stringGetText();/*获得一个单词符号,从位置i开始查找。并且有一个引用参数j,用来返回这个单词最后一个字符在str的位置。*/stringGetWord(stringstr,inti,int&j);/*这个函数用来除去字符串中连续的空格和换行intDeleteNull(stringstr,inti);/*判断i当前所指的字符是否为一个分界符,是的话返回真,反之假*/boolIsBoundary(stringstr,inti);/*判断i当前所指的字符是否为一个运算符,是的话返回真,反之假*/boolIsOperation(stringstr,inti);/*此函数将一个pair数组输出到一个文件中*/voidOutFile(vectorpairint,stringv);/*此函数接受一个字符串数组,对它进行词法分析,返回一个pair型数组*/vectorpairint,stringanalyst(vectorstringvec);/*此函数判断传递的参数是否为关键字,是的话,返回真,反之返回假*/boolIsKey(stringstr);2.各模块设计(1).首先根据上面单词符号表及ID和NUM的正规定义式,构造出状态转换图;(2).定义相关的变量和数据结构。关键字作为特殊标识符处理,把它们预先安排在一张表格中(称为关键字表),当扫描程序识别出标识符时,查关键字表。如能查到匹配的单词,则该单词为关键字,否则为一般标识符。关键字表为一个字符串数组,其描述如下:charKEY_WORDS[7]={″main″,″int″,″char″,″if″,″else″,″for″,″while″};用以存放单词符号二元式的数据结构可如下定义:classWord_Analyzer{public:charContent[MAXLENGTH];intval;voidprint();};(3).按照编译程序一遍扫描的要求,把词法分析器Scaner作为一个独立的子程序来设计,通过对Scaner的反复调用识别出所有的单词符号;(4).当Scaner识别出一个单词符号时,则将该单词符号的二元式写入到输出文件中。若Scaner无法识别出一个单词符号时,则调用错误处理程序PrintError,显示当前扫描到的字符及其所在行、列位置,并跳过该字符重新开始识别单词符号。四、程序代码#includeiostream#includevector#includestring#includefstreamusingnamespacestd;/*用来存储目标文件名*/stringfile_name;/*提取文本文件中的信息。*/stringGetText();/*获得一个单词符号,从位置i开始查找。//并且有一个引用参数j,用来返回这个单词最后一个字符在str的位置。*/stringGetWord(stringstr,inti,int&j);/*这个函数用来除去字符串中连续的空格和换行//第一个参数为目标字符串,第二个参数为开始位置//返回值为连续的空格和换行后的第一个有效字符在字符串的位置*/intDeleteNull(stringstr,inti);/*判断i当前所指的字符是否为一个分界符,是的话返回真,反之假*/boolIsBoundary(stringstr,inti);/*判断i当前所指的字符是否为一个运算符,是的话返回真,反之假*/boolIsOperation(stringstr,inti);/*此函数将一个pair数组输出到一个文件中*/voidOutFile(vectorpairint,stringv);/*次函数将参数str,digit添加到temp中*/voidadd(stringstr,intdigit,vectorpairint,stringtemp);/*此函数接受一个字符串数组,对它进行词法分析,返回一个pair型数组*/vectorpairint,stringanalyst(vectorstringvec);/*此函数判断传递的参数是否为关键字,是的话,返回真,反之返回假*/boolIsKey(stringstr);intmain(){cout*********************************************************\n;cout*************编译原理课程设计--词法编译器ver1.0*********\n;cout*********************************************************\n;coutendl;stringcom1=;stringcom2=\n;stringfileline=GetText();intbegin=0,end=0;vectorstringarray;do{begin=DeleteNull(fileline,begin);stringnowString;nowString=GetWord(fileline,begin,end);if(end==-1)break;if(nowString.compare(com1)&&nowString.compare(com2))array.push_back(nowString);begin=end+1;}while(true);vectorpairint,stringmid_result;mid_result=analyst(array);OutFile(mid_result);cout*********************************************************\n;cout*程序已完成词法分析,分析结果已经存储在文件file_name中!!!*\n;cout*********************************************************\n;cout感谢使用,谢谢再见!endl;system(pause);return0;}/*提取文本文件中的信息*/stringGetText(){stringfile_name1;cout请输入源文件名(包括路径和后缀名):;cinfile_name1;ifstreaminfile(file_name1.c_str(),ios::in);if(!infile){cerr无法打开文件!file_name1.c_str()!!!endl;exit(-1);}coutendl;charf[1000];infile.getline(f,1000,EOF);infile.close();printf(f);coutendl;returnf;}/*获得一个单词符号,从位置i开始查找。//并且有一个引用参数j,用来返回这个单词最后一个字符在原字符串的位置。*/stringGetWord(stringstr,inti,int&j){stringno_use((){},;\n+=*/-\);j=str.find_first_of(no_use,i);if(j==-1)return;if(i!=j)j--;returnstr.substr(i,j-i+1);}/*这个函数用来除去字符串中连续的空格和换行//第一个参数为目标字符串,第二个参数为开始位置//返回值为连续的空格和换行后的第一个有效字符在字符串的位置*/intDeleteNull(stringstr,inti){for(;;i++)if(str[i]!=''&&str[i]!='\n')returni;}/*判断i当前所指的字符是否为一个分界符,是的话返回真,反之假*/boolIsBoundary(stringstr,inti){intt;chararr[7]={',',';','{','}','(',')',':'};for(t=0;t7;t++)if(str[i]==arr[t])returntrue;returnfalse;}/*判断i当前所指的字符是否为一个运算符,是的话返回真,反之假*/boolIsOperation(stringstr,inti){intt;chararr[8]={'+','-','*','/','=','','','&'};for(t=0;t8;t++)if(str[i]==arr[t])returntrue;returnfalse;}/*此函数将一个个字符串数组输出到一个文件中*/voidOutFile(vectorpairint,stringv){cout请输入目标文件名(包括路径和后缀名):;cinfile_name;ofstreamoutfile(file_name.c_str(),ios::out);if(!outfile){cerr无法打开文件!file_name.c_str()!!!endl;exit(-1);}coutendl;inti;for(i=0;iv.size();i++){outfilev[i].first,\v[i].second\endl;coutv[i].first,\v[i].second\endl;}outfile\n\n*********************************\n;outfile.close();return;}/*此函数判断传递的参数是否为关键字,是的话,返回真,反之返回假*/boolIsKey(stringstr){stringp[7]={main,int,char,if,else,for,while};vectorstringppp(p,p+7);intu;for(u=0;uppp.size();u++)if(!str.compare(ppp[u]))returntrue;returnfalse;}/*此函数接受一个字符串数组,对它进行词法分析,返回一个pair型数组*/vectorpairint,stringanalyst(vectorstringvec){vectorpairint,stringtemp;inti;for(i=0;ivec.size();i++){if(vec[i].size()==1){if(vec[i]==&&vec[i+1]===){stringjk=vec[i];jk.append(vec[++i],0,1);pa