1.实验目的及要求本次实验通过用C语言设计、编制、调试一个词法分析子程序,识别单词,实现一个C语言词法分析器,经过此过程可以加深对编译器解析单词流的过程的了解。运行环境:硬件:windowsxp软件:visualc++6.02.实验步骤1.查询资料,了解词法分析器的工作过程与原理。2.分析题目,整理出基本设计思路。3.实践编码,将设计思想转换用c语言编码实现,编译运行。4.测试功能,多次设置包含不同字符,关键字的待解析文件,仔细察看运行结果,检测该分析器的分析结果是否正确。通过最终的测试发现问题,逐渐完善代码中设置的分析对象与关键字表,拓宽分析范围提高分析能力。3.实验内容本实验中将c语言单词符号分成了四类:关键字key(特别的将main说明为主函数)、普通标示符、常数和界符。将关键字初始化在一个字符型指针数组*key[]中,将界符分别由程序中的case列出。在词法分析过程中,关键字表和case列出的界符的内容是固定不变的(由程序中的初始化确定),因此,从源文件字符串中识别出现的关键字,界符只能从其中选取。标识符、常数是在分析过程中不断形成的。对于一个具体源程序而言,在扫描字符串时识别出一个单词,若这个单词的类型是关键字、普通标示符、常数或界符中之一,那么就将此单词以文字说明的形式输出.每次调用词法分析程序,它均能自动继续扫描下去,形成下一个单词,直到整个源程序全部扫描完毕,从而形成相应的单词串。输出形式例如:void$关键字流程图、程序流程图:开始输入源文件路径路径是否有效是初始化文件指针否将字符加入字符数组Word[]是空格,空白或换行吗是字母吗是数字吗否否是界符吗否打开源文件跳过该字符是是文件结束?否将字符加入字符数组Word[]否将字符加入字符数组Word[]是指向下一字符识别指针内容指向下一字符是字母惑数字吗是将word与关键字表key进行匹配否匹配?是输出word为关键字输出word为普通标示符否将字符加入字符数组Word[]指向下一字符输出word为常数识别指针内容回退是数字吗是否输出word为界符指向下一字符结束是输出Word内容为不可识别将字符加入字符数组Word[]程序:#includestring.h#includestdio.h#includestdlib.h#includectype.h//定义关键字char*Key[10]={main,void,int,char,printf,scanf,else,if,return};charWord[20],ch;//存储识别出的单词流intIsAlpha(charc){//判断是否为字母if(((c='z')&&(c='a'))||((c='Z')&&(c='A')))return1;elsereturn0;}intIsNum(charc){//判断是否为数字if(c='0'&&c='9')return1;elsereturn0;}intIsKey(char*Word){//识别关键字函数intm,i;for(i=0;i9;i++){if((m=strcmp(Word,Key[i]))==0){if(i==0)return2;return1;}}return0;}voidscanner(FILE*fp){//扫描函数charWord[20]={'\0'};charch;inti,c;ch=fgetc(fp);//获取字符,指针fp并自动指向下一个字符if(IsAlpha(ch)){//判断该字符是否是字母Word[0]=ch;ch=fgetc(fp);i=1;while(IsNum(ch)||IsAlpha(ch)){//判断该字符是否是字母或数字Word[i]=ch;i++;ch=fgetc(fp);}Word[i]='\0';//'\0'代表字符结束(空格)fseek(fp,-1,1);//回退一个字符c=IsKey(Word);//判断是否是关键字if(c==0)printf(%s\t$普通标识符\n\n,Word);//不是关键字elseif(c==2)printf(%s\t$主函数\n\n,Word);elseprintf(%s\t$关键字\n\n,Word);//输出关键字}else//开始判断的字符不是字母if(IsNum(ch)){//判断是否是数字Word[0]=ch;ch=fgetc(fp);i=1;while(IsNum(ch)){Word[i]=ch;i++;ch=fgetc(fp);}Word[i]='\0';fseek(fp,-1,1);//回退printf(%s\t$无符号实数\n\n,Word);}else//开始判断的字符不是字母也不是数字{Word[0]=ch;switch(ch){case'[':case']':case'(':case')':case'{':case'}':case',':case'':case';':printf(%s\t$界符\n\n,Word);break;case'+':ch=fgetc(fp);Word[1]=ch;if(ch=='='){printf(%s\t$运算符\n\n,Word);//运算符“+=”}elseif(ch=='+'){printf(%s\t$运算符\n\n,Word);//判断结果为“++”}else{fseek(fp,-1,1);printf(%s\t$运算符\n\n,Word);//判断结果为“+”}break;case'-':ch=fgetc(fp);Word[1]=ch;if(ch=='='){printf(%s\t$运算符\n\n,Word);}elseif(ch=='-'){printf(%s\t$运算符\n\n,Word);//判断结果为“--”}else{fseek(fp,-1,1);printf(%s\t$运算符\n\n,Word);//判断结果为“-”}break;case'*':case'/':case'!':case'=':ch=fgetc(fp);if(ch=='='){printf(%s\t$运算符\n\n,Word);}else{fseek(fp,-1,1);printf(%s\t$运算符\n\n,Word);}break;case'':ch=fgetc(fp);Word[1]=ch;if(ch=='='){printf(%s\t$运算符\n\n,Word);//判断结果为运算符“=”}elseif(ch==''){printf(%s\t$运算符\n\n,Word);//判断结果为“”}else{fseek(fp,-1,1);printf(%s\t$运算符\n\n,Word);//判断结果为“”}break;case'':ch=fgetc(fp);Word[1]=ch;if(ch=='=')printf(%s\t$运算符\n\n,Word);else{fseek(fp,-1,1);printf(%s\t$运算符\n\n,Word);}break;case'%':ch=fgetc(fp);Word[1]=ch;if(ch=='='){printf(%s\t$运算符\n\n,Word);}if(IsAlpha(ch))printf(%s\t$类型标识符\n\n,Word);else{fseek(fp,-1,1);printf(%s\t$取余运算符\n\n,Word);}break;default:printf(无法识别字符!\n\n);break;}}}main(){charin_fn[30];//文件路径FILE*fp;printf(\n请输入源文件名(包括路径和后缀名):);while(1){gets(in_fn);//scanf(%s,in_fn);if((fp=fopen(in_fn,r))!=NULL)break;//读取文件内容,并返回文件指针,该指针指向文件的第一个字符elseprintf(文件路径错误!请重新输入:);}printf(\n*******************词法分析结果如下*******************\n);do{ch=fgetc(fp);if(ch=='#')break;//文件以#结尾,作为扫描结束条件elseif(ch==''||ch=='\t'||ch=='\n'){}//忽略空格,空白,和换行else{fseek(fp,-1,1);//回退一个字节开始识别单词流scanner(fp);}}while(ch!='#');return(0);}4.实验结果解析源文件:voidmain(){inta=3;a+=b;printf(%d,a);return;}#解析结果:5.实验总结分析通过本次实验,让再次浏览了有关c语言的一些基本知识,特别是对文件,字符串进行基本操作的方法。C语言中没有string类型,因此本实验中的对字符串提取与识别均借助#includestring.h及字符型数组来实现。让我练习对字符串函数应用的同时也提高了自己的逻辑思维能力。在本次实验中,我纠正了一个一直以来的概念错误:main不是关键字,它定义为程序的入口,是主函数!在本实验中,虽然我把main初始化在关键字表(字符指针类型数组)*Key[10]中,当与该数组中字符串进行比较时,若与main匹配成功,则返回2,若为其他关键字则返回1,以此来把main从关键字中区别出来。在本实验中的关键字表只初始化了几个常用的关键字,还可继续扩充(只需扩大数组,向其中补充要添加的关键字)。如果要对本程序中未识别的c语言中的一些其他的字符进行扩充(目前处理为不可识别字符),可在程序代码中继续添加case选项,分别对相应要识别的特殊字符加以描述