塔里木大学信息工程学院课程论文基于c语言的简单词法分析器的设计课程名称编译原理所属学院信息工程学院班级计算机16-6学生姓名李鹏宇学号5011212611二零一四年十二月信息工程学院编译原理课程论文目录一、引言...........................................................................................................................................1二、基于c语言词法分析器的设计..............................................................................................12.1词法分析器的设计原则....................................................................................................12.2词法分析器的设计对象....................................................................................................22.3词法分析器的任务及功能................................................................................................22.3.1词法分析器的任务................................................................................................22.3.2词法分析程序的功能:.......................................................................................22.4各种单词符号对应的种别码:........................................................................................2三、基于c语言词法分析器的实现..............................................................................................33.1词法分析程序的算法思想:............................................................................................33.2主程序示意图:................................................................................................................33.3函数定义说明....................................................................................................................43.4程序设计实现及功能说明................................................................................................43.4.1关键字的定义........................................................................................................43.4.2符合的关键字的查找............................................................................................4四、词法分析程序的C语言程序源代码.......................................................................................5五、结果分析:.............................................................................................................................10六、结束语.....................................................................................................................................11参考文献...........................................................................................................................................7信息工程学院编译原理课程论文第1页共13页摘要:词法分析器构造技术起源于编译器前端的词法分析需求,是编译的第一阶段。其主要任务是读入输入字符,产生记号序列,并提交给语法分析使用。词法分析器技术也经常应用于其他领域,如查询语言与信息检索系统。在每个应用中,最基本的问题是如何设计与说明一种特殊的程序,它能够完成由字符串的模式触发的动作。本文通过实际构造FineC语言(作者设计的一个C语言的轻量子集)的词法分析器对词法分析器的构造原理做了基于实践的探讨。关键字:词法分析器,双缓冲区,符号表,正则表达式,状态转换图一、引言词法分析顾名思义,就是分词。它是用程序设计语言编制出的源程序作为输入,以单词的序列作为输出。分词的过程可以通过编制程序让其自动完成,我们通常把这个分词程序称为词法分析器。词法分析器分析的源程序可以是现有的各类程序设计语言源程序也可以是人为给定的模型语言的源程序。它一般有五个阶段:词法分析,语法分析,语义分析和中间代码产生及优化,目标的代码生成。完成计算机翻译过程的重要阶段,它为以后的语义分析、语法分析打好基础,做好准备,以便高效的、高质量的生成目标语言的程序。所以词法分析,是编译过程的基础。二、基于c语言词法分析器的设计2.1词法分析器的设计原则在编译程序的词法分析,语法分析,语义分析和中间代码的产生及优化阶段中,每个阶段都要遵守功能相等的原则。一个语言的语法的形成是词法规则和语法分析依据的语法规则组成的,衡量一个语法是不是合法要从“形”的角度去出发。因此在词法分析的阶段,重要的研究对象也就变成了词法规则。词法分析程序的输入数据是词法分析器处理的对象,其实是源程序经过了编译预处理,去掉多余的符号后,形成的代码,这样给词法分析较为方便。词法分析的过程是线性的从头到尾扫描一遍,复杂程度较低,易实现。2.2词法分析器的任务及功能2.2.1词法分析器的任务从左到右所有字符逐个的对源程序进行扫描,产生一个一个单词的符号,字信息工程学院编译原理课程论文第2页共13页符串的源程序转换成单词符号串中的中间程序。组成语言的基本元素是词法分析程序输出的结果,也就是单词,在实际的处理过程中,输出不一定是单词,而是每个单词相对应的二元式,形为单词种别,单词符号属性。编码的方式由编译系统的开发者决定。故经过词法分析,在输出结果中并没有单词本身。2.2.2词法分析程序的功能:输入:所给文法的原程序字符串。输出:二元组(syn,token或sum)构成的序列。其中:Syn:“单词种别码”;Token:“存放的单词自身字符串”;Sum:“整型常数”。例如:对源程序beginx:=9:ifx9thenx:=2*x+1/3;end#的源文件,经过词法分析后输出如下序列:(1,begin)(10,x)(18,:=)(11,9)(26,;)(2,if)……2.3各种单词符号对应的种别码:表2.3各种单词符号对应的种别码单词符号种别码单词符号种别码+13;26—14(27*15)28/16#0dightdight*11=25bgin1:17If2:=18Then320wile421do5=22end623lettet(letter|digit)*10=24信息工程学院编译原理课程论文第3页共13页三、基于c语言词法分析器的实现基于c语言的词法分析器,是它本身程序由c语言编写而且它识别的源程序单词串是用c语言编写的。本程序编写环境是Touboc2.0,在TC默认途径下编辑一个c语言源程序再调用本程序,取名eample.c方便程序的调用和分析,输出结果是二元式码。3.1词法分析程序的算法思想:算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号,其基本思想是根据扫描到单词符号的第一个字符的种类,拼出相应的单词符号。3.2主程序示意图:主程序示意图如图3-1,3-2所示。其中初始包括以下两个方面:主函数判断能否打开文件读取文件读取文件NY所取字符是否为@取单词N扫描一个字符返回调用结束读取文件图3-1主程序示意图⑴关键字表的初值。关键字作为特殊标识符处理,把它们预先安排在一张表格中(称为关键字表),信息工程学院编译原理课程论文第4页共13页当扫描程序识别出标识符时,查关键字表。如能查到匹配的单词,则该单词为关键字,否则为一般标识符。关键字表为一个字符串数组,其描述如下:Char*rwtab[6]={“begin”,“if”,“then”,“while”,“do”,“end”,};输入需要扫描的文件名输入扫描结果另存为的文件名判断文件是否为空p处返回,结束程序预读一为ChCh是否为空格Ch是是否为字母或下划线计数器自行加1跳转到扫描头文件单词及保留字跳转到扫描其他符号跳转到扫描引号跳转到扫描注释跳转到扫描数字Ch是否为引号Ch是否为“/”Ch是否为数字或“—”否是否是否是否是否否是图3-2主程序示意图3.3函数定义解释(1)fopen()在默认路径下打开分析程序并读入字符串。(2)otherprocess()识别当前是其它(标点符号等)。(3)alphaprocess()识别当前是数组、保留字、标识符。(4)search()查找并识别当前单词类别,并给定单词类别二元式码,决定给定字符串类别码(即单词种别)和记录次序码。(5)digitprocess()识别当前是常整数、小数、负小数。(6)point()识别当前字符串是指针。3.4程序设计实现及功能说明3.4.1关键字的定义voidinit()信息工程学院编译原理课程论文第5页共13页{for(intj=0;j18;j++){strcpy(symtable[j].lexptr,str[j]);symtable[j].token=j+3;}}3.4.2符合的关键字的查找intsearch(char*temp){for(unsignedinti=0;i18;i++){if(!strcmp(symtable[i].lexptr,temp))returnsymtable[i].token;}return0;}四、结果分析:运行结果如图4-1所示图4-1初始界面输入end+good/1+2*1=23;need#后经词法分析输出如下序列:(end6)(+13)(good10)(/16)(111)(+13)……如图5-2所示:信息工程学院编译原理课程论文第6页共13页图4-2运行结果图五、结束语词