编译原理课程设计自顶向下语法分析器学院(系):计算机科学与技术学院学生姓名:xxxxxxxxx学号:xxxxxxxxx班级:电计1102大连理工大学DalianUniversityofTechnologyI目录1系统概论................................................................-1-2需求分析................................................................-2-3系统设计................................................................-2-4系统实现................................................................-4-5使用说明....................................................................45.1程序运行平台............................................................45.2程序中所有定义的函数................................................-5-5.3文档说明................................................................65.4调试分析............................................................-7-6课程设计总结...........................................................-12-参考文献.................................................................-12-附录:重要代码...........................................................-13-编译原理课程设计-1-1系统概论语法分析是编译过程的核心部分。它的任务是在词法分析识别出单词符号串的基础上,分析并判定程序的语法结构是否符合语法规则。语法分析器在编译程序中的地位如图1所示:图1语法分析器在编译程序中的地位语言的语法结构是用上下文无关文法描述的。因此,语法分析器的工作本质上就是按文法的产生式,识别输入符号串是否为一个句子。这里所说的输入串是指由单词符号(文法的终结符)组成的有限序列。对一个文法,当给你一串(终结)符号时,怎样知道它是不是该文法的一个句子呢?这就要判断,看是否能从文法的开始符号出发推导出这个输入串。或者,从概念上讲,就是要建立一棵与输入串相匹配的语法分析树。自顶向下分析法就是语法分析办法中的一类。顾名思义,自顶向下就是从文法的开始符号出发,向下推导,推出句子。这种方法是带“回溯”的。自顶向下分析的主旨是,对任何输入串,试图用一切可能的办法,从文法开始符号(根结)出发,自上而下地为输入串建立一棵语法树。或者说,为输入串寻找一个最左推导。这种分析过程本质上是一种试探过程,是反复使用不同产生式谋求匹配输入串的过程。实现这种自顶向下的带回溯试探法的一个简单途径是让每个非终结符对应一个递归子程序。每个这种子程序可作为一个布尔过程。一旦发现它的某个候选与输入串相匹配,就用这个候选去扩展语法树,并返回“真”值;否则,保持原来的语法树和IP值不变,并返回“假”值。编译原理课程设计-2-2需求分析以前,人们对语法的分析都建立在人工的基础上,人工分析虽然能够做到侧类旁推,但终究人力有限,再精密的分析都会出现或多或少的错误。为减少因人为产生的错误,并加快语法的分析,故设计了这个自顶向下的语法分析器。人们只要运行程序,输入几个简单的命令或语法,就能求出人们所需要的各种结果。虽然程序设计有一定的局限性,但在这个局限中却能如人们的要求对语法进行分析,从而在一定程度上帮助人们更好的完成工作。3系统设计自顶向下的分析算法通过在最左推导中描述出各个步骤来分析记号串输入。之所以称这样的算法为自顶向下是由于分析树隐含的编号是一个前序编号,而且其顺序是由根到叶自顶向下的分析程序有两类:回溯分析程序(backtrackingparser)和预测分析程序(predictiveparser)。预测分析程序试图利用一个或多个先行记号来预测出输入串中的下一个构造,而回溯分析程序则试着分析其他可能的输入,当一种可能失败时就要求输入中备份任意数量的字符。虽然回溯分析程序比预测分析程序强大许多,但它们都非常慢,一般都在指数的数量级上,所以对于实际的编译器并不合适。递归下降程序分析和LL(1)分析一般地都要求计算先行集合,它们分别称作First集合和Follow集合。由于无需显式地构造出这些集合就可以构造出简单的自顶向下的分析程序。1、LL(1)文法LL(1)文法是一类可以进行确定的自顶向下语法分析的文法。就是要求描述语言的文法是无左递归的和无回溯的。根据LL(1)文法的定义,对于同一非终结符A的任意两个产生式A:=a和A:=b,都要满足:SELECT(A:=a)∩SELECT(A:=b)=Ø。这样,当前非终结符A面临输入符a时,如果a∈SELECT(A:=a),则可以选择产生式A:=a去准确匹配。如本程序中举例说明的a.txt的文法就是一个LL(1)文法:S:=aBc|bABA:=aAb|b编译原理课程设计-3-B:=b|02、文法的左递归当一个文法是左递归文法时,采用自顶向下分析法会使分析过程进入无穷循环之中。所以采用自顶向下语法分析需要消除文法的左递归性。文法的左递归是指若文法中对任一非终结符A有推导AA…,则称该文法是左递归的。左递归又可以分为直接左递归和间接左递归。3、直接左递归若文法中的某一产生式形如A→Aα,α∈V*,则称该文法是直接左递归的。消除直接左递归的方法:设有产生式是关于非终结符A的直接左递归:A→Aα|β(α,β∈V*,且β不以A开头)对A引入一个新的非终结符A′,把上式改写为:A→βA′A′→αA′|ε4、间接左递归若文法中存在某一非终结符A,使得AA…至少需要两步推导,则称该文法是间接左递归的。消除间接左递归的方法:【方法一】采用代入法把间接左递归变成直接左递归。【方法二】直接改写文法:设有文法G10[S]:S→Aα|β⑴A→Sγ⑵因为SAαSγα,所以S是一个间接递归的非终结符。为了消除这种间接左递归,将⑵式代入⑴式,即可得到与原文法等价的文法(可以证明):S→Sγα|β⑶⑶式是直接左递归的,可以采用前面介绍的消除直接左递归的方法,对文法进行改写后可得文法:S→βS′S′→γαS′|ε编译原理课程设计-4-4系统实现系统流程图5使用说明5.1程序运行平台VisualC++6.0WindowsXPSP2编译原理课程设计-5-5.2程序中所有定义的函数classSyntax_analysis{public:charstotax[30][20];//存放文法规则charsoudocu[1000];//用于存放打开的文件内容intsto_tax;//存放产生式总数charfirstchars[30];//某个串的first集(可能有重复)intfirst_num;//first集长度charfollowchars[1000];//存放某个非终结符的follow集(如果有(间接)右递归,可能有较大重复)intfollow_num;//follow集长度intfollownumkey;//用于判断右递归或间接右递归charfollowkey;charselectchars[30][30];//存放每条产生式的select集charcolec0[30];//存入所有能推导出0的非终结符intcolec0num;//能推导出0的非终结符个数charcapital;//第一个未被使用的大写字母charpreanatab[130][130][20];//存放预测分析表,分别为非终结符(将字母转化为数字)、终结符(将字母转化为数字)、产生式char_stotax[30][20];//临时的stotax备份int_sto_tax;//临时的_sto_tax备份charstartchar;//开始文法符号charkeylr;charsave[1000];//保存结果到外存储器charlie[20];intli;charhang[20];inthan;intll_key;编译原理课程设计-6-intinput_key;Syntax_analysis(){}voidopenfile()//打开文件voidgetin()//对读取出来的文件内容,推导式分解并保存在stotax数组中voiddisp()//显示方法推导式voidget_in()//输入推导式,并保存stotax数组中voidsave_file(charp[])//保存到外存储器voidDelpare()//消除左递归voidfindcapital()//查找未被使用的大写字母,把第一个未被使用的大写字母保存在capital中voidFirst_Collection(charp[])//求字符串p的first集,把结果保存在数组firstchars[30]中voidFollow_Collection(charp)//求字符p的follow集,把结果保存在数组followchars中voidSelect_Collection()//求每条产生式的select集,存放在数组selectchars[30][30]中voidEstab_preanatab()//创建预测分析表voiddispselect()//显示选择voidbase_()voiddisp_table()//打印预测分析表voidAnalyse_course()//分析过程voiddeduce0_colec()//将所有能推导出0的非终符放在数组colec0[30]中voiddispfirst()//显示First集voiddispfollow()}5.3文档说明文档文法句子a.txtLL(1)文法baabbb#、baaabbbb#....b.txt直接左递归abbbbb(可以任意多少个b)c.txt间接左递归abbbbb(可以任意多少个b)d.txtLL(1)文法maebn#...编译原理课程设计-7-5.4调试分析程序运行说明:适应的文法类型:1、一切LL(1)文法2、含有直接左递归但可以转化为LL(1)文法的文法3、含有间接左递归但可以转化为LL(1)文法的文法说明:1、文法表达方式例如:S:=Aa|Bb,其中空串用数字0代替,每输入一个表达式换行写下一表达式2、文法输入结束后,换行再按‘#’结束3、需要输入命令来执行所需要的功能命令说明:Cmd命令功能open从外存储器打开某文法input从键盘输入文法lltab查看预测分析表select查看每条产生式的SELECT集first求所输串的FIRST集follow求所输非终结符的FOLLOW集ll对某个输入句子进行分析exit退出程序程序运行主界面:编译原理课程设计-8-(1)open:打开文件打开附带文档a.txta.txt文档中的文法为LL(1)文法:S:=aBc|bABA:=aAb|bB:=b|0(2)input:输入文法输入文法过程中“ε”应用“0”代替使用每输入一条新文法需重新另起一行文法输入结束后换行以“#”结束输入文法后若要保存文件,请按“y”键,并按提示输入备份文件的路径和名称。编译原理课程设计-9-若没有输入备份路径,文法则保存在默认路径(程序所在文件夹)中;若不进行保存,则键入除“y”键外的任意键退出当前命令。打开a.bck.txt文档,可以看到文法:(3)