1、 编译原理课程设计报告编译原理课程设计报告 课题名称:课题名称: C C- -编译器词法分析与语法分析的实现编译器词法分析与语法分析的实现 指导教师评阅成绩: 指导教师评阅意见: . . 提交报告时间:2013 年 6 月 5 日 编译原理课程设计报告.1 1、课程设计目标.3 2、分析与设计 3 2.1、说明所用的方法: .3 2.2、系统总图: .3 2.2.1、scanner部分: 3 2.2.2、parse部分: .5 2.2.3、代码设计说明 .7 3、程序代码实现. 10 3.1、获取输入部分(在main.c 中) : . 10 3.2、词法分析部分(在scan.c 中) : 10
2、 3.3、语法分析部分(在parse.c 中) : . 15 3.4、输出与结点的建立(在util.c 中) . 29 3.5、TokenType、treeNode与结点类型的声明(在globals.h中) 35 4、测试结果 . 36 5、总结 . 40 5.1、收获. 43 5.2、不足. 43 1、课程设计目标、课程设计目标 本次实验,本C- 编译器主要设计并且实现了C- 编译器的词法分析功能与语法分析功 能。 2、分析与设计、分析与设计 2.1、说明所用的方法:、说明所用的方法: 各部分的实现方法 (scanner: 手工实现、Lex; parser: 递归下降、LL(1)、LR(0)
3、、SLR(1)、 LR(1)、LALR(1)、Yacc) ,所用编程语言 实现内容 所用的实验方法 所用编程语言 scanner 手工实现 C 语言 parse 递归下降 C 语言 2.2、系统总图:、系统总图: 2.2.1、scanner部分:部分: 2.2.1.1、实验原理:、实验原理: 扫描程序的任务是从源代码中读取字符并形成由编译器的以后部分(通常是分析程序) 处理的逻辑单元。由扫描程序生成的逻辑单元称作记号(token) ,将字符组合成记号与在一 个英语句子中将字母将字母构成单词并确定单次的含义很相像。 在此程序中,我将记号分成了以下类型: typedef enum /按照书上附录B
4、 程序布局,放在globals.h中 ENDFILE,ERROR, IF,ELSE,INT,RETURN,VOID,WHILE, ID,NUM, ASSIGN,PLUS,MINUS,TIMES,OVER,LT,LET,BT,BET,EQ,NEQ, / = + - * / = = != LPAREN_1,RPAREN_1,SEMI,COM,LPAREN_2,RPAREN_2,LPAREN_3,RPAREN_3, LIN,RIN / ; , ( ) /* TokenType; 其中,关键字有:else、if、int、return、void、while; 专用符号有:+、-、*、/、=、=、=、=、
5、;、,、(、)、/*、 */ 其他标记是ID、NUM,通过下列正则表达式定义: ID = letter letter* NUM = digit digit* letter = a|z|A|Z digit = 0|9 小写大写字母是有区别的。 空格由空白、换行符和制表符组成。空格通常被忽略,除了他必须分开ID、NUM关键 字。 注释常用通常的C 语言符号/*.*/围起来。 注释可以放在任何空白出现的位置 (即注释不 能放在标记内)上,且可以超过一行。注释不能嵌套。 2.2.1.2、实验方法:、实验方法: 我通过对scanner部分原理的了解,确定了他的NFA,再将NFA转化成DFA,并且将 状态
6、数最小化。最后根据我所得的DFA与课后TINY的示例程序编写scanner.c。 最后所得的DFA: 2.2.1.3、编程方法:、编程方法: 编程采用C 语言。 初始状态设置为START,当需要得到下一个token时,取得此token的第一个字符,并 且按照DFA与对此字符的类型的分析, 转换状态。 重复此步骤, 直到DONE为止, 输出token 类型。 此中难点在于对于注释的分析,因此我将判断注释分成几个步骤。当字符为“/”时,状 态转换为INASSIGN_1(自创的)再判断下一个字符,如果为“*”则是注释,如果是其他 的则字符停滞与当前字符(ungetNextChar()) ,并且输出“/” 。在开始时一直未注意停滞与当前 字符,因此总是读不出“/v*”中的“v” ,在调试多次后才得以解