ch3词法分析概要.ppt

下载文档 降价啦

8
0
约2.46万字
约 180页
2018-03-07 发布于湖北
举报
版权申诉
保障服务

ch3词法分析概要.ppt

1、本文档共180页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

ch3词法分析概要

* 词法分析程序的结构取字符子程序取符号子程序，一般有如下约定：进入子程序时，已经取到当前符号的一个字符。离开子程序时，已经取到其后继字符。查造标识符表子程序查造常量表子程序查符号机内表示对照表子程序 * 词法分析程序的自动生成（Lex) LEX是由美国Bell实验室的M.Lesk和Schmidt于1975年用C语言研制的一个词法分析程序的自动生成工具。对任何高级程序语言，用户必须用正规表达式描述该语言的各个词法类（这一描述称为LEX的源程序），LEX就可以自动生成该语言的词法分析程序。LEX及其编译系统的作用如图。 * 图 LEX及其编译系统的作用 * 一个LEX源程序由用“%%”分隔的三部分组成：第一部分为正规式的说明，第二部分为识别规则，最后一部分为用户子程序。其书写格式为：说明部分 %% 识别规则 %% 用户子程序 * 其中，说明部分和用户子程序是任选的，而识别规则是必需的。如果用户子程序缺省，则第二个分隔符号“%%”可以省去；但如果无说明部分，第一个分隔符号“%%”不能省去，因为第一个分隔符号用于指示识别规则部分的开始。 * 说明部分：对识别规则部分要引用的文件和变量进行说明，通常可包括头文件表、常数定义、全局变量定义以及正规式定义等。正规式定义用来定义在规则部分引用的正规式，类似于c的宏定义。除宏定义外，其余代码用%｛和%｝括起来。 * %{ #include ”stdio.h” int sum #define PI 3.14 }% digit [0-9] letter [A-Za-z] id ({letter}) ({letter}∣{digit})* * 识别规则 R1 {A1} R2 {A2} . . . Rn {An} 用户子程序在识别规则部分中，所调用的函数若不是库函数，则需要给出这些函数的定义。其中Rn是正规式，用来描述单词； An是一段C语言源代码，当从输入字符串中识别出单词Rn时，就执行当前的代码段。 * 下面给出一个简单语言的单词符号的LEX源程序例子，其输出单词的类别编码用整数编码表示。 Auxiliary Definitions /*辅助定义*/ letter→A∣B∣C∣…∣Z∣a∣b∣c∣…∣z digit→0∣1∣2∣3∣…∣9 %% Recognition Rules /*识别规则*/ * 1 while {return (1,null)} 2 do {return (2,null)} 3 if {return (3,null)} 4 else {return (4,null)} 5 switch {return (5,null)} 6 { {return (6,null)} 7 } {return (7,null)} 8 ( {return (8,null)} 9 ) {return (9,null)} 10 + {return (10,null)} 11 ? {return (11,null)} * 12 * {return (12,null)} 13 / {return (13,null)} 14 = {return (14,null)} 15 ； {return (15,null)} 16 letter (letter∣digit)* {if(keyword (id)==0) {return (16,null)； return (id) }; else return (keyword (id)) } 17 digit (digit)* {val=int (id)；