ch3词法分析概要.ppt

  1. 1、本文档共180页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ch3词法分析概要

* 词法分析程序的结构 取字符子程序 取符号子程序,一般有如下约定: 进入子程序时,已经取到当前符号的一个字符。 离开子程序时,已经取到其后继字符。 查造标识符表子程序 查造常量表子程序 查符号机内表示对照表子程序 * 词法分析程序的自动生成(Lex) LEX是由美国Bell实验室的M.Lesk和Schmidt于1975年用C语言研制的一个词法分析程序的自动生成工具。对任何高级程序语言,用户必须用正规表达式描述该语言的各个词法类(这一描述称为LEX的源程序),LEX就可以自动生成该语言的词法分析程序。LEX及其编译系统的作用如图。 * 图 LEX及其编译系统的作用 * 一个LEX源程序由用“%%”分隔的三部分组成:第一部分为正规式的说明,第二部分为识别规则,最后一部分为用户子程序。其书写格式为: 说明部分 %% 识别规则 %% 用户子程序 * 其中,说明部分和用户子程序是任选的,而识别规则是必需的。如果用户子程序缺省,则第二个分隔符号“%%”可以省去;但如果无说明部分,第一个分隔符号“%%”不能省去,因为第一个分隔符号用于指示识别规则部分的开始。 * 说明部分:对识别规则部分要引用的文件和变量进行说明,通常可包括头文件表、常数定义、全局变量定义以及正规式定义等。正规式定义用来定义在规则部分引用的正规式,类似于c的宏定义。除宏定义外,其余代码用%{和%}括起来。 * %{ #include ”stdio.h” int sum #define PI 3.14 }% digit [0-9] letter [A-Za-z] id ({letter}) ({letter}∣{digit})* * 识别规则 R1 {A1} R2 {A2} . . . Rn {An} 用户子程序 在识别规则部分中,所调用的函数若不是库函数,则需要给出这些函数的定义。 其中Rn是正规式,用来描述单词; An是一段C语言源代码,当从输入字符串中识别出单词Rn时,就执行当前的代码段。 * 下面给出一个简单语言的单词符号的LEX源程序例子,其输出单词的类别编码用整数编码表示。 Auxiliary Definitions /*辅助定义*/ letter→A∣B∣C∣…∣Z∣a∣b∣c∣…∣z digit→0∣1∣2∣3∣…∣9 %% Recognition Rules /*识别规则*/ * 1 while {return (1,null)} 2 do {return (2,null)} 3 if {return (3,null)} 4 else {return (4,null)} 5 switch {return (5,null)} 6 { {return (6,null)} 7 } {return (7,null)} 8 ( {return (8,null)} 9 ) {return (9,null)} 10 + {return (10,null)} 11 ? {return (11,null)} * 12 * {return (12,null)} 13 / {return (13,null)} 14 = {return (14,null)} 15 ; {return (15,null)} 16 letter (letter∣digit)* {if(keyword (id)==0) {return (16,null); return (id) }; else return (keyword (id)) } 17 digit (digit)* {val=int (id);

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档