一個極其簡單的lex和yacc程序
本文版權(quán)歸熊春雷所有 ,我的郵箱:<pandaxcl@163.com> ,歡迎大家和我討論計算機方面 的問題,在我的博客上 面還寫了很多其他的文檔,有空來看看哦。如果轉(zhuǎn)載,請保留此版權(quán)信息,并注 明出處。謝謝:)
摘要
在本章中,將會首先給出一個最基本的lex和yacc聯(lián)合使用的框架,這個基本框架
最主要的特點就是能夠正確的被編譯。在我學(xué)習(xí)lex和yacc的過程中經(jīng)歷了無數(shù)次
的痛苦折磨,我發(fā)現(xiàn)一個一開始足夠簡單而且能夠被正確編譯的例子往往能夠使
學(xué)習(xí)者增加學(xué)習(xí)的興趣和信心。因此我的所有的文章都盡可能的采用這種方式進
行描述。我寫這些文檔的最大的愿望就是希望能夠減少新手學(xué)習(xí)的痛苦。希望自 己能夠做到這一點!
例 3.1. frame.l
%{ int yywrap(void); %} %% %% int yywrap(void) { return 1; }
lex文件和yacc文件都是被%%分成了上中下三個部分,在這個程序中的yywrap函數(shù) 需要說明一下:
- yywrap
-
lex源文件中的yywrap函數(shù)是必須的!具體的原因就是因為給了這個函數(shù)實
現(xiàn)之后就可以不需要依賴flex庫了。具體yywrap的作用會在后面的章節(jié)應(yīng)
用的時候進行解釋。通常的做法就是直接返回1,表示輸入已經(jīng)結(jié)束了。
例 3.2. frame.y
%{ void yyerror(const char *s); %} %% program: ; %% void yyerror(const char *s) { } int main() { yyparse(); return 0; }
如前所述,yacc文件被%%分成了上中下三個部分,在這個程序中有幾個需要說明 的地方:
- program
-
這是語法規(guī)則里面的第一個非終結(jié)符,注意上面的格式哦:“program”后
面緊跟著一個冒號“:”,然后換行之后有一個分號“;”,這表明這個
program是由空串組成的。至于什么是非終結(jié)符以及什么是終結(jié)符,還有什 么是語法規(guī)則都會在后面的章節(jié)中進行詳細介
紹。
- yyerror
-
從字面上就可以看出是一個處理錯誤的函數(shù),在這里為空的原因是為了保 證代碼盡可能的簡潔! 實際上這個函數(shù)里面的代碼通常只有一句輸出語句 ,當(dāng)然如果你喜歡還可以加入糾錯代碼,使你的解析器具備糾錯能力:)
- yyparse
-
其實這個函數(shù)是yacc生成的,所以你在代碼里面可以直接使用。這個時候
你可能會問:“yacc生成了yyparse函數(shù),那么lex是不是也生成了什么函
數(shù)呢?”,是的,lex生成的函數(shù)為yylex函數(shù)。實際上yyparse還間接調(diào)用 了yylex函數(shù),可以在生成的C源文件中去核實。
- main
-
每一個C/C++程序都必須的裝備啊,少了怎么能行呢:)所以這個main函數(shù)你 可以放到任何的地方,當(dāng)然要保證能夠調(diào)用yyparse就可以了。但是通常的 做法就是將main函數(shù)放到y(tǒng)acc文件中。
從上面的yacc文件中還可以看出被%%分割成為的三個部分,第一部分中要寫入
C/C++代碼必須用%{和%}括起來;但是第三個部分就可以直接寫入C/C++代碼了
,不需要任何的修飾;中間的那一部分就是yacc語法規(guī)則了。為了能夠讓這個
最最簡單的yacc源程序能夠通過bison的編譯必須要提供一個語法規(guī)則,這
里給出了一個最簡單的規(guī)則:一個program就是由空字符串構(gòu)成的。實際上等于
什么也沒有做。呵呵,對啊,本章的目的就是為了能夠編譯通過lex和yacc源程
序,并且也能夠被C/C++編譯器編譯通過啊?,F(xiàn)在是不是已經(jīng)真的編譯通過了呢 ,可以按照下面的編譯步驟一步一步的來編譯核實。
提示
對yacc的描述同樣也適用于lex。
lex就是詞法掃描器,yacc就是語法分析器,這是通用的說法;具體的實現(xiàn)有所
不同GNU的lex就是flex,GNU的yacc就是bison。為了統(tǒng)一,所以在后面的文章
中就只會用lex來表達詞法掃描器,用yacc來表達語法分析器啦!
下面是編譯全過程記錄,采用了我在第一章中所制作的lex和yacc轉(zhuǎn)換環(huán)境:
D:/work/lex_yacc/chapter03>dir 驅(qū)動器 D 中的卷是 工作區(qū) 卷的序列號是 54D0-5FC0
D:/work/lex_yacc/chapter03 的目錄
2006-09-25 20:27 <DIR> . 2006-09-25 20:27 <DIR> .. 2006-09-25 20:07 71 frame.l 2006-09-25 20:20 144 frame.y 2 個文件 215 字節(jié) 2 個目錄 7,785,578,496 可用字節(jié)
D:/work/lex_yacc/chapter03>flex frame.l
D:/work/lex_yacc/chapter03>dir 驅(qū)動器 D 中的卷是 工作區(qū) 卷的序列號是 54D0-5FC0
D:/work/lex_yacc/chapter03 的目錄
2006-09-25 20:28 <DIR> . 2006-09-25 20:28 <DIR> .. 2006-09-25 20:07 71 frame.l 2006-09-25 20:20 144 frame.y 2006-09-25 20:28 36,997 lex.yy.c 3 個文件 37,212 字節(jié) 2 個目錄 7,785,537,536 可用字節(jié)
D:/work/lex_yacc/chapter03>bison -d frame.y
D:/work/lex_yacc/chapter03>dir 驅(qū)動器 D 中的卷是 工作區(qū) 卷的序列號是 54D0-5FC0
D:/work/lex_yacc/chapter03 的目錄
2006-09-25 20:28 <DIR> . 2006-09-25 20:28 <DIR> .. 2006-09-25 20:07 71 frame.l 2006-09-25 20:28 19,416 frame.tab.c 2006-09-25 20:28 74 frame.tab.h 2006-09-25 20:20 144 frame.y 2006-09-25 20:28 36,997 lex.yy.c 5 個文件 56,702 字節(jié) 2 個目錄 7,785,517,056 可用字節(jié)
D:/work/lex_yacc/chapter03>
過程 3.1. 總的來說就是如下的幾個步驟:
-
將前面的例子frame.l和frame.y保存成為相應(yīng)的文件
-
flex frame.l
-
bison frame.y
-
gcc frame.tab.c lex.yy.c
提示
實際上經(jīng)過flex和bison的轉(zhuǎn)換之后的C/C++源程序是可以直接在VC里面使用的!
上面的frame.tab.c是由bison編譯frame.y產(chǎn)生的,而lex.yy.c則是由flex編譯 frame.l產(chǎn)生的。
好了,一個最簡單的lex和yacc程序已經(jīng)完備了,因此這一章的目的也就已經(jīng)達到了。
在下一章里面將會對這里的框架例子進行擴充以適應(yīng)自己特殊的需要,逐步逐步的實
現(xiàn)一個分析C/C++源代碼的工具程序,但是每一章的結(jié)尾都會盡可能的給出一個可以編
譯通過的lex和yacc源程序。本來也想給出一個計算器的源程序作為例子的,但是這樣
的資料已經(jīng)很多了。這些資料往往不能夠讓自己說清楚問題,在自己的開發(fā)中還是會
遇到千奇百怪的問題,因此為了讓自己能夠有機會解決一個新手在開發(fā)新程序中可能
出現(xiàn)的問題,我也就找了一個我沒有開發(fā)過的程序來讓自己一步一步的解決這些問題 。我想這種方式也許是比較好的學(xué)習(xí)方式吧:)
本章完!
|