linux的中怎么安裝和使用flex

發布時間：2022-03-03 17:08:31 來源：億速云閱讀：958 作者：iii 欄目：建站服務器

這篇“linux的中怎么安裝和使用flex”文章的知識點大部分人都不太理解，所以小編給大家總結了以下內容，內容詳細，步驟清晰，具有一定的借鑒價值，希望大家閱讀完這篇文章能有所收獲，下面我們一起來看看這篇“linux的中怎么安裝和使用flex”文章吧。

在linux中，flex是一個詞法分析工具，能夠識別文本中的詞法模式；Flex讀入給定的輸入文件，如果沒有給定文件名的話，則從標準輸入讀取，從而獲得一個關于需要生成的掃描器的描述。

本教程操作環境：linux5.9.8系統、Dell G3電腦。

flex:詞法分析器

flex是一個詞法分析器。用來將一個.l文件生成一個.c程序文件。即生成一個詞法分析器。然后讀取輸入，和正則表達式匹配，再執行相應的動作，實現了程序的功能。我們可以發現flex實現在程序外部就可以接受輸入的功能。

Flex是一個生成掃描器的工具，能夠識別文本中的詞法模式。Flex 讀入給定的輸入文件，如果沒有給定文件名的話，則從標準輸入讀取，從而獲得一個關于需要生成的掃描器的描述。此描述叫做規則，由正則表達式和 C代碼對組成。Flex 的輸出是一個 C 代碼文件——lex.yy.c——其中定義了yylex() 函數。編譯輸出文件可以生成一個可執行文件。當運行可執行文件的時候，它分析輸入文件，為每一個正則表達式尋找匹配。當發現一個匹配時，它執行與此正則表達式相關的C代碼。Flex 不是GNU工程，但是GNU為Flex 寫了手冊。

用法

安裝 flex

sudo apt-get install flex
//或者下載相應版本的安裝文件安裝

然后新建一個文本文件，輸入以下內容：

%%
[0-9]+  printf("?");
#       return 0;
.       ECHO;
%%
int main(int argc, char* argv[]) {
    yylex();
    return 0;
}
int yywrap() { 
    return 1;
}

將此文件另存為 hide-digits.l 。注意此文件中的 %% 必須在本行的最前面（即 %% 前面不能有任何空格）。

之后，在終端輸入：

flex hide-digits.l

此時目錄下多了一個 “lex.yy.c” 文件，把這個 C 文件編譯并運行一遍：

 gcc -o hide-digits lex.yy.c
./hide-digits

然后在終端不停的敲入任意鍵并回車，可以發現，敲入的內容中，除數字外的字符都被原樣的輸出了，而每串數字字符都被替換成 ? 了。最后敲入 # 后程序退出了。如下：

eruiewdkfj
eruiewdkfj
1245
?
fdsaf4578
fdsaf?
...
#

當在命令行中運行 flex 時，第二個命令行參數（此處是 hide-digits.l ）是提供給 flex 的分詞模式文件，此模式文件中主要是用戶用正則表達式寫的分詞匹配模式，用flex 會將這些正則表達式翻譯成 C 代碼格式的函數 yylex ，并輸出到 lex.yy.c 文件中，該函數可以看成一個有限狀態自動機。
當在命令行中運行 flex 時，第二個命令行參數（此處是 hide-digits.l ）是提供給 flex 的分詞模式文件，此模式文件中主要是用戶用正則表達式寫的分詞匹配模式，用flex 會將這些正則表達式翻譯成 C 代碼格式的函數 yylex ，并輸出到 lex.yy.c 文件中，該函數可以看成一個有限狀態自動機。
下面再來詳細解釋一下 hide-digits.l 文件中的代碼，首先第一段是：

%%
[0-9]+  printf("?");
#       return 0;
.       ECHO;
%%

flex 模式文件中，用%% 和 %%做分割，上面分割的內容被稱為規則（rules），本文件中每一行都是一條規則，每條規則由匹配模式（pattern）和事件（action）組成，模式在前面，用正則表達式表示，事件在后面，即 C 代碼。每當一個模式被匹配到時，后面的 C 代碼被執行。
flex 會將本段內容翻譯成一個名為 yylex 的函數，該函數的作用就是掃描輸入文件（默認情況下為標準輸入），當掃描到一個完整的、最長的、可以和某條規則的正則表達式所匹配的字符串時，該函數會執行此規則后面的 C 代碼。如果這些 C 代碼中沒有 return 語句，則執行完這些 C 代碼后， yylex 函數會繼續運行，開始下一輪的掃描和匹配。
當有多條規則的模式被匹配到時， yylex 會選擇匹配長度最長的那條規則，如果有匹配長度相等的規則，則選擇排在最前面的規則。

int main(int argc, char *argv[]) {
    yylex();
    return 0;
}
int yywrap() { return 1; }

第二段中的 main 函數是程序的入口， flex 會將這些代碼原樣的復制到 lex.yy.c 文件的最后面。最后一行的 yywrap 函數， flex 要求有這么一個函數。

示例

word-spliter.l

%{
#define T_WORD 1
int numChars = 0, numWords = 0, numLines = 0;
%}
WORD([^ \t\n\r\a]+)
%%
\n{ numLines++; numChars++; }
{WORD}{ numWords++; numChars += yyleng; return T_WORD; }
<<EOF>>{ return 0; }
.{ numChars++; }
%%
int main() {
int token_type;
while (token_type = yylex()) {
printf("WORD:\t%s\n", yytext);
}
printf("\nChars\tWords\tLines\n");
printf("%d\t%d\t%d\n", numChars, numWords, numLines);
return 0;
}
int yywrap() {
return 1;
}

本例中使用到了 flex 提供的兩個全局變量 yytext 和 yyleng，分別用來表示剛剛匹配到的字符串以及它的長度

編譯執行

flex word-spliter.l
gcc -o word-spliter lex.yy.c
./word-spliter < word-spliter.l
輸出：
WORD:       %{
WORD:       #define
...
WORD:       }
Chars       Words   Lines
470 70      27

可見此程序其實就是一個原始的分詞器，它將輸入文件分割成一個個的 WORD 再輸出到終端，同時統計輸入文件中的字符數、單詞數和行數。此處的 WORD 指一串連續的非空格字符。

擴展

（1）列出所需的所有類型的 token；

（2）為每種類型的 token 分配一個唯一的編號，同時寫出此 token 的正則表達式；

（3）寫出每種 token 的 rule （相應的 pattern 和 action ）。

第 1 類為單字符運算符，一共 15 種：

+ * - / % = , ; ! < > ( ) { }

第 2 類為雙字符運算符和關鍵字，一共 16 種：

<=, >=, ==, !=, &&, ||
void, int, while, if, else, return, break, continue, print, readint

第 3 類為整數常量、字符串常量和標識符（變量名和函數名），一共 3 種。

拓展后

%{
#include "token.h"
int cur_line_num = 1;
void init_scanner();
void lex_error(char* msg, int line);
%}
/* Definitions, note: \042 is '"' */
INTEGER             ([0-9]+)
UNTERM_STRING       (\042[^\042\n]*)
STRING              (\042[^\042\n]*\042)
IDENTIFIER          ([_a-zA-Z][_a-zA-Z0-9]*)
OPERATOR            ([+*-/%=,;!<>(){}])
SINGLE_COMMENT1     ("//"[^\n]*)
SINGLE_COMMENT2     ("#"[^\n]*)
%%
[\n]                { cur_line_num++;                       }
[ \t\r\a]+          { /* ignore all spaces */               }
{SINGLE_COMMENT1}   { /* skip for single line comment */    }
{SINGLE_COMMENT2}   { /* skip for single line commnet */    }
{OPERATOR}          { return yytext[0];         }   
"<="                { return T_Le;              }
">="                { return T_Ge;              }
"=="                { return T_Eq;              }
"!="                { return T_Ne;              }
"&&"                { return T_And;             }
"||"                { return T_Or;              }
"void"              { return T_Void;            }
"int"               { return T_Int;             }
"while"             { return T_While;           }
"if"                { return T_If;              }
"else"              { return T_Else;            }
"return"            { return T_Return;          }
"break"             { return T_Break;           }
"continue"          { return T_Continue;        }
"print"             { return T_Print;           }
"readint"           { return T_ReadInt;         }
{INTEGER}           { return T_IntConstant;     }
{STRING}            { return T_StringConstant;  }
{IDENTIFIER}        { return T_Identifier;      }
<<EOF>>             { return 0; }
{UNTERM_STRING}     { lex_error("Unterminated string constant", cur_line_num);  }
.                   { lex_error("Unrecognized character", cur_line_num);        }
%%
int main(int argc, char* argv[]) {
    int token;
    init_scanner();
    while (token = yylex()) {
        print_token(token);
        puts(yytext);
    }
    return 0;
}
void init_scanner() {
    printf("%-20s%s\n", "TOKEN-TYPE", "TOKEN-VALUE");
    printf("-------------------------------------------------\n");
}
void lex_error(char* msg, int line) {
    printf("\nError at line %-3d: %s\n\n", line, msg);
}
int yywrap(void) {
    return 1;
}

上面這個文件中，需要注意的是，正則表達式中，用雙引號括起來的字符串就是原始字符串，里面的特殊字符是不需要轉義的，而雙引號本身必須轉義（必須用 \” 或 \042 ），這是 flex 中不同于常規的正則表達式的一個特性。

除單字符運算符外的 token 的編號則在下面這個 token.h 文件，該文件中同時提供了一個 print_token 函數，可以根據 token 的編號打印其名稱。

#ifndef TOKEN_H
#define TOKEN_H
typedef enum {
    T_Le = 256, T_Ge, T_Eq, T_Ne, T_And, T_Or, T_IntConstant,
    T_StringConstant, T_Identifier, T_Void, T_Int, T_While,
    T_If, T_Else, T_Return, T_Break, T_Continue, T_Print,
    T_ReadInt
} TokenType;
static void print_token(int token) {
    static char* token_strs[] = {
        "T_Le", "T_Ge", "T_Eq", "T_Ne", "T_And", "T_Or", "T_IntConstant",
        "T_StringConstant", "T_Identifier", "T_Void", "T_Int", "T_While",
        "T_If", "T_Else", "T_Return", "T_Break", "T_Continue", "T_Print",
        "T_ReadInt"
    };
    if (token < 256) {
        printf("%-20c", token);
    } else {
        printf("%-20s", token_strs[token-256]);
    }
}
#endif

makefile

out: scanner
scanner: lex.yy.c token.h
gcc -o $@ $<
lex.yy.c: scanner.l
flex $<

linux的中怎么安裝和使用flex

以上就是關于“linux的中怎么安裝和使用flex”這篇文章的內容，相信大家都有了一定的了解，希望小編分享的內容對大家有幫助，若想了解更多相關的知識內容，請關注億速云行業資訊頻道。

向AI問一下細節

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

linux的中怎么安裝和使用flex

猜你喜歡

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

linux的中怎么安裝和使用flex

猜你喜歡

最新資訊

相關推薦

相關標簽