您好,登錄后才能下訂單哦!
這篇文章主要講解了“如何理解awk編程及相關命令”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“如何理解awk編程及相關命令”吧!
一,什么是awk
awk是linux下的一個命令,他對其他命令的輸出,對文件的處理都十分強大,其實他更像一門編程語言,他可以自定義變量,有條件語句,有循環,有數組,有正則,有函數等。他讀取輸出,或者文件的方式是一行,一行的讀,根據你給出的條件進行查找,并在找出來的行中進行操作,感覺他的設計思想,真的很簡單,但是結合實際情況,具體操作起來就沒有那么簡單了。他有三種形勢,awk,gawk,nawk,平時所說的awk其實就是gawk。
二,awk中的記錄,域,分割符
當我們讀取輸出時,或者讀取文件時,讀取一行就是一個記錄。記錄分割符是默認是回車符,保存在RS,ORS中。
我們從記錄中分割出我們要單詞,或者是詞組等,我們稱他為域,域分割符,默認的是空格和TAB銉,保存在內建變
量ORS中。舉個例子:
aaaa:bbbb:ccccccc
1111:2343:5t43343
上面有二行,這二行就是二個記錄,每行后面的回車呢,就是記錄分割符,里面冒號呢,就是域分割符,分割出來的,aaaa,1111這類東西就是域了。
awk -F: '{print $1}' testfile
三,awk的內建變量和運算符
1,變量
變 量 | 描述 |
---|---|
$n | 當前記錄的第n個字段,字段間由 FS分隔。 |
$0 | 完整的輸入記錄。 |
ARGC | 命 令行參數的數目。 |
ARGIND | 命令行中當前文件的位置(從0開始算)。 |
ARGV | 包 含命令行參數的數組。 |
CONVFMT | 數字轉換格式(默認值為%.6g) |
ENVIRON | 環 境變量關聯數組。 |
ERRNO | 最后一個系統錯誤的描述。 |
FIELDWIDTHS | 字 段寬度列表(用空格鍵分隔)。 |
FILENAME | 當前文件名。 |
FNR | 同 NR,但相對于當前文件。 |
FS | 字段分隔符(默認是任何空格)。 |
IGNORECASE | 如 果為真,則進行忽略大小寫的匹配。 |
NF | 當前記錄中的字段數。 |
NR | 當 前記錄數。 |
OFMT | 數字的輸出格式(默認值是%.6g)。 |
OFS | 輸 出字段分隔符(默認值是一個空格)。 |
ORS | 輸出記錄分隔符(默認值是一個換行符)。 |
RLENGTH | 由 match函數所匹配的字符串的長度。 |
RS | 記錄分隔符(默認是一個換行符)。 |
RSTART | 由 match函數所匹配的字符串的第一個位置。 |
SUBSEP | 數組下標分隔符(默認值是\034)。 |
2,運算符
運算符 | 描述 |
---|---|
= += -= *= /= %= ^= **= | 賦值 |
?: | C條件表達式 |
|| | 邏 輯或 |
&& | 邏輯與 |
~ ~! | 匹 配正則表達式和不匹配正則表達式 |
< <= > >= != == | 關 系運算符 |
空格 | 連接 |
+ - | 加,減 |
* / & | 乘,除與求余 |
+ - ! | 一元加,減和邏輯非 |
^ *** | 求冪 |
++ -- | 增加或減少,作為前綴或后綴 |
$ | 字 段引用 |
in | 數組成員 |
四,awk的正則
匹配符 | 描述 |
---|---|
\Y | 匹配一個單詞開頭或者末尾的空字符串 |
\B | 匹配單詞內的空字符串 |
\< | 匹配一個單詞的開頭的空字符串,錨定開始 |
\> | 匹配一個單詞的末尾的空字符串,錨定末尾 |
\W | 匹配一個非字母數字組成的單詞 |
\w | 匹配一個字母數字組成的單詞 |
\' | 匹配字符串末尾的一個空字符串 |
\‘ | 匹配字符串開頭的一個空字符串 |
五,awk的函數
1,字符串函數
函數名 | 描述 |
---|---|
sub | 匹配記錄中最大、最靠左邊的子字符串的正則表達式,并用替換字符串替換這些字符串。如果沒有指定目標字符串就默認使用整個記錄。替換只發生在第一次匹配的 時候 |
gsub | 整個文檔中進行匹配 |
index | 返回子字符串第一次被匹配的位置,偏移量從位置1開始 |
substr | 返回從位置1開始的子字符串,如果指定長度超過實際長度,就返回整個字符串 |
split | 可按給定的分隔符把字符串分割為一個數組。如果分隔符沒提供,則按當前FS值進行分割 |
length | 返回記錄的字符數 |
match | 返回在字符串中正則表達式位置的索引,如果找不到指定的正則表達式則返回0。match函數會設置內建變量RSTART為字符串中子字符串的開始位 置,RLENGTH為到子字符串末尾的字符個數。substr可利于這些變量來截取字符串 |
toupper和tolower | 可用于字符串大小間的轉換,該功能只在gawk中有效 |
2,數學函數
函數名 | 返回值 |
---|---|
atan2(x,y) | y,x 范圍內的余切 |
cos(x) | 余弦函數 |
exp(x) | 求 冪 |
int(x) | 取整 |
log(x) | 自然對 數 |
rand() | 隨機數 |
sin(x) | 正弦 |
sqrt(x) | 平 方根 |
srand(x) | x是rand()函數的種子 |
int(x) | 取 整,過程沒有舍入 |
rand() | 產生一個大于等于0而小于1的隨機數 |
六,實例
學習awk的時候,做了一個例子,學東西,不要光看,光看是記不住東西的。光看的話,也許你知道怎么回事,真正實際操作,不是這兒有問題,就是那兒有問題。所以一定要動手親自操作一下。
1,測試文件test
代碼如下:
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/bin/false
daemon:x:2:2:daemon:/sbin:/bin/false
mail:x:8:12:mail:/var/spool/mail:/bin/false
ftp:x:14:11:ftp:/home/ftp:/bin/false
&nobody:$:99:99:nobody:/:/bin/false
zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
http:x:33:33::/srv/http:/bin/false
dbus:x:81:81:System message bus:/:/bin/false
hal:x:82:82:HAL daemon:/:/bin/false
mysql:x:89:89::/var/lib/mysql:/bin/false
aaa:x:1001:1001::/home/aaa:/bin/bash
ba:x:1002:1002::/home/zhangy:/bin/bash
test:x:1003:1003::/home/test:/bin/bash
@zhangying:*:1004:1004::/home/test:/bin/bash
policykit:x:102:1005:Po
例1:
代碼如下:
cat test | awk -F: '{\
if ($1 == "root"){\
print $1;\
}else if($1 == "bin"){\
print $2;\
}else{\
print $3;\
} \
}'
例2:
代碼如下:
awk '{\
for(i=0;i<NF;i++){\
if ($i ~/^root/){\
print $i;\
}else if($i ~/zhangy/){\
print $i;continue;\
}else if($i ~/mysql/){\
print $i;next;\
}else if($i ~/^test/){\
print $i;break;\
} \
}\
}' test
例3:
代碼如下:
tail test | awk 'BEGIN{while(getline d){ split(d,test);for(i in test){\
print test[i]\
}}}'
例4:
代碼如下:
ls -al /home/zhangy/mytest | awk 'BEGIN{while(getline d){ split(d,test);\
print test[9] ;}
}'
例5:
代碼如下:
echo "32:34" |awk -F: '{print "max = ",max($1,$2)}\
function max(one,two){
if(one > two){
return one;
}else{
return two;
}
}
'
例6:
代碼如下:
#awk 'BEGIN{print "what is your name"; getline name < "/dev/tty"}$1 ~name{print
#"found name on line" NR}END{print "see you" name}' test
#awk '{sub(/daemon/,"tankzhang");print}' test
#awk '{{sub(/zhangy/,"tankzhang");$1};print}' test
#awk '{{gsub(/zhangy/,"tankzhang");$1};print}' test
#awk -F: '{print index("zhangy",$1)}' test
#awk -F: '{print substr($1,1,2)}' test
awk -F: '{mat=match($1,/^[a-zA-Z]+$/);print mat,RSTART,RLENGTH}' test
例7:
代碼如下:
cat test |awk -F: '\
NF != 7{\
printf("line %d,does not have 7 fields:%s\n",NR,$0)}\
$1 !~ /^[A-Za-z0-9]/{printf("line %d,non alpha and numeric user id:%s: %s\n",NR,$1,$0)}\
$2 == "*" {printf("lind %d,no password:%s\n",NR,$0)}'
感謝各位的閱讀,以上就是“如何理解awk編程及相關命令”的內容了,經過本文的學習后,相信大家對如何理解awk編程及相關命令這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。