亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

shell實現模糊匹配與正則

發布時間:2020-10-26 18:33:56 來源:億速云 閱讀:404 作者:Leah 欄目:開發技術

shell實現模糊匹配與正則?相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。

正則表達式

正則表達式主要是用來描述一個句法規則的模式。其實說的通俗一點,就是利用字符和元字符的組合,對一些符合既定句法的模式進行模糊匹配。它的主要功能是文本查詢和字符串操作。

正則表達式的基本元素包括普通字符和元字符,在Linux shell里面,常用的正則表達式元字符集為:S={*  .  ^  $  []  \  \<\>  \{\}  \{n,\}  \{n,m\} },每一個元字符都有自己在正則表達式中的含義,下面來介紹一下:

“ * ”符號:表示匹配前面一個普通字符0次或多次。注意這里是一個普通字符,即如果是JO*B的話,那么*就匹配字符“O”任意次,而不是匹配“JO”串。

“ . ”符號:表示匹配任意一個字符。字符“ . "就表示一個字符,這個字符可以是任意字符。例如字符串 ...73 就表示前面3個字符為任意字符(包括空格),第4個和第5個字符分別是7和3。

“ ^ ”符號:表示匹配行首。例如:^cloud就表示匹配以cloud字符串開頭的所有行。與上面匹配一個字符不一樣,這里匹配的是后面跟著的整個字符串。

” $ "符號:表示匹配行尾。例如:cloud$ 就表示匹配以cloud字符串結尾的所有行。結合上面的匹配行首,^$表示匹配空行。

“ [] "符號:表示匹配方括號里面的字符集中的一個。例如:數字0-9中的任意一個數字都滿足[0-9]這個表達式。值得注意的是,當^放在[]里面的時候,^就不再表示行首,而是表示取反。如:[^7-9]則表示非7-9中的任意一個數字才滿足這個表達式。

” \ “符號:是轉義字符。如果你寫的正則表達式里面包括元字符,而你又想將它當做普通字符用的話,就要在前面加上轉義符號" \ "了。例如:\$就表示一個普通字符”$"。

“\<\>"符號:表示精確匹配<>內的字符,” \ “是用來轉義<>這兩個字符的。例如:\<the\>表示匹配包含”the“的行,由于精確匹配,所以,”them“,”theory“這些單詞所在的行并不會被匹配到。

”\{\}"符號:與" * "類似,表示匹配前面的一個字符任意多次。但是“\{\}”可以指定重復的次數,如\{3\}則表示重復前面的字符3次;\{3,\}表示重復前面的字符至少3次;\{3,5\}表示重復3到5次。例如:JO\{3\}B則表示重復字符O三次,即JOOOB;JO\{3,\}B則表示至少重復O三次,即JOOOB,JOOOOB等都符合;\{3,5\}則匹配JOOOB,JOOOOB,JOOOOOB這幾個字符串。

通配符

初學的時候對于正則表達式和通配符的理解很模糊,兩個都是可以進行模糊匹配的,到底什么時候用才是正則表達式,什么時候用是通配符呢?其實,我們登錄系統之后,系統的bash shell并不支持正則表達式的,也就是說,我們如果使用bash shell的某些命令時使用正則表達式,shell可能會認不出來,只有當我們使用類似grep,sed,awk等工具的時候才有效。所以,我們在使用bash shell的時候也想達到模糊匹配的目的的話,就要使用通配符了。

通配符是使用正則表達式的一些元字符來的,常用的元字符集:E={&#63;  *  []  {}  ^ }。不過,這個通配符的元字符意義跟正則表達式里面的不太一樣。例如:

“ * "字符不再表示匹配前面一個字符任意多次,而是表示任意位置的任意字符。例如:phi*ip,則可以匹配philip,phillip,philsaip等開始三個是phi和結尾兩位是ip的任意字符。例如ls -l *.awk表示匹配以.awk結尾的所有文件,*表示任意長度任意字符組合。

" &#63; ”字符才表示任意一個字符。同正則表達式元字符的" . "

" {} “字符不需要轉義。在{}表示的是表達式集合。如:ls -l {[a-h]*.awk,0&#63;.pem}則表示列出所有以a-h字符開頭的.awk文件的和以0開頭,后面接一個任意字符的.pem文件

" ^ "字符也不是表示行首,而是代表取反。

正則表達式和通配的應用環境上有些不一樣,但是都能夠達到模糊匹配的效果。在后面介紹到的使用grep,sed和awk等工具對于文件的查找以及各種操作中,正則表達式的匹配作用更加明顯。

 范例:

檢測文件名是否符合規范:

#!/bin/bash

RED='\033[31m'
GREEN='\033[32m'

awk '{printf("%s",$0)}' $1 | egrep "^#[[:digit:]]*-(docs|unittest|pseudocode|msg-[^ ].*)$" > /dev/null 2>&1

if [ $&#63; -ne 0 ];then
 echo -e "message check ${RED}fail${NORMAL}"
 exit 1
fi
 echo -e "message check ${GREEN}success${NORMAL}"
exit 0

當然,也可以使用if,如:

if [[ $1 =~ ^[0-9]+$ ]]; then
  echo "Is Number."
else
  echo "No Number."
fi

檢測ip地址是否符合規范:

構造測試文件 ip.txt

10.1.1.1
192.168.0.1
192.168.0.101
255.255.255.255
999.0.0.1
1.0.0.500
a.0.0.0
0.b.0.0
1.1.1
2.2
1
0.0.0.0

基本思路就是要每個點之間的元素為整數,最多為3位整數[0-9]\{1,3\},然后用 . 拼接起來,加上^和$更精確的限制匹配對象

cat ip.txt |grep '^[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}$'

結果為

10.1.1.1
192.168.0.1
192.168.0.101
255.255.255.255
999.0.0.1
1.0.0.500
0.0.0.0

這里精度不夠,需要嚴格限制整數為1-255(第一個元素不能為0,后面的可以為0),即0-9 10-99 100-199 200-249 250-255

\([1-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)    注意|和()轉義,另外|分割的元素要用()括住,若帶-E參數指定為擴展正則的形式則不需用\轉義

然后后面3個元素只要稍改下范圍到0-255,簡單的拼接起來

復制代碼 代碼如下:
cat ip.txt |grep '^\([1-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\.\([0-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\.\([0-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\.\([0-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)$'

結果如下

10.1.1.1
192.168.0.1
192.168.0.101
255.255.255.255

當然更簡潔的寫法,記得.后面的元要()括起來

復制代碼 代碼如下:
cat ip.txt |grep '^\([1-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\(\.\([0-9]\|([1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\)\{3\}$'

看完上述內容,你們掌握shell實現模糊匹配與正則的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

越西县| 南阳市| 台东县| 汕尾市| 梁山县| 望奎县| 汾阳市| 台中县| 东阳市| 辽中县| 岳池县| 阿坝| 秭归县| 平顺县| 临漳县| 横峰县| 北碚区| 昌都县| 吴川市| 永宁县| 仲巴县| 和政县| 阳原县| 宜城市| 交口县| 元阳县| 惠州市| 安达市| 桃园县| 马关县| 阳信县| 通渭县| 广昌县| 太谷县| 太仆寺旗| 报价| 苏尼特右旗| 岫岩| 班玛县| 新巴尔虎右旗| 乌鲁木齐市|