您好,登錄后才能下訂單哦!
在學習Python正則式的過程中,有一個問題一直困擾我,如何去匹配一個反斜杠(即“\”)?
一、引入
在學習了Python特殊字符和原始字符串之后,我覺得答案應該是這樣的:
1)普通字符串:'\\'
2)原始字符串:r'\'
但事實上在提取諸如“3\8”反斜杠之前的數字時,我屢次碰壁,始終得不到結果。最終發現自己理解錯了,原來原始字符串和“正則轉義”沒有一點關系;下面詳細談一談。
二、字符串轉義
反斜杠,在Python中比較特殊,就是它可以用來構成一些特殊字符,比如“\n”表示換行,“\t”表示制表符。下面是使用“\n”的一行代碼:
>>>print ('Hello\World\nPython' )
結果為:
“Hello\World
Python“
可以看到其中的“\n”已轉義為換行符,而“\W”沒有發生轉義,原因是“\W”在“字符串轉義”中并不對應著特殊字符,沒有特殊含義。
如果現在要求變了,要求不對“\n”轉義為換行,而是原封不動輸出為“Hello\World\nPython”,該怎么辦呢?
1)可以這樣寫“Hello\World\\nPython”,這樣輸出的時候,“字符串轉義”會把“\\”轉義為“\”;
2)也可使用另一種方法:原始字符串;原始字符串(即r'...'):字符串中所有字符都直接按照字面意思來使用,不轉義特殊字符。
下面是使用原始字符串的代碼:
print r'Hello\World\nPython'
結果為:
“Hello\World\nPython”
可以清楚看到,在使用原始字符串之后,“\n”未被轉義為換行符,而是直接被輸出了。
三、正則轉義
好了,上面講的只是“字符串轉義”。同理,在正則表達式中也存在轉義,我們姑且先稱其為“正則轉義”,其與“字符串轉義”完全不同,比如“\d”代表數字,“\s”代表空白符。下面我們先編寫開頭的例子,然后再分析。
提取“3\8”反斜杠之前的數字:
import re string = '3\8' m = re.search('(\d+)\\\\', string) if m is not None: print m.group(1) # 結果為:3 n = re.search(r'(\d+)\\', string) if n is not None: print n.group(1) # 結果為:3
正則表達式字符串需要經過兩次轉義,這兩次分別是上面的“字符串轉義”和“正則轉義”,個人認為“字符串轉義”一定先于“正則轉義”。
1)'\\\\'的過程:
先進行“字符串轉義”,前兩個反斜杠和后兩個反斜杠分別被轉義成了一個反斜杠;即“\\|\\”被轉成了“\|\”(“|”為方便看清,請自動忽略)。“字符串轉義”后馬上進行“正則轉義”,“\\”被轉義為了“\”,表示該正則式需要匹配一個反斜杠。
2)r'\\'的過程:
由于原始字符串中所有字符直接按照字面意思來使用,不轉義特殊字符,故不做“字符串轉義”,直接進入第二步“正則轉義”,在正則轉義中“\\”被轉義為了“\”,表示該正則式需要匹配一個反斜杠。
四、結論
也就是說原始字符串(即r'...')與“正則轉義”毫無關系,原始字符串僅在“字符串轉義”中起作用,使字符串免去一次轉義。
總結
以上所述是小編給大家介紹的解決Python正則表達式匹配反斜杠''\''問題,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對億速云網站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。