您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“Java中如何使用正則表達式處理文本數據”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“Java中如何使用正則表達式處理文本數據”這篇文章吧。
正則表達式就是一個字符串,但和普通的字符串不同的是,正則表達式是對一組相似字符串的抽象,如下面的幾個字符串:
a98b c0912d c10b a12345678d ab
我們仔細分析上面五個字符串,可以看出它們有一個共同特征,就是第一個字符必須是'a'或'c',最后一個字符必須是'b'或'd',而中間的字符是任意多個數字組成(包括0個數字)。因此,我們可以將這五個字符串的共同特點抽象出來,這就產生了一個正則表達式:[ac]\\d*[bd]。而根據這個正則表達式,我們可以寫出無窮多個滿足條件的字符串。
在Java中使用正則表達式的方法非常多,最簡單的就是和字符串一起使用。在String中有四個方法可以使用正則表達式,它們是matches、split、replaceAll和replaceFirst。
一、matches方法
matches方法可以判斷當前的字符串是否匹配給定的正則表達式。如果匹配,返回true,否則,返回false。matches方法的定義如下:
public boolean matches(String regex)
如上面給出的正則表達式我們可以用如下程序驗證。
<!---->String[] ss = new String[]{"a98b", "c0912d", "c10b", "a12345678d", "ab"}; for(String s: ss) System.out.println(s.matches("[ac]\\d*[bd]"));
輸出結果:
true
true
true
true
true
下面簡單解釋一下這個正則表達式的含義。如果我們學過編譯原理的詞法分析,就會很容易理解上面的正則表達式(因為正則表達式的表示方法和詞法分析中的表達式類似)。如在 [...]中的相當于或"|",如[abcd]相當于a|b|c|d,也就是a或b或c或d。如上面的正則表達式的開頭部分是[ac],就代表著字符串的開頭只能是a或c。[bd]表達字符串結尾只能是b或d。而中間的\d表達0-9的數字,由于\在正則表達式中有特殊含義,所以用\\來表示\。而*表示有0或無窮多個(這在詞法分析中叫*閉包),由于*跟在\d后面,因此表達有0或無窮多個數字。
二、split方法
split方法使用正則表達式來分割字符串,并以String數組的形式返回分割結果。split有兩種重載形式,它們定義如下:
<!---->public String[] split(String regex) public String[] split(String regex, int limit)
如下面的代碼將使用split的第一種重載形式來分割HTTP請求頭的第一行,代碼如下:
<!---->String s = "GET /index.html HTTP/1.1"; String ss[] = s.split(" +"); for(String str: ss) System.out.println(str);
輸出結果:
GET
/index.html
HTTP/1.1
在使用split的第一種重載形式時應注意,如果分割后的字符串最后有空串,將被忽略。如使用正則表達式\d來分割字符串a0b1c3456時,得到的數組的長度為3,而不是7。
在split的第二種重載形式中有一個limit參數,要分三種情況討論:
1. 大于0: 如limit的值為n,那么將對正則表達式使用n-1次,下面的代碼:
<!---->String s = "a0b1c3456"; String ss[] = s.split("\\d", 3); for(String str: ss) System.out.println(str);
輸出結果:
a
b
c3456
從輸出結果可以看出,程序只對" a0b1c3456"使用了兩次正則表達式,也就是在少掃描完字符'1'后,不管后面有沒有滿足條件的字符串,都將后面的字符串作為一個整體來作為返回數組的最后一個值。
2. 小于0: 不忽略結尾的空串。也就是上面的例子返回數組的長度應該是7,而不是3。
3. 等于0:這是默認值,相當于split的第一種重載形式。
三、replaceAll 和 replaceFirst方法
為兩個方法的定義如下:
public String replaceAll(String regex, String replacement) public String replaceFirst(String regex, String replacement)
這兩個方法用replacement替換當前字符串中和regex匹配的字符串。
以上是“Java中如何使用正則表達式處理文本數據”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。