亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何使用Java正則表達式匹配、替換HTML內容

發布時間:2021-07-13 15:37:48 來源:億速云 閱讀:490 作者:chen 欄目:編程語言

這篇文章主要講解了“如何使用Java正則表達式匹配、替換HTML內容”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“如何使用Java正則表達式匹配、替換HTML內容”吧!

曾經了解過JavaScript的正則表達式,知道其功能的強大,對于處理文本比用普通的API處理不管從效率上還是從功能上都有很大的優勢。今天項目要求用到Java的正則表達式,于是在網上Google,找到一個Jakarta ORO的庫,聽說是Java中功能***大的正則表達式庫,確實也如此,Sun公司的JDK里自帶的正則表達式功能是遠遠不如ORO庫,從正則表達式的角度上看,其比普通的API處理文本是復雜很多。

但如果應用得恰當的話,會提高工程的質量,于是項目中就應用了這個ORO庫,把瀏覽器請求得到的HTML頁面進行解釋替換實現一個代理采集信息的功能。感覺自己好像是在開發軟件,不是在設計網頁。正則表達式有一個很好用的工具--RegexBuddy,應用這個工具可以調度一個匹配你需要的正則表達式串,經過幾番調度,把一些HTML標簽的正則表達式匹配出來。


***:像網頁鏈接<a .......... href="[url1]" .......>之間的內容中[URL[絕對地址替換成相對地址,首先要查找匹配這個鏈接,查找匹配這個串的正則表達式串為

(<]\\s*){0,})href\\s*=\\s*(\"|'|)([^\\2\\s>]*)\\2((?:\\s*[^\\s>]){0,}\\s">\\s*a\\s+(?:[^\\s>]\\s*){0,})href\\s*=\\s*(\"|'|)([^\\2\\s>]*)\\2((?:\\s*[^\\s>]){0,}\\s *>)

  1. //查找匹配的代碼如下:  

  2.     String  patternStrs="(<\\s*a\\s+(?:[^\\s>]\\s*){0,})href\\s*=\\s*
    (\"|'|)([^\\2\\s>]*)\\2((?:\\s*[^\\s>]){0,}\\s *>)"
    ;  

  3.     PatternCompiler complier = new Perl5Compiler();  

  4.     PatternMatcher matcher = new Perl5Matcher();  

  5.  

  6.     Pattern patternForLink = complier.compile(patternStrs,  

  7.                                               Perl5Compiler.  

  8.                                               CASE_INSENSITIVE_MASK);  

  9.     PatternMatcherInput input = new PatternMatcherInput(htmlContent);  

  10.     while (matcher.contains(input, patternForLink)) {  

  11.       MatchResult match = matcher.getMatch();  

  12.       //處理匹配的結果,是要替換還是要其他處理  

  13.     }  

  14.  

第二:對其他的標簽也類似只要把匹配的字符串改一下為要匹配的標簽就可以了。(如IMG標簽)

(<\s*img\s+(?:[^\s>]\s*){0,})src\s*=\s*("|'|)([^\2\s>]*)\2((?:\s*[^\s>]){0,}\s*>),這樣就可以處理

<img.....................src="[url]"...............>的標簽匹配,對其他的標簽也一樣.

總結:對于大量要處理的文本,建議還是用到正則表達式,而要處理的文本比較少時,用普通的字符串API處理函數就足夠了。

感謝各位的閱讀,以上就是“如何使用Java正則表達式匹配、替換HTML內容”的內容了,經過本文的學習后,相信大家對如何使用Java正則表達式匹配、替換HTML內容這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

乐业县| 集安市| 右玉县| 靖江市| 辰溪县| 广昌县| 余江县| 和龙市| 讷河市| 平利县| 岑巩县| 武穴市| 绥滨县| 甘洛县| 吉林省| 河池市| 泊头市| 武汉市| 峨边| 青冈县| 丹棱县| 兴安盟| 稻城县| 武宁县| 盐亭县| 澄江县| 南宫市| 开鲁县| 民权县| 永城市| 大冶市| 乾安县| 乌审旗| 安图县| 黔南| 左贡县| 龙南县| 土默特右旗| 汶上县| 新巴尔虎右旗| 伽师县|