您好,登錄后才能下訂單哦!
這篇文章主要介紹“怎么用JavaScript正則表達式解析URL”,在日常操作中,相信很多人在怎么用JavaScript正則表達式解析URL問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”怎么用JavaScript正則表達式解析URL”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
正則表達式是一個描述字符模式的對象。
首先,此片文章并不是直接告訴你,url的正則表達式是什么,以及怎么使用這個正則表達式去解析一個URL地址,相信這種問題在網絡上已經能找到很多。本文的宗旨在于教你如何理解URL的正則表達式,以達到理解正則表達式,以及能夠在日后的工作中寫出相對簡單的正則。言歸正傳,先看看一下的例子:
var parse_url = /^(?:([A-Za-z]+):)?(\/{0,3})([0-9.\-A-Za-z]+)(?::(\d+))?(?:\/([^?#]*))?(?:\?([^#]*))?(?:#(.*))?$/;
var parse_url = /^(?:([A-Za-z]+):)?(\/{,})([-.\-A-Za-z]+)(?::(\d+))?(?:\/([^?#]*))?(?:\?([^#]*))?(?:#(.*))?$/; var url = "http://qiji.kerlai.net:/GoodsBasic/Operate/?q#simen"; var result = parse_url.exec(url); var names = ["url","scheme","slash","host","port","path","query","hash"]; for(var i=; i <names.length;i++){ console.log(names[i]+":"+result[i]); } //輸出結果 /* url:http://qiji.kerlai.net:/GoodsBasic/Operate/?q#simen scheme:http slash:// host:qiji.kerlai.net port: path:GoodsBasic/Operate/ query:q hash:simen */
我們先來看看結果:
url:http://qiji123.kerlai.net:81/GoodsBasic/Operate/12678?q#simen
scheme:http
slash://
host:qiji123.kerlai.net
port:81
path:GoodsBasic/Operate/12678
query:q
hash:simen
代碼中result數組的集合是['http://qiji123.kerlai.net:81/GoodsBasic/Operate/12678?q#simen','http', '//', 'qiji123.kerlai.net', '81', 'GoodsBasic/Operate/12678', 'q', 'simen']
現在我們嘗試把從第2個到最后一個的結果一個一個鏈接起來,得到的結果為:"http // qiji123.kerlai.net 81 GoodsBasic/Operate/12678 q simen" 和原來的url相比,缺少了":?#"等鏈接符。這個是為何?說到這,我們就要引出正則表達式的一個概念為正則表達式的分組。正則表達式有4種分組,分別是:捕獲型、飛捕獲型、向前正向匹配、向前負向匹配。此處我重點介紹前面兩種,后面兩種大家可以自行補腦。其中非捕獲型的就不會在結果的數組中出現,()括起來的為一個組,即會占用結果數組的一個位置。同樣如果在你的正則表達式中,沒有用括號括起來,那么所匹配到的字符將不會出現在exec()方法所返回的數組中。正則的分組是使用()括起來的稱為一個分組。
1、捕獲型分組:(...)
2、非捕獲型分組:(?: .....)
3、向前正向匹配:(?=........)
4、向前負向匹配:(?!.........)
接下來我們來分解parse_url這個正則表達式,第一個分組
1、^表示字符串的開始
整個正則因子是匹配一個協議名:http
2、(?: )表示一個非捕獲型分組:即在這個括號內的,但是不在其子括號內所匹配到的字符將不放入結果數組中。
3、()表示一個捕獲型分組,此括號內所匹配到的字符放入結果數組中對應url中的:http字符
4、[]為正則表達式類,表示符合中括號內任一一個字符。
7、A-Za-z表示字母A到字母Z,字母a到字母z。[A-Za-z]表示符合字母A到字母Z,字母a到字母z的任一一個字符
5、+表示匹配1次貨多次
6、?表示此組為可選匹配條件
第二個正則因子:(\/{0,3})://
捕獲型分組,\/表示一個應該被匹配的/,{0,3}表示\將被匹配0次或者1到3次之間
([0-9.\-A-Za-z]+):qiji123.kerlai.net
捕獲型分組,由一個或多個數字 ,“.”,”\-“(轉義成”-“),字母A到Z和字母a到z組成
(?::(\d+))?:81
前置:放在非捕獲型分組中將不會出現在返回數組中,\d表示匹配數字。整個因子就是匹配前置為:后面跟隨一個或多個數字。此分組因子為可選的
(?:\/([^?#]*))?:GoodsBasic/Operate/12678
該分組由/開始,^在此處表示非的意思,即除?#之外的所有字符 最后一個?表示此正則因子分組可選
(?:\?([^#]*))? :q
該分組表示包含0個或多個非#字符
(?:#(.*))?:simen
該分組以#開始,(.)將匹配除結束符以外的所有字符。
$表示這個字符串結束。
到此就已經分析完url的所有分組。接下來大家可以寫寫電話號碼的正則表達式:既能匹配固定電話有能匹配手機號(這個會用到新的字符:|)
字符 | 含意 |
\ | 做為轉意,即通常在"\"后面的字符不按原來意義解釋,如/b/匹配字符"b",當b前面加了反斜桿后/\b/,轉意為匹配一個單詞的邊界。 -或- |
^ | 匹配一個輸入或一行的開頭,/^a/匹配"an A",而不匹配"An a" |
$ | 匹配一個輸入或一行的結尾,/a$/匹配"An a",而不匹配"an A" |
* | 匹配前面元字符0次或多次,/ba*/將匹配b,ba,baa,baaa |
+ | 匹配前面元字符1次或多次,/ba*/將匹配ba,baa,baaa |
? | 匹配前面元字符0次或1次,/ba*/將匹配b,ba |
(x) | 匹配x保存x在名為$1...$9的變量中 |
x|y | 匹配x或y |
{n} | 精確匹配n次 |
{n,} | 匹配n次以上 |
{n,m} | 匹配n-m次 |
[xyz] | 字符集(character set),匹配這個集合中的任一一個字符(或元字符) |
[^xyz] | 不匹配這個集合中的任何一個字符 |
[\b] | 匹配一個退格符 |
\b | 匹配一個單詞的邊界 |
\B | 匹配一個單詞的非邊界 |
\cX | 這兒,X是一個控制符,/\cM/匹配Ctrl-M |
\d | 匹配一個字數字符,/\d/ = /[0-9]/ |
\D | 匹配一個非字數字符,/\D/ = /[^0-9]/ |
\n | 匹配一個換行符 |
\r | 匹配一個回車符 |
\s | 匹配一個空白字符,包括\n,\r,\f,\t,\v等 |
\S | 匹配一個非空白字符,等于/[^\n\f\r\t\v]/ |
\t | 匹配一個制表符 |
\v | 匹配一個重直制表符 |
\w | 匹配一個可以組成單詞的字符(alphanumeric,這是我的意譯,含數字),包括下劃線,如[\w]匹配"$5.98"中的5,等于[a-zA-Z0-9] |
\W | 匹配一個不可以組成單詞的字符,如[\W]匹配"$5.98"中的$,等于[^a-zA-Z0-9]。 |
用re = new RegExp("pattern",["flags"]) 的方式比較好 pattern : 正則表達式 flags: g (全文查找出現的所有 pattern) i (忽略大小寫) m (多行查找) | vaScript動態正則表達式問題 請問正則表達式可以動態生成嗎? 例如JavaScript中: var str = "strTemp"; 要生成: var re = /strTemp/; 如果是字符連接: var re = "/" + str + "/"即可 |
到此,關于“怎么用JavaScript正則表達式解析URL”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。