亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python正則表達式的基本原理是什么

發布時間:2023-05-06 15:20:55 來源:億速云 閱讀:98 作者:iii 欄目:開發技術

這篇文章主要講解了“Python正則表達式的基本原理是什么”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“Python正則表達式的基本原理是什么”吧!

    正則表達式是什么?

    正則表達式,又稱規則表達式,(英語:Regular Expression,在代碼中常簡寫為 regex、regexp 或 RE),它是計算機科學的一個概念。正則表達式通常被用來檢索、替換那些符合某個模式的文本。 許多程序設計語言都支持利用正則表達式進行字符串操作。例如在 Perl 中內建了一個功能強大的正則表達式引擎。正則表達式這個概念最初是由 Unix 中的工具軟件普及開的。正則表達式是對字符串(包括普通字符(例如,a 到 z 之間的字母)和特殊字符(稱為"元字符"))操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個"規則字符串",這個"規則字符串"用來表達對字符串的一種過濾邏輯。正則表達式是一種文本模式,模式描述在搜索文本時要匹配的一個或多個字符串。

    1.實例引入

    說了一大堆廢話,大家可能還是云里霧里的,我們通過實例來說明一下,我們可以用正則表達式測試工具,或者python都可以,首先,我們輸入一段文本。

    hello,my name is Tina,my phone number is 123456 and my web is http://tina.com.

                                   [a-zA-z]+://[^\s]*

    我們就可以獲取網頁鏈接,也就是文本中的url,是不是很神奇?

    這是因為它有自己的匹配規則,部分如下。

    模式描述
    .任意字符
    *0個或者多個表達式
    +一個或者多個表達式

      關于更多的匹配規則可自行查閱。

    ?,*,+,\d,\w 都是等價字符

    ?等價于匹配長度{0,1}

    *等價于匹配長度{0,}

    +等價于匹配長度{1,}

    \d 等價于[0-9]

    \D 等價于[^0-9]

    \w 等價于[A-Za-z_0-9]

    \W 等價于[^A-Za-z_0-9]

    2.match()

            這里介紹一個常用的匹配方法——match(),向他傳入要匹配的字符串以及正則表達式,就可以檢測這個正則表達式是否匹配字符串。

    匹配目標

    res = re.match('hello\s(\d+)sword')

    貪婪匹配

    res = re.match('hello.*(\d+)sword')

    3.findall()

    我們最常用的就是這個,我們看看這個是如何使用的。

    import re
     
    useData = str(input('請輸入字符串數據:'))
     
    '''
    匹配字符串中的數字,+是匹配前面的子表達式一次或多次
    '''
    digital = re.findall('\d+',useData)
     
    print(digital)

    我們看看運行結果

    Python正則表達式的基本原理是什么

     findall()函數是返回所有匹配到的字符串,返回值的數據類型為列表。

    常用符號

    我們再來說說正則表達式的常用符號吧。

    “.”字符為匹配任意單個字符。

    “\”字符為轉義字符。

    “[…]”為字符集。

    “(.*?)” 是python爬蟲最常用的一個字符,叫貪心算法,可以匹配任意的字符。

     下面我們看一個示例代碼。

    import re
     
    a=‘xxixxjshdxxlovexxsfhxxpythonxx'
     
    data=re.findall(‘xx(.*?)xx')
     
    print(data)

    我們運行一下,看下效果。

    運行結果
    [‘I’ ,‘love’,‘python’]

    特殊字符

     所謂特殊字符,就是一些有特殊含義的字符,比如講 runoo*b 中的 ,簡單的說就是表示任何字符串的意思。如果要查找字符串中的 * 符號,則需要對 * 進行轉義,即在其前加一個 \,runo*ob 匹配字符串 runo\*ob。

     許多元字符要求在試圖匹配它們時特別對待。若要匹配這些特殊字符,必須首先使字符"轉義",即,將反斜杠字符\ 放在它們前面。下表列出了正則表達式中的特殊字符:

    特別字符描述
    $

    匹配輸入字符串的結尾位置。如果設置了 RegExp 對象的 Multiline 屬性,則 $ 也匹配 ‘\n’ 或 ‘\r’。要匹配 $ 字符本身,請使用 $。

    ()標記一個子表達式的開始和結束位置。子表達式可以獲取供以后使用。要匹配這些字符,請使用 ( 和 )。
    *匹配前面的子表達式零次或多次。要匹配 * 字符,請使用 *。
    +匹配前面的子表達式一次或多次。要匹配 + 字符,請使用 +。
    .匹配除換行符 \n 之外的任何單字符。要匹配 . ,請使用 . 。

     概念說了一大堆,大家可能也記不住,我直接說幾個案例,大家就能明白其他的道理。

    這是某網的HTML,部分片段如下:

    <span class=“price”>§<i>123</i></span>
     
    <span class=“price”>§<i>133</i></span>
     
    <span class=“price”>§<i>156</i></span>
     
    <span class=“price”>§<i>189</i></span>

       大家會發現只有中間的一段不一樣,而不一樣的數據就是我們想要的,我們怎么用正則表達式提取出來呢.

    <span class=“price”>§<i>(.*?)</i></span>

    就可以了,我們看看效果吧。

    123
    133
    156
    189

    感謝各位的閱讀,以上就是“Python正則表達式的基本原理是什么”的內容了,經過本文的學習后,相信大家對Python正則表達式的基本原理是什么這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!

    向AI問一下細節

    免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

    AI

    新疆| 柏乡县| 邓州市| 和政县| 宿迁市| 休宁县| 资兴市| 农安县| 区。| 京山县| 新河县| 达州市| 霞浦县| 香河县| 上杭县| 平塘县| 威宁| 恭城| 兴化市| 武汉市| 会同县| 梧州市| 荔浦县| 柘城县| 耒阳市| 勃利县| 循化| 台前县| 濮阳市| 松滋市| 晋江市| 盖州市| 邯郸市| 会东县| 濮阳县| 文化| 沁阳市| 保定市| 鄢陵县| 西宁市| 和林格尔县|