亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何理解php正則提取圖片地址

發布時間:2021-10-08 11:05:40 來源:億速云 閱讀:114 作者:iii 欄目:開發技術

本篇內容介紹了“如何理解php正則提取圖片地址”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!

復制代碼 代碼如下:

<img title="囧2" src="http://www.xlanda.net/wp-admin/%E5%9B%A73" alt="囧4" title="囧2" width="5" height="6" />

囧1和囧2是非必需的,若要通過XHTML認證囧4、囧5、囧6必不可少,囧3是核心內容,當然就不能少了。

就正則談正則的話,我寫出的最短匹配是

復制代碼 代碼如下:

(?<=img.+?src=").*?(?=")

不過,這條在php里不行,會出現:

Warning: preg_match_all() [function.preg-match-all]: Compilation failed: lookbehind assertion is not fixed length at offset *** in ***

糾結了很久,都不行,原因何在呢?試了很多次,終于發現問題在(?<=img.+?src=")這個零寬斷言里,在php中,零寬斷言里不支持類似“*”、“+”這些無限次的東西,于是報錯了,把“.+?”改為定長就好。不過,要“img”和“src=”之間定長基本上是不可能的。通常,圖片地址的img和src只會相隔一個很簡單的空格,但不排除某些情況在src之前,img后有alt、titlte等東西。

所以

復制代碼 代碼如下:

(?<=img.src=").*?(?=")



復制代碼 代碼如下:

(?<=img\ssrc=").*?(?=")

可能可以,但不保證100%沒問題。

你也許會問,單純

復制代碼 代碼如下:

(?<=src=").*?(?=")

不行嗎?通常情況,可以,但,搜索過頁面的盆友應該知道,除了圖片地址用src開頭以外,javascript地址也用src開頭!而且,太多神通廣大的不可預知因素隱含其中,于是這個貌似很簡短完美的寫法就行不通了。

你又或許會問,聰明簡短的不行,我把圖片的后綴列出來,總該可以了吧,如

復制代碼 代碼如下:

(?<=src=").*?\.(jpg|jpeg|gif|png|bmp|JPG|JPEG|GIF|PNG|BMP)

的確,這個寫法實在是很老實,不過,你見過沒有后綴的圖片?wwe.com 有很多這種例子呢

RAW http://us.wwe.com/content/media/images/Headers/15559182
SmackDown http://us.wwe.com/content/media/images/Headers/15854138
NXT http://us.wwe.com/content/media/images/Headers/15929136
Superstars http://us.wwe.com/content/media/images/Headers/15815850

上面的網址都是圖片,但都沒有傳統后綴,你老實也沒用,還是不能獲取到它們。

怎么辦呢?還可以這樣

復制代碼 代碼如下:

<img(.*?)src="(.*?)(?=")

和上面的表達式不同,這次的結果中array[0]的內容不是我們想要的,我們要的圖片地址在array[2]里。為什么呢?因為我們用了2個 (.*?),每個“()”的東西會自動存在一個組里,而array[0]代表結果的匯總,array[1]包含了img和src里的所有東西,array[2]才輪到我們想要的圖片地址。這種匹配方法,既能匹配有傳統后綴的圖片,也能匹配一些無后綴的圖片文件,同時又不會殺錯其它src=文件。個人感覺還是不錯的,呵呵。當然了,如果你還有更好的建議,請馬上留言,全球人民都會感謝你!

你到底要什么樣的圖片,是固定格式還是其它?得具體情況具體分析呢。

我的建議是:

如果你要的圖片地址的格式是img空格src=的,請使用:(?<=img.src=").*?(?=") ,數組唯一,你懂的。

否則,請使用<img(.*?)src="(.*?)(?=") ,記得留意有用內容所在的數組位置哦!

再談php正則提取圖片地址

前天寫了小談php正則提取圖片地址 ,但其實,提取src=里面的圖片地址還不足夠,因為不能保證那個地址一定是絕對地址,完全的地址,如果那是相對的呢?如果地址諸如:

albums/Candids/thumb_P1050338.jpg
/content/media/touts/5271608/5271654/15320982

那該如何是好?

有時在這些地址前面需要加http://example1.com/ ,有些甚至要加http://example1.com/example2/.../ 于是,要寫出出一種法則符合所有要求,簡直是天方夜譚。只能見機行事對癥下藥。有時,需要從前面動刀,有時需要從后面砍斷。

今天,我驚訝地知道了一個道理,原來http://example.com/ 和http://example.com////// 是一樣的!

https://cache.yisu.com/upload/information/20201209/266/42953.png

https://cache.yisu.com/upload/information/20201209/266/42954.png

最終你都能到達

于是,對于一開始提到的兩個相對地址如果要強行加入某前綴恢復成絕對地址的話,也不管前面有沒有“/”,只管加一個“/”就好,“有殺錯,沒放過” 嘛,多一個顯示仍會正常,但少一個“/”,嘿嘿,你就別想成功了。開始的時候我還沒意識到這種東西,復制了一大段代碼,把一樣的東西硬生生弄兩份,一份加 “./.”,一份不加。我這個火星來的,浪費時間了。

放出2個地址,公測一下網頁獲取圖片的情況:

針對任何網頁,需要登入的除外:http://xyark.serw5.com/img.php
針對Coppermine Photo Gallery 系統:http://xyark.serw5.com/g.php (如果你認為彈出原圖的js頁面也需要的話,我只好囧你了)

普頁是個對抓取任何圖片的嘗試,系統專頁是為了展示什么叫做具體情況具體分析。試過的童鞋會知道,普頁對某些使用Coppermine Photo Gallery系統的網站是行不通的,原因何在?就是那個前綴搞的鬼!但系統專頁就能很好地避開了這個問題。

“如何理解php正則提取圖片地址”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

php
AI

定州市| 泊头市| 盐亭县| 兴海县| 金门县| 昌江| 阳原县| 体育| 勐海县| 明溪县| 江山市| 扶风县| 神农架林区| 瓦房店市| 双流县| 阿克陶县| 水城县| 开原市| 昔阳县| 浑源县| 牙克石市| 梁山县| 织金县| 淅川县| 宜宾县| 通山县| 光泽县| 玛纳斯县| 同心县| 凭祥市| 抚顺县| 尼木县| 平阳县| 资讯| 崇信县| 福安市| 天津市| 巫溪县| 林周县| 怀仁县| 东台市|