您好,登錄后才能下訂單哦!
這篇文章主要介紹了python如何處理驗證碼圖片,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
由于我們通過selenium拿到的圖片會很模糊,所以使用Tesseract識別之前要對圖片先進行處理。
第一步就是二值化,設定閾值,低于閾值全部為白色(置0),其余黑色(置1)。
import pytesseract from PIL import Image,ImageEnhance def binaryzation(threshold=145): #降噪,圖片二值化 table = [] for i in range(256): if i < threshold: table.append(0) else: table.append(1) return table image = Image.open('newcode.jpg') #打開圖片 image = image.convert('L') #轉化為灰度圖 image.show() image = image.point(binaryzation(), '1') #二值化 image.show()
這是原始圖片 :
轉化為灰度圖:
二值化:
感謝你能夠認真閱讀完這篇文章,希望小編分享的“python如何處理驗證碼圖片”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。