亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python識別圖像并提取文字的實現

發布時間:2021-06-03 16:34:36 來源:億速云 閱讀:390 作者:Leah 欄目:開發技術

python識別圖像并提取文字的實現?很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

1. 依賴安裝

yum install -y automake autoconf libtool gcc gcc-c++

2. 安裝leptonica

Leptonica主要用于圖像處理和圖像分析

原則上所有的庫文件都是可以直接用yum安裝的,如果想要具體的某個版本,可以前往官方源下載對應版本然后按照對應方式編譯

wget http://www.leptonica.org/source/leptonica-1.74.4.tar.gz
tar -zxvf leptonica-1.74.4.tar.gz
cd leptonica-1.74.4/
./configure
make && make install

3. 安裝tesseract

其他各版本可以在這里下載并自行編譯,也提供直接使用的文件。

yum install tesseract

4. 驗證安裝

tesseract --version

5. 語言包下載

前往tesseract-ocr/tessdata下載相應的語言包,然后將之移動到tessdata目錄下,可以用whereis tesseract查看一下具體的目錄,我的是/usr/share/tesseract/tessdata/mv *.traineddata /usr/local/share/tessdata/

6. 查看目前已下載的語言

tesseract --list-langs

使用

# tesseract
Usage:
 tesseract --help | --help-psm | --help-oem | --version
 tesseract --list-langs [--tessdata-dir PATH]
 tesseract --print-parameters [options...] [configfile...]
 tesseract imagename|stdin outputbase|stdout [options...] [configfile...]

OCR options:
 --tessdata-dir PATH  Specify the location of tessdata path.
 --user-words PATH   Specify the location of user words file.
 --user-patterns PATH Specify the location of user patterns file.
 -l LANG[+LANG]    Specify language(s) used for OCR.
 -c VAR=VALUE     Set value for config variables.
            Multiple -c arguments are allowed.
 --psm NUM       Specify page segmentation mode.
 --oem NUM       Specify OCR Engine mode.
NOTE: These options must occur before any configfile.

語法

tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]
  • imagename:圖片名字

  • outputbase:指定輸出,如果希望直接輸出而不是保存到文件,那么就使用 stdout,否則這個參數將會作為保存結果的文件的前綴

  • -l指定語言文件,默認使用英文

  • tesseract --print-parameters:查看更多參數信息

  • 使用-c指定單項參數的值或者將配置寫入配置文件放在命令最后(支持多個配置文件)

  • psm 識別圖像的方式

0:定向腳本監測(OSD)

1: 使用OSD自動分頁

2 :自動分頁,但是不使用OSD或OCR(Optical Character Recognition,光學字符識別)

3 :全自動分頁,但是沒有使用OSD(默認)

4 :假設可變大小的一個文本列。

5 :假設垂直對齊文本的單個統一塊。

6 :假設一個統一的文本塊。

7 :將圖像視為單個文本行。

8 :將圖像視為單個詞。

9 :將圖像視為圓中的單個詞。

10 :將圖像視為單個字符。

python中使用

Tesseract安裝完成后可以很方便的被Python調用,但是需要pillow和pytesseract的支持。

python中轉換

image_to_data(image, lang=None, config='', nice=0, output_type=Output.STRING)
  • image Object,由Tesseract處理的圖像的PIL Image/NumPy數組

  • lang String,Tesseract語言代碼字符串

  • config String,任何其他配置字符串,例如:config='--psm 6'

  • 語言文件可以疊加,用“+”隔開

  • 我們也可以在這里進行tessdata路徑的設置,跟在config里面即可

  • 更多配置包括config和psm都和tesseract類似

實例:

流程: 打開圖片,配置,轉換,可以通過Image的open或者cv2的imread打開圖片,之后對圖片進行對比度增強,降噪等處理,效果會好一些。

from PIL import Image
import pytesseract
class Languages:
  CHS = 'chi_sim'
  ENG = 'eng'
def img_to_str(image_path, lang=Languages.ENG):
  return pytesseract.image_to_string(Image.open(image_path), lang)
print(img_to_str('pic/numu.png', lang=Languages.ENG))
print(img_to_str('pic/pro.png', lang=Languages.ENG))

python識別圖像并提取文字的實現

python識別圖像并提取文字的實現

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

靖宇县| 竹溪县| 陵川县| 达拉特旗| 九江市| 贵德县| 怀集县| 新安县| 馆陶县| 汉中市| 邵阳县| 承德县| 屯昌县| 聊城市| 澄城县| 绥中县| 盐源县| 武乡县| 临高县| 镇原县| 敦化市| 信宜市| 武定县| 于田县| 丹阳市| 高唐县| 汉寿县| 眉山市| 福贡县| 静宁县| 吉木萨尔县| 司法| 密云县| 石嘴山市| 罗甸县| 湟中县| 龙陵县| 寻乌县| 汾阳市| 遂昌县| 元氏县|