Tesseract是一個開源的OCR(光學字符識別)引擎,可以將圖片中的文字轉換為文本。下面是在Linux系統中安裝Tesseract的方法:
sudo apt update
sudo apt upgrade
sudo apt install tesseract-ocr
sudo apt install libtesseract-dev
tesseract --version
如果成功安裝,將顯示Tesseract的版本信息。
sudo apt install tesseract-ocr-[lang]
其中,[lang]是要安裝的語言代碼,例如英語是eng,西班牙語是spa等。
tesseract image.png output -l eng
以上就是在Linux系統中安裝Tesseract的方法。希望對您有幫助!