亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

PaddleOCR怎么實現識別表情包文字功能

發布時間:2022-08-24 16:58:43 來源:億速云 閱讀:147 作者:iii 欄目:開發技術

這篇“PaddleOCR怎么實現識別表情包文字功能”文章的知識點大部分人都不太理解,所以小編給大家總結了以下內容,內容詳細,步驟清晰,具有一定的借鑒價值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“PaddleOCR怎么實現識別表情包文字功能”文章吧。

安裝 PaddleOCR

pip install paddlepaddle
pip install paddleocr

我這邊安裝后的版本:

paddleocr==2.5.0.3
paddlepaddle==2.3.1

在 macOS 安裝后,項目運行報錯報錯,忘了截圖,應該是與 setuptools 版本有關,解決方式:

pip install --upgrade setuptools==59.8.0

完成這些配置后,我們就可以愉快的玩耍了。

本地處理

import hashlib
import io
from PIL import Image
from paddleocr import PaddleOCR
def get_gif_pic_path(url):
    '''下載圖片,返回圖片第一幀路徑'''
    response = requests.get(url)
    filename = hashlib.md5(url.encode(encoding='utf-8')).hexdigest()
    img = Image.open(io.BytesIO(response.content))
    current = img.tell()
    img_path = f'bqb/{filename}_{current}.png'
    img.save(img_path)
    return img_path
def ocr_get_gif_text_sec(url) -> str:
    '''識別gif第一幀圖片的文字'''
    img_path = get_gif_pic_path(url)
    ocr = PaddleOCR(use_angle_cls=True, lang='ch')
    result = ocr.ocr(img_path, cls=True)
    data = []
    for item in result:
        data.append(item[1][0])
    return ",".join(data)
ocr_get_gif_text_sec('https://xxxxxx')

由于 gif 是個動圖,所以我們需要取出圖片的第一幀進行識別,get_gif_pic_path實現了這個功能。ocr_get_gif_text_sec 從 gif 第一幀的圖進行文字提取,返回的 result 是個數組,我們通過遍歷進行提取出來。

提取 gif 圖片的內容我們就完成了,兩個函數的功能也比較簡單。本文沒做 gif 全部文字的提取,有興趣可以挑戰下。

在 flask 中處理

當我們想在上傳圖片的時候,進行對圖片文字的處理怎么辦?難道要將上傳的圖保存到路徑再去識別么?這也是我在開發中遇到的一個問題,經過拆坑,答案是:不,你不需要。

思路:我們可以從表單中獲取上傳的圖片的二進制,然后將這個二進制傳給ocr.ocr(),那么ocr.ocr() 支持這個類型么?經過查看此函數源碼,我們可以讓它支持。

將圖片二進制轉化為 nparray 類型即可。下面是這個過程的具體代碼

from paddleocr import PaddleOCR
import numpy as np
import cv2
@app.route('/v1/upload_img', methods=['POST'])
def api_v1_upload_img():
    if 'file' not in request.files:
        return "no file part"
    file = request.files['file']
    if file.filename == '':
        return "no selected file"
    if file:
        file_name = file.filename
        # 獲取圖片的二進制
        res = upload_image(bytes=file.read(), filename=file_name)
        return res
    else:
        return "no file"
def upload_image(bytes, filename = None, mime_type = None):
    ocr = PaddleOCR(use_angle_cls=True, lang="ch")
    ## 核心步驟
    np_arr = np.frombuffer(bytes, dtype=np.uint8)
    img = cv2.imdecode(np_arr, cv2.IMREAD_COLOR)
    # 進行識別
    result = ocr.ocr(img=img, cls=True)
    ocr_result = []
    for line in result:
        ocr_result.append(line[1][0].strip())
    img_content = ' '.join(ocr_result)
    return img_content

api_v1_upload_img我們獲取到圖片二進制以及圖片名,將這些作為參數傳到upload_image,在upload_image中:

np_arr = np.frombuffer(bytes, dtype=np.uint8)
img = cv2.imdecode(np_arr, cv2.IMREAD_COLOR)

上面兩行代碼是這個需求的核心突破點。

還有一點就是建議不要將此識別功能部署到性能差的機器上,并發一下,完全扛不住,默默的留下兩行眼淚。

以上就是關于“PaddleOCR怎么實現識別表情包文字功能”這篇文章的內容,相信大家都有了一定的了解,希望小編分享的內容對大家有幫助,若想了解更多相關的知識內容,請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

六安市| 永福县| 柳河县| 衡南县| 桂林市| 南漳县| 东山县| 巴林右旗| 六盘水市| 潢川县| 怀仁县| 宜良县| 通许县| 镇康县| 莱阳市| 卓尼县| 呼伦贝尔市| 张北县| 上思县| 广安市| 容城县| 张家川| 崇阳县| 宁陕县| 行唐县| 抚宁县| 扎囊县| 元阳县| 景德镇市| 西平县| 晋江市| 肥城市| 方正县| 蓬莱市| 沂南县| 崇礼县| 钟祥市| 全南县| 玛纳斯县| 峨边| 嘉善县|