python muggle_ocr庫用法及實例代碼
1、muggle_ocr是一款輕量級的ocr識別庫,對于python來說是識別率較高的圖片驗證碼模塊。
2、主要用于識別各種類型的驗證碼,一般文字提取效果稍差。
安裝命令pip install muggle_ocr實例
import muggle_ocr# 初始化sdk;model_type 包含了 ModelType.OCR/ModelType.Captcha 兩種模式,分別對應常規(guī)圖片與驗證碼sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.Captcha) with open(r'd:Desktop四位驗證碼.png', 'rb') as f: img = f.read() text = sdk.predict(image_bytes=img)print(text)
相關實例擴展:
import time# 1. 導入包import muggle_ocr'''使用預置模型,預置模型包含了[ModelType.OCR, ModelType.Captcha] 兩種其中 ModelType.OCR 用于識別普通印刷文本, ModelType.Captcha 用于識別4-6位簡單英數(shù)驗證碼'''# 打開印刷文本圖片with open(r'test1.png', 'rb') as f: ocr_bytes = f.read()# 打開驗證碼圖片with open(r'test2.jpg', 'rb') as f: captcha_bytes = f.read()# 2. 初始化;model_type 可選: [ModelType.OCR, ModelType.Captcha]sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.OCR)# ModelType.Captcha 可識別光學印刷文本for i in range(5): st = time.time() # 3. 調(diào)用預測函數(shù) text = sdk.predict(image_bytes=ocr_bytes) print(text, time.time() - st)# ModelType.Captcha 可識別4-6位驗證碼sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.Captcha)for i in range(5): st = time.time() # 3. 調(diào)用預測函數(shù) text = sdk.predict(image_bytes=captcha_bytes) print(text, time.time() - st)'''使用自定義模型支持基于 https://github.com/kerlomz/captcha_trainer 框架訓練的模型訓練完成后,進入導出編譯模型的[out]路徑下, 把[graph]路徑下的pb模型和[model]下的yaml配置文件放到同一路徑下。將 conf_path 參數(shù)指定為 yaml配置文件 的絕對或項目相對路徑即可,其他步驟一致,如下示例:'''with open(r'test3.jpg', 'rb') as f: b = f.read()sdk = muggle_ocr.SDK(conf_path='./ocr.yaml')text = sdk.predict(image_bytes=b)
到此這篇關于python muggle_ocr庫用法及實例代碼的文章就介紹到這了,更多相關python muggle_ocr庫的介紹內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持好吧啦網(wǎng)!
