OCR识别
说明
- OCR模块是属于对图像进行识别
- OCR模块的对象前缀是ocr,例如 ocr.initOcr()这样调用
- 目前的OCR包含了mlkit,ocrLite,百度AI的easyedge,paddlOcrNcnnV5,paddleOcrOnnxV4,paddleOcrOnnxV5,Tesseract,paddleOcrOnline和百度在线识别
- 支持PPOCR-V4和PPOCR-V5模型
- Tesseract 请下载对应的语言包或者自己创建语言包
- 版本高于9.17.0的,请看 【Tesseract 例子 [高于9.17版本]】例 子,因为api已经更改了
ocr.newOcr 实例一个ocr
- 初始化一个ocr实例
- 适配版本 EC安卓 9.17.0+
function main() {
let o = ocr.newOcr();
// 这里做初始化和识别
o.releaseAll()
}
ocr.initOcr 初始化
- 初始化OCR模块
- @param map map参数表
- key分别为:
- type : OCR类型,值分别为 OCR , paddleOcrNcnnV5 = ncnn版本的PPOCR-V5模型, paddleLiteOcr=paddleLite, paddleOcrOnnxV4=onnx实现的PPOCR-V4模型,paddleOcrOnnxV5=onnx实现的PPOCR-V5模型, tess = Tesseract模块,baiduOnline=百度在在线识别模块,paddleocr=百度离线的paddleocr,easyedge=百度AI OCR
- ocrLite = ocrLite, paddleOcrOnline = EC自带的PC端的paddleOcr服务程序
- 如果类型是
tess
,请将训练的模型放到 /sdcard/tessdata/ 文件夹下
- 参数设置为 :
{"type":"tess","language":"chi_sim","debug":false,"ocrEngineMode":3}
- language: 语言数据集文件, 例如 chi_sim.traineddata 代表是中文简体语言,参数就填写 chi_sim,多个可以用+链接,例如:chi_sim+eng+num
- ocrEngineMode: 识别引擎类型,0 OEM_TESSERACT_ONLY , 1 OEM_LSTM_ONLY,2 OEM_TESSERACT_LSTM_COMBINED,3 OEM_DEFAULT
- rilLevel: PageIteratorLevel 参数,-1 自适应, 0: RIL_BLOCK, 1: RIL_PARA, 2: RIL_TEXTLINE, 3: RIL_WORD, 4:RIL_SYMBOL
- debug: 代码是否设置调试模式,一般设置false即可
- path: 放tessdata的文件夹路径,不要加上tessdata,是tessdata文件夹的父级
- 参数设置为 :