PaddleOCR 手写识别模型:标注到训练
生活随笔
收集整理的這篇文章主要介紹了
PaddleOCR 手写识别模型:标注到训练
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
目錄
- 版本數據
- 流程
- 標注
- 訓練
- 轉換
- 推理
- 遇到報錯
- 參考
本文記錄一下自己標注的數據,到訓練后模型轉換的流程;本文只訓練識別模型。
版本數據
Python == 3.8
Paddlepaddle >=2.0
PaddleOCR >= 2.0
這里數據使用的是中科院手寫數據集及網上開數據;整合后處理尺寸最大為640*32;訓練24w,測試1.7w;可直接用于paddleOCR的訓練。
數據下載鏈接:
https://aistudio.baidu.com/aistudio/datasetdetail/102884
流程
標注
- 這里需要先安裝PyQt5等其他依賴項
- 標注后會在圖片路徑下保存一個label.txt,格式如圖:
- 實際train.txt需要將以上格式轉化為SimpleDataSet格式(并且對應需要將圖片切出 320*32 大小):
- 注意路徑與標簽的分隔需要使用 \t 分割
- 最終目錄格式如下
訓練
轉換
- 訓練好的模型文件不能直接使用,需要經過轉換
推理
python tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_ppocr_mobile_v2.0_det_infer/" --rec_model_dir="./inference/ch_ppocr_mobile_v2.0_rec_infer/" --cls_model_dir="./inference/ch_ppocr_mobile_v2.0_cls_infer/" --use_angle_cls=True --use_space_char=True我這里訓練的手寫體數據,原來的打印體精度變差很多。。。
遇到報錯
參考
https://github.com/PaddlePaddle/PaddleOCR
http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html
總結
以上是生活随笔為你收集整理的PaddleOCR 手写识别模型:标注到训练的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 前端学习(2887):如何短时间内实现v
- 下一篇: H264视频压缩算法简析