PaddleOCR(1):PaddleOCR介绍
1 PaddleOCR介绍
PaddleOCR是⼀款由百度开发的OCR(光学字符识别)⼯具库。它旨在为开发者提供⼀套丰富、领先、且实⽤的OCR⼯具,以帮助他们训练出更好的模型并应⽤于实际场景。
PaddleOCR具有以下特点:
超轻量模型:PaddleOCR采⽤了轻量级模型,以便在移动设备和嵌⼊式设备上运⾏。
- 通⽤识别⼤模型:除了轻量级模型外,PaddleOCR还提供了通⽤识别⼤模型,以适应更多的应⽤场景。
- 算法丰富且开源:PaddleOCR集成了多种与OCR相关的前沿算法,并进⾏了开源,以便更多的开发者可以共享和使⽤。
- ⽀持⾃定义训练:开发者可以根据⾃⼰的需求,使⽤PaddleOCR提供的⼯具和框架⾃定义训练模型。
- ⽀持C++预测、端侧部署、服务部署:PaddleOCR不仅⽀持C++预测,还⽀持在端侧和服务上进⾏部署,
- 具有很好的灵活性和可扩展性。
- ⾏业特⾊模型:PaddleOCR开发了具有⾏业特⾊的模型PP-OCR和PP-Structure,并打通了数据⽣产、模型训练、压缩、预测部署的全流程。
总的来说,PaddleOCR是⼀款功能强⼤、实⽤便捷的OCR⼯具库,它提供了⼀系列前沿的算法和⾃定义训练的⽀持,旨在帮助开发者更好地应⽤OCR技术于各种实际场景中。
github:https://github.com/PaddlePaddle/PaddleOCR
2 PaddleOCR应⽤场景
表单识别、票据识别、电表识别、⻋牌识别、身份证&银⾏卡、⼿写体识别、化验单识别 等等
3 PP-OCRv4模型
这边使用PP-OCRv4模型。
PP-OCRv4提供⼀套通⽤的OCR识别模型,可以识别多语⾔的⽂字,在速度和精度上都达到了⽐较好的效果。
不指定模型版本,会默认下载最新的模型(PP-OCRv4)。
具体参考
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.7/doc/doc_ch/models_list.md
使⽤时,我们只需要下载推理模型即可。
下载模型后,解压放到对应⽬录即可:
windows为C:\Users\⽤户\.paddleocr\whl
linux为⽤户⽬录下\.paddleocr\whl