C++ | PaddleOCR+OpenCV 实现文本识别的步骤和代码演示

最编程 2024-05-19 12:38:52

...

导读

本期将介绍并演示C++ OpenCV使用PaddleOCR做文字识别的步骤与效果。

介绍

百度深度学习框架PaddlePaddle开源的OCR项目PaddleOCR近期霸榜github。使用测试后发现识别效果很好，对于简单的应用(车票车牌身份证等)，直接用项目提供的模型即可使用。特殊应用，可自己训练后使用。上篇文章已介绍了Python OpenCV使用步骤，文章链接如下：

本文将介绍C++ OpenCV使用PaddleOCR做文字识别步骤。

第一部分使用Halcon OCR实例中的部分图片验证，测试效果如下视频：

第二部分使用车牌识别图片验证，测试效果如下视频：

(1) 下载PaddleOCR 2.0源码：

https://github.com/PaddlePaddle/PaddleOCR

解压后：

(2) 下载paddle_inference_install_dir文件并解压：

https://www.paddlepaddle.org.cn/documentation/docs/en/guides/05_inference_deployment/inference/windows_cpp_inference_en.html

解压后：

(3) 下载OpenCV Release版并解压，这里使用4.4.0版本：

(4) CMake编译PaddleOCR源码：使用版本我这里选择现成的VS2017 x64，CMake 3.16，注意下面蓝色部分中3个目录配置，然后依次Config和Generate，生成ocr_system.sln。

(5) 打开ocr_system.sln，选择x64 Release模式，生成ALL_BUILD，生成成功后，Release文件夹会生成ocr_system.exe。

(6) 下载识别模型(轻量级和通用型模型)，下载地址：

https://github.com/PaddlePaddle/PaddleOCR

轻量级模型(模型文件小约9.4M,识别速度快,时间约为通用型模型一半，识别效果一般情况够用,相较通用型模型差一些)：

通用型模型(模型文件大约155M,识别速度慢,识别效果相较轻量级模型更好)：

(7) 将其他所需文件复制到ocr_system.exe同目录，包括config.txt(配置文件)、ppocr_keys_v1.txt(字库文件)

config.txt配置如下，注意修改下面红色部分路径为自己的

所需文件如下：

(8) cmd运行测试:ocr_system.exe config.txt 1.png

(9) 如果想将功能添加到自己项目中，可以查看main.cpp做参考

上面效果预览中的2个视频效果就是我加了MFC界面的简单应用，大家也可以自己尝试。视频中的MFC Demo源码与素材均已上传至知识星球中，需要的朋友可以加入获取。