PaddleOCR(3):PaddleOCR命令讲解
前⾯在验证PaddleOCR安装是否成功时已经简单使⽤过命令了,下⾯我们详细的讲解⼀下paddleocr指令。查看具体使⽤⽅法:
paddleocr --help
1 检测+⽅向分类器+识别全流程
paddleocr --image_dir ./imgs/11.jpg --use_angle_cls true --use_gpu false --ocr_version PP-OCRv3
- --image_dir 识别图⽚的路径
- --use_angle_cls true 设置使⽤⽅向分类器识别180度旋转⽂字
- --use_gpu false 设置不使⽤GPU
- --ocr_version PP-OCRv3 制定模型,PaddleOCR默认会下载使⽤最新的模型,当前是PP-OCRv3, 这⾥只是告诉⼤家这个参数怎么⽤
测试一下:
paddleocr --image_dir 3333.jpg --use_angle_cls true --use_gpu false --ocr_version PP-OCRv3
输出结果是结果是⼀个list,每个item包含了⽂本框(坐标),⽂字和识别置信度:
[2025/06/05 15:56:12] ppocr INFO: [[[14.0, 34.0], [354.0, 34.0], [354.0, 58.0], [14.0, 58.0]], ('Cesium主要功能介绍', 0.8644992709159851)]
[2025/06/05 15:56:12] ppocr INFO: [[[9.0, 131.0], [517.0, 131.0], [517.0, 151.0], [9.0, 151.0]], ('·使用WMS,TMS、ESRI等标准绘制影像图层', 0.8966396450996399)]
[2025/06/05 15:56:12] ppocr INFO: [[[10.0, 176.0], [705.0, 176.0], [705.0, 193.0], [10.0, 193.0]], ('·具有高分辨率的地形三维,可以清晰地展示各种连绵起伏的山脉', 0.8893025517463684)]
[2025/06/05 15:56:12] ppocr INFO: [[[10.0, 218.0], [780.0, 218.0], [780.0, 238.0], [10.0, 238.0]], ('·具有采用kML,GeoJson、TopoJson格式的数据进行失量绘制的功能', 0.9098474383354187)]
[2025/06/05 15:56:12] ppocr INFO: [[[9.0, 261.0], [417.0, 261.0], [417.0, 281.0], [9.0, 281.0]], ('使用COLLADA和gITF绘制三维模型', 0.9275234937667847)]
[2025/06/05 15:56:12] ppocr INFO: [[[10.0, 305.0], [525.0, 305.0], [525.0, 322.0], [10.0, 322.0]], ('·可以调用WebGL的低级图元进行几何体的染', 0.832997739315033)]
[2025/06/05 15:56:12] ppocr INFO: [[[9.0, 345.0], [634.0, 346.0], [634.0, 366.0], [9.0, 365.0]], ('可以在地球上绘制广告牌、标签、文本、折线、多边形等', 0.9558115601539612)]
[2025/06/05 15:56:12] ppocr INFO: [[[11.0, 391.0], [634.0, 391.0], [634.0, 408.0], [11.0, 408.0]], ('·通过调整摄像机角度来创建随看时间变化的物体移动路径', 0.9276871085166931)]
[2025/06/05 15:56:12] ppocr INFO: [[[10.0, 434.0], [296.0, 434.0], [296.0, 451.0], [10.0, 451.0]], ('·具有点云高速染的功能', 0.8458091616630554)]
[2025/06/05 15:56:12] ppocr INFO: [[[8.0, 474.0], [368.0, 475.0], [368.0, 495.0], [8.0, 494.0]], ('·动态调整地球色调与亮度对比度', 0.9068328142166138)]
[2025/06/05 15:56:12] ppocr INFO: [[[9.0, 518.0], [200.0, 518.0], [200.0, 538.0], [9.0, 538.0]], ('·具有热力图功能', 0.867587685585022)]
[2025/06/05 15:56:12] ppocr INFO: [[[9.0, 561.0], [466.0, 561.0], [466.0, 581.0], [9.0, 581.0]], ('·具有地形等高线与等高线自定义颜色功能', 0.899490475654602)]
[2025/06/05 15:56:12] ppocr INFO: [[[8.0, 604.0], [321.0, 604.0], [321.0, 624.0], [8.0, 624.0]], ('·在球体上绘制柱状图的功能', 0.9237991571426392)]
结果如下:
⽂本框分别表示 左上、右上、右下、左下 顺时针⽅向矩形框的四个⻆像素坐标
2 单独使用检测
在命令行中设置 --rec为false
paddleocr --image_dir 3333.jpg --rec false
结果是⼀个list,每个item只包含⽂本框:
[2025/06/05 16:01:12] ppocr INFO: [[9.0, 601.0], [321.0, 602.0], [321.0, 623.0], [9.0, 622.0]]
[2025/06/05 16:01:12] ppocr INFO: [[14.0, 560.0], [467.0, 560.0], [467.0, 580.0], [14.0, 580.0]]
[2025/06/05 16:01:12] ppocr INFO: [[14.0, 517.0], [201.0, 517.0], [201.0, 538.0], [14.0, 538.0]]
[2025/06/05 16:01:12] ppocr INFO: [[13.0, 473.0], [369.0, 474.0], [369.0, 495.0], [13.0, 494.0]]
[2025/06/05 16:01:12] ppocr INFO: [[15.0, 433.0], [295.0, 433.0], [295.0, 450.0], [15.0, 450.0]]
[2025/06/05 16:01:12] ppocr INFO: [[14.0, 389.0], [635.0, 389.0], [635.0, 409.0], [14.0, 409.0]]
[2025/06/05 16:01:12] ppocr INFO: [[31.0, 346.0], [635.0, 346.0], [635.0, 366.0], [31.0, 366.0]]
[2025/06/05 16:01:12] ppocr INFO: [[18.0, 349.0], [38.0, 349.0], [38.0, 360.0], [18.0, 360.0]]
[2025/06/05 16:01:12] ppocr INFO: [[14.0, 300.0], [527.0, 302.0], [527.0, 325.0], [14.0, 323.0]]
[2025/06/05 16:01:12] ppocr INFO: [[14.0, 260.0], [418.0, 260.0], [418.0, 280.0], [14.0, 280.0]]
[2025/06/05 16:01:12] ppocr INFO: [[14.0, 218.0], [779.0, 218.0], [779.0, 238.0], [14.0, 238.0]]
[2025/06/05 16:01:12] ppocr INFO: [[14.0, 174.0], [706.0, 174.0], [706.0, 194.0], [14.0, 194.0]]
[2025/06/05 16:01:12] ppocr INFO: [[13.0, 130.0], [519.0, 130.0], [519.0, 154.0], [13.0, 154.0]]
[2025/06/05 16:01:12] ppocr INFO: [[14.0, 88.0], [461.0, 88.0], [461.0, 108.0], [14.0, 108.0]]
[2025/06/05 16:01:12] ppocr INFO: [[12.0, 32.0], [355.0, 32.0], [355.0, 59.0], [12.0, 59.0]]
3 单独使⽤识别
在命令中设置--det为false。
paddleocr --image_dir ./imgs_words/ch/word_1.jpg --det false
结果如下:
结果是⼀个list,每个item只包含识别结果和识别置信度
('2.安装tesseract-ocr', 0.9207692742347717)
4 指定语言--lang(默认也能识别英⽂,制定语⾔效果会更好)
paddleocr --image_dir 1.jpg --lang=en
5 解析pdf⽂件
paddleocr也⽀持输⼊pdf⽂件,并且可以通过指定参数page_num来控制推理前⾯⼏⻚,默认为0,表示推理所有⻚
paddleocr --image_dir ./xxx.pdf --use_angle_cls true --use_gpu false --page_num 2