当前位置：首页 > news >正文

CnSTD+CnOCR的联合使用

news 2025/8/29 21:24:45

复杂背景的OCR，使用CnSTD定位图像中的文本区域，然后CnOCR对每一个区域内的文字进行识别。

安装

有一个注意点：如果直接pip安装就会安装最新版的CnSTD和CnOCR，需要使用v5版本的模型，然而我在项目的官网并没有下载到v5版本的模型，甚至在CSDN上花了几十元买了模型也不能使用，我手里的模型是v4版本的，所以不能直接安装最新版否则会出错：

会提示找不到v5版本的模型。

解决办法：安装旧版的。

支持v4模型的最新版本：

pip install cnstd==1.2.5
pip install cnocr==2.3.1

基本的使用

from cnstd import CnStd
from cnocr import CnOcrstd = CnStd()
ocr = CnOcr()box_infos = std.detect('test.jpg', resized_shape=(768, 1024))print(len(box_infos['detected_texts']))
for box_info in box_infos['detected_texts']:cropped_img = box_info['cropped_img']ocr_res = ocr.ocr_for_single_line(cropped_img)print('ocr result: %s' % str(ocr_res))

艾玛，识别效果还是令人满意的。

http://www.xdnf.cn/news/1383949.html

相关文章：

虚拟机逃逸攻防演练技术文章大纲

编写TreeMap自定义排序的插曲

InstructGPT：使用人类反馈训练语言模型以遵循指令

文本处理与模型对比：BERT, Prompt, Regex, TF-IDF

在angular20中使用monaco-editor

任天堂NDS中文游戏ROM精选毕业整合包整理分享！ +NDS模拟器

Maven 编译打包一个比较有趣的问题

机器视觉学习-day08-图像缩放

企业如何管理跨多个系统的主数据？

Maven核心用法

3446. 按对角线进行矩阵排序

[数组]27.移除元素

Kafka02-集群选主

【Node.js从 0 到 1：入门实战与项目驱动】2.4 开发工具推荐（VS Code 、IDEA及插件、终端工具、调试工具）

配置 Gitlab 和 Elasticsearch/Zoekt 并使用 Docker Metadata 数据库、Camo 代理服务

AI 如何 “看见” 世界？计算机视觉（CV）的核心技术：图像识别、目标检测与语义分割

Day16_【机器学习常见术语】

宋红康 JVM 笔记 Day08｜堆

MySQL 中 tinyint(1)、int(11)、bigint(20) 的数字到底是什么意思？

Vibe Coding 概念提出者 AndrejKarpathy 谈强化学习。

在jdk8的spring-boot-2.7.x项目中集成logback-1.3.x

通过代码认识 CNN：用 PyTorch 实现卷积神经网络识别手写数字

Maven 项目单元测试实战指南：从环境搭建到问题排查全解析

使用astah制作专业状态图及C/C++实现解析

Docker 详解+示例

进程组会话作业控制守护进程

【Canvas与盾牌】“靡不有初，鲜克有终”黄竖条盾牌

Redis 哨兵（Sentinel）全面解析

海康相机开发---设备登录

Subdev与Media子系统的数据结构