当前位置: 首页 > news >正文

CnSTD+CnOCR的联合使用

        复杂背景的OCR,使用CnSTD定位图像中的文本区域,然后CnOCR对每一个区域内的文字进行识别。

  • 安装

        有一个注意点:如果直接pip安装就会安装最新版的CnSTD和CnOCR,需要使用v5版本的模型,然而我在项目的官网并没有下载到v5版本的模型,甚至在CSDN上花了几十元买了模型也不能使用,我手里的模型是v4版本的,所以不能直接安装最新版否则会出错:

会提示找不到v5版本的模型。

解决办法:安装旧版的。

支持v4模型的最新版本:

pip install cnstd==1.2.5
pip install cnocr==2.3.1
  • 基本的使用

from cnstd import CnStd
from cnocr import CnOcrstd = CnStd()
ocr = CnOcr()box_infos = std.detect('test.jpg', resized_shape=(768, 1024))print(len(box_infos['detected_texts']))
for box_info in box_infos['detected_texts']:cropped_img = box_info['cropped_img']ocr_res = ocr.ocr_for_single_line(cropped_img)print('ocr result: %s' % str(ocr_res))

艾玛,识别效果还是令人满意的。

http://www.xdnf.cn/news/1383949.html

相关文章:

  • 虚拟机逃逸攻防演练技术文章大纲
  • 编写TreeMap自定义排序的插曲
  • InstructGPT:使用人类反馈训练语言模型以遵循指令
  • 文本处理与模型对比:BERT, Prompt, Regex, TF-IDF
  • 在angular20中使用monaco-editor
  • 任天堂NDS中文游戏ROM精选毕业整合包整理分享! +NDS模拟器
  • Maven 编译打包一个比较有趣的问题
  • 机器视觉学习-day08-图像缩放
  • 企业如何管理跨多个系统的主数据?
  • Maven核心用法
  • 3446. 按对角线进行矩阵排序
  • [数组]27.移除元素
  • Kafka02-集群选主
  • 【Node.js从 0 到 1:入门实战与项目驱动】2.4 开发工具推荐(VS Code 、IDEA及插件、终端工具、调试工具)
  • 配置 Gitlab 和 Elasticsearch/Zoekt 并使用 Docker Metadata 数据库、Camo 代理服务
  • AI 如何 “看见” 世界?计算机视觉(CV)的核心技术:图像识别、目标检测与语义分割
  • Day16_【机器学习常见术语】
  • 宋红康 JVM 笔记 Day08|堆
  • MySQL 中 tinyint(1)、int(11)、bigint(20) 的数字到底是什么意思?
  • Vibe Coding 概念提出者 AndrejKarpathy 谈强化学习。
  • 在jdk8的spring-boot-2.7.x项目中集成logback-1.3.x
  • 通过代码认识 CNN:用 PyTorch 实现卷积神经网络识别手写数字
  • Maven 项目单元测试实战指南:从环境搭建到问题排查全解析
  • 使用astah制作专业状态图及C/C++实现解析
  • Docker 详解+示例
  • 进程组 会话 作业控制 守护进程
  • 【Canvas与盾牌】“靡不有初,鲜克有终”黄竖条盾牌
  • Redis 哨兵(Sentinel)全面解析
  • 海康相机开发---设备登录
  • Subdev与Media子系统的数据结构