当前位置: 首页 > news >正文

Python 实现简单OCR文本识别

Ubuntu系统:22.04

python版本:3.9

安装依赖库:

# 安装Tesseract引擎和开发库
sudo apt update && sudo apt install tesseract-ocr libtesseract-dev# 安装英语+中文语言包
sudo apt install tesseract-ocr-eng tesseract-ocr-chi-sim# 安装Python依赖
pip install pytesseract pillow -i https://mirrors.aliyun.com/pypi/simple

代码实现:

# 安装必要依赖(Ubuntu/Debian)
# 先执行以下终端命令:
# sudo apt update && sudo apt install tesseract-ocr libtesseract-dev
# sudo apt install tesseract-ocr-chi-sim  # 中文支持(可选)
# pip3 install pytesseract pillowfrom PIL import Image
import pytesseract
import sys
import osdef ocr_core(image_path):"""核心OCR函数:param image_path: 图片路径:return: 识别后的文本"""try:if not os.path.exists(image_path):raise FileNotFoundError(f"文件 {image_path} 不存在")img = Image.open(image_path)# 多语言识别示例(英语+中文)text = pytesseract.image_to_string(img, lang='eng+chi_sim')return text.strip() if text else "未识别到文字"except Exception as e:return f"错误: {str(e)}"if __name__ == "__main__":if len(sys.argv) > 1:image_path = sys.argv[1]else:image_path = input("请输入图片路径:").strip()print("\n识别中...")result = ocr_core(image_path)print("\n识别结果:")print("-" * 30)print(result)print("-" * 30)

下载测试图片:

# 下载测试图片(可选)
wget https://tesseract.projectnaptha.com/img/eng_bw.png -O test.png# 执行识别
python ocr_demo.py test.png
http://www.xdnf.cn/news/651043.html

相关文章:

  • HTML应用指南:利用GET请求获取全国捞王锅物料理门店位置信息
  • cannot access ‘/etc/mysql/debian.cnf‘: No such file or directory
  • 解决 iTerm2 中 nvm 不生效的问题(Mac 环境)
  • “安康杯”安全生产知识竞赛活动流程方案
  • 课上实验111111
  • 4、docker compose
  • 汽配快车道:助力汽车零部件行业的产业重构与数字化出海
  • 关于OT IIOT系统远程访问的零信任安全
  • 从“黑箱”到透明化:MES如何重构生产执行全流程?
  • NV211NV212美光科技颗粒NV219NV220
  • Python——day37早停策略和模型权重的保存
  • 第九届水动力学与能源电力系统国际学术会议(HEEPS 2025)
  • Linux笔记---分页存储管理
  • 从OTA双雄「共舞」,透视旅游持续繁荣背后的结构性跃迁
  • BERT分类器和朴素贝叶斯分类器比较
  • 大语言模型 提示词的少样本案例的 演示选择与排序新突破
  • Baklib内容中台效能跃升实践
  • 什么是3D全景视角?3D全景有什么魅力?
  • 大语言模型(LLM)入门项目推荐
  • Java设计模式之模板方法模式:从基础到高级的全面解析(最详解)
  • Docker基础 -- Ubuntu 22.04 AArch64 交叉编译 Docker 镜像构建指南
  • Linux Docker 安装oracle19c数据库教程
  • ceph 剔除 osd
  • Serverless成本优化实战:从资源浪费到精准管控的架构演进
  • RabbitMQ 应用 - SpringBoot
  • OpenSSL 与 C++ 搭建一个支持 TLS 1.3 的服务器
  • 图论:floyed算法
  • Go语言开发的GMQT物联网MQTT消息服务器(mqtt Broker)支持海量MQTT连接和快速低延时消息传输-提供源码可二次开发定制需求
  • 支持向量机(SVM)例题
  • cursor/vscode连接低版本的系统(glibc<2.28)