爬虫验证码处理:ddddocr 的详细使用(通用验证码识别OCR pypi版)
更多内容请见: 爬虫和逆向教程-专栏介绍和目录
文章目录
-
- 一、DdddOcr概述
-
- 1.1 DdddOcr 介绍
- 1.2 安装DdddOcr
- 1.3 使用建议
- 1.4 核心优势
- 1.5 常见问题
- 二、基本使用方法
-
- 2.1 简单数字字母验证码识别
- 2.2 带复杂背景的验证码识别
- 2.3 滑块验证码识别
- 2.4 点选验证码识别
- 2.5 模型选择
- 三、高级用法
-
- 3.1 自定义识别模型
- 3.2 批量识别验证码
- 3.3 批量识别加速
- 3.4 与selenium集成
- 3.5 放入scrapy中间件
- 四、使用案例
-
- 4.1 在爬虫中集成DdddOcr
- 4.2 滑块验证码识别
一、DdddOcr概述
1.1 DdddOcr 介绍
DdddOcr是一个基于深度学习的开源验证码识别工具,支持多种类型的验证码识别,包括数字、字母、滑块、点选等类型。下面详细介绍如何在Python爬虫中使用DdddOcr进行验证码识别。
github地址:https://github.com/sml2h3/ddddocr
官方文档:https://ddddocr.com/
1.2 安装DdddOcr
首先需要安装DdddOcr库:
pip install ddddocr
如果需要使用GPU加速(推荐),还需要安装onnxruntime-gpu: