当前位置: 首页 > ai >正文

机器视觉opencv教程(二):二值化、自适应二值化

文章目录

  • 机器视觉opencv教程(二):二值化、自适应二值化
    • 一、二值化图基础概念
    • 二、传统二值化方法(基于全局固定阈值)
      • 1. 阈值法(THRESH_BINARY)
      • 2. 反阈值法(THRESH_BINARY_INV)
      • 3. 截断阈值法(THRESH_TRUNC)
      • 4. 低阈值零处理(THRESH_TOZERO)
      • 5. 超阈值零处理(THRESH_TOZERO_INV)
    • 三、OTSU 阈值法(自动找最优阈值)
      • 1. 核心原理
      • 2. 代码实现(需与传统二值化方法结合)
      • 3. 特点与适用场景
    • 四、自适应二值化(局部动态阈值)
      • 1. 核心问题(传统方法的缺陷)
      • 2. 自适应二值化原理
      • 4. 关键参数说明
    • 五、补充:常见问题与注意事项

机器视觉opencv教程(二):二值化、自适应二值化

一、二值化图基础概念

  • 定义:二值化图是仅含两种像素值的图像,通常为 0(纯黑色)255(纯白色)
  • 操作前提:二值化的处理对象必须是灰度图(无法直接对彩色图进行二值化),本质是通过 “阈值判断” 将灰度图的连续亮度值(0~255)映射为两种离散值,突出前景与背景的边界。
  • 核心目的:简化图像数据(仅 1 个通道 + 2 种值)、消除灰度噪声、强化目标区域(如文字识别中突出文字、工业检测中突出缺陷)。

在这里插入图片描述

二、传统二值化方法(基于全局固定阈值)

传统二值化通过设定全局唯一阈值(thresh)最大值(maxval,通常为 255),对灰度图所有像素统一判断,常见 5 种方法:

1. 阈值法(THRESH_BINARY)

  • 原理:像素值与阈值比较
    • 若像素值 ≤ thresh → 设为 0(黑)
    • 若像素值 > thresh → 设为 maxval(白)
  • 特点:亮部(> 阈值)保留为白色,暗部(≤阈值)转为黑色,适合前景比背景亮的场景(如白底黑字)。
import cv2
import numpy as np# 1. 读取彩色图→转为灰度图(二值化前提)
image_np = cv2.imread('./gogogo.png')
# 【补充】检查图片读取状态
if image_np is None:raise ValueError("图片读取失败,请确认路径正确!")
image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 设定参数
thresh = 150  # 全局阈值(需手动调整,根据图像明暗度适配)
maxval = 255  # 二值化后的最大值(通常为255,纯白)# 3. OpenCV接口实现(推荐,高效)
# ret:返回的阈值(与设定的thresh一致,传统方法中无实际作用)
# image_thresh:二值化结果(单通道图)
ret, image_thresh = cv2.threshold(image_gray, thresh, maxval, cv2.THRESH_BINARY)# # 4. 手动实现(理解原理用)
# image_shape = image_gray.shape
# image_thresh = np.zeros((image_shape[0], image_shape[1]), dtype=np.uint8)
# for i in range(image_shape[0]):  # 遍历高度(行)
#     for j in range(image_shape[1]):  # 遍历宽度(列)
#         if image_gray[i, j] > thresh:
#             image_thresh[i, j] = maxval
#         else:
#             image_thresh[i, j] = 0# 5. 显示结果
cv2.imshow('灰度图', image_gray)
cv2.imshow('THRESH_BINARY二值化图', image_thresh)
cv2.waitKey(0)  # 按任意键关闭窗口
cv2.destroyAllWindows()  # 释放资源

2. 反阈值法(THRESH_BINARY_INV)

  • 原理:与阈值法完全相反
    • 若像素值 > thresh → 设为 0(黑)
    • 若像素值 ≤ thresh → 设为 maxval(白)
  • 特点:暗部保留为白色,亮部转为黑色,适合前景比背景暗的场景(如黑底白字)。
import cv2
import numpy as np# 1. 彩色图→灰度图
image_np = cv2.imread('./gogogo.png')
if image_np is None:raise ValueError("图片读取失败!")
image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 设定参数
thresh = 127  # 常用默认阈值(可根据图像调整)
maxval = 255# 3. OpenCV接口实现(核心参数:cv2.THRESH_BINARY_INV)
ret, image_thresh = cv2.threshold(image_gray, thresh, maxval, cv2.THRESH_BINARY_INV)# # 4. 手动实现(原理参考阈值法,判断条件反转)
# image_shape = image_gray.shape
# image_thresh = np.zeros((image_shape[0], image_shape[1]), dtype=np.uint8)
# for i in range(image_shape[0]):
#     for j in range(image_shape[1]):
#         if image_gray[i, j] > thresh:
#             image_thresh[i, j] = 0
#         else:
#             image_thresh[i, j] = maxval# 5. 显示
cv2.imshow('THRESH_BINARY_INV二值化图', image_thresh)
cv2.waitKey(0)
cv2.destroyAllWindows()
  • 特点:暗部保留为白色,亮部转为黑色,适合前景比背景暗的场景(如黑底白字)。

3. 截断阈值法(THRESH_TRUNC)

  • 原理:限制像素值上限
    • 若像素值 > thresh → 设为 thresh(截断为阈值)
    • 若像素值 ≤ thresh → 保持原值不变
  • 特点:图像最大亮度为阈值,可抑制过亮区域(如强光噪声),但不是严格 “二值图”(仍含多个灰度值)。
import cv2
import numpy as np# 1. 彩色图→灰度图
image_np = cv2.imread('./gogogo.png')
if image_np is None:raise ValueError("图片读取失败!")
image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 设定参数
thresh = 150  # 截断阈值(超过该值的亮度会被“压平”)
maxval = 255  # 此方法中maxval无实际作用(可设任意值)# 3. OpenCV接口实现(核心参数:cv2.THRESH_TRUNC)
ret, image_thresh = cv2.threshold(image_gray, thresh, maxval, cv2.THRESH_TRUNC)# # 4. 手动实现
# image_shape = image_gray.shape
# image_thresh = np.zeros((image_shape[0], image_shape[1]), dtype=np.uint8)
# for i in range(image_shape[0]):
#     for j in range(image_shape[1]):
#         if image_gray[i, j] > thresh:
#             image_thresh[i, j] = thresh
#         else:
#             image_thresh[i, j] = image_gray[i, j]# 5. 显示(对比灰度图,亮部会明显变暗)
cv2.imshow('原灰度图', image_gray)
cv2.imshow('THRESH_TRUNC截断图', image_thresh)
cv2.waitKey(0)
cv2.destroyAllWindows()

4. 低阈值零处理(THRESH_TOZERO)

  • 原理:暗部置零,亮部保留
    • 若像素值 ≤ thresh → 设为 0(黑)
    • 若像素值 > thresh → 保持原值不变
  • 特点:仅保留亮部细节,暗部直接变黑,适合突出高亮度目标(如金属表面的反光缺陷)。

5. 超阈值零处理(THRESH_TOZERO_INV)

  • 原理:亮部置零,暗部保留
    • 若像素值 > thresh → 设为 0(黑)
    • 若像素值 ≤ thresh → 保持原值不变
  • 特点:仅保留暗部细节,亮部直接变黑,适合突出低亮度目标(如暗背景中的深色物体)。

三、OTSU 阈值法(自动找最优阈值)

1. 核心原理

  • OTSU(大津法)是自动阈值选择算法,无需手动调参:
    1. 将灰度图像素分为 “前景”(> 阈值)和 “背景”(≤阈值)两类;
    2. 遍历所有可能阈值(从灰度最小值 + 1 到最大值 - 1),计算 “类间方差”;
    3. 类间方差最大时的阈值即为 “最优阈值”(此时前景与背景区分最明显)。

2. 代码实现(需与传统二值化方法结合)

import cv2
import numpy as np# 1. 彩色图→灰度图
image_np = cv2.imread('./flower.png')
if image_np is None:raise ValueError("图片读取失败!")
image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 设定参数(thresh仅为初始值,OTSU会自动覆盖)
thresh = 127  # 初始值无意义,OTSU会计算最优阈值
maxval = 255# 3. OpenCV接口实现(核心:cv2.THRESH_OTSU + 传统方法)
# ret:返回OTSU计算出的最优阈值(不再是初始值127)
ret, image_thresh = cv2.threshold(image_gray, thresh, maxval, cv2.THRESH_BINARY + cv2.THRESH_OTSU  # 结合阈值法,也可结合其他方法
)
print(f"OTSU自动计算的最优阈值:{ret}")  # 输出最优阈值,便于后续参考# # 4. 手动实现(理解OTSU算法逻辑,实际用OpenCV接口即可)
# min_val = image_gray.min()
# max_val = image_gray.max()
# var_dict = {}  # 存储“阈值→类间方差”
# 
# for t in range(min_val + 1, max_val):
#     # 分割前景(>t)和背景(≤t)
#     foreground = image_gray[image_gray > t]
#     background = image_gray[image_gray ≤ t]
#     # 计算类间方差(公式:w0*(u0-u)^2 + w1*(u1-u),w为权重,u为均值)
#     w0 = len(foreground) / (image_gray.size)
#     w1 = len(background) / (image_gray.size)
#     u0 = foreground.mean() if len(foreground) > 0 else 0
#     u1 = background.mean() if len(background) > 0 else 0
#     u = (w0*u0) + (w1*u1)
#     class_var = w0 * (u0 - u)**2 + w1 * (u1 - u)**2
#     var_dict[t] = class_var
# # 找类间方差最大的阈值
# best_thresh = max(var_dict, key=var_dict.get)
# print(f"手动计算的最优阈值:{best_thresh}")# 5. 保存+显示结果
cv2.imwrite('OTSU二值化图.png', image_thresh)  # 保存结果
cv2.imshow('OTSU二值化图', image_thresh)
cv2.waitKey(0)
cv2.destroyAllWindows()

3. 特点与适用场景

  • 优势:自动适配图像明暗,无需手动调阈值,比固定阈值更鲁棒;
  • 适用:前景与背景灰度差异明显的图像(如文档扫描图、简单目标检测);
  • 注意:仅适用于 “双峰灰度分布”(灰度直方图有两个明显峰值,分别对应前景和背景),若图像灰度分布均匀,效果较差。

四、自适应二值化(局部动态阈值)

1. 核心问题(传统方法的缺陷)

传统二值化(含 OTSU)用全局固定阈值,若图像明暗分布不均(如左侧亮、右侧暗),会导致部分区域二值化过度(亮区暗部变黑)或不足(暗区亮部变白)。

2. 自适应二值化原理

  • 对图像每个像素,用其局部邻域(如 3×3、5×5 窗口)的亮度计算 “局部阈值”,而非全局统一阈值;
  • 每个像素的阈值由自身周围像素决定,能自适应不同区域的明暗差异。
import cv2
import numpy as np# 1. 读取彩色图→转为灰度图
image_np = cv2.imread('./gogogo.png')  # 建议用明暗不均的图测试(如逆光拍摄的图)
if image_np is None:raise ValueError("图片读取失败!")
image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 自适应二值化(核心函数:cv2.adaptiveThreshold)
image_binary = cv2.adaptiveThreshold(image_gray,                # 输入:单通道灰度图255,                       # 二值化最大值(通常为255)cv2.ADAPTIVE_THRESH_GAUSSIAN_C,  # 局部阈值计算方法:高斯加权平均(推荐,更平滑)# cv2.ADAPTIVE_THRESH_MEAN_C,   # 备选:局部邻域均值(计算更快,可能有噪声)cv2.THRESH_BINARY,         # 二值化方法(可换为THRESH_BINARY_INV)blockSize=7,               # 局部邻域大小(必须为奇数,如3、5、7,越大越平滑)C=5                        # 从局部阈值中减去的常数(正数:降低二值化严格度,减少黑块)
)# 3. 显示对比(与全局阈值法对比,明暗不均区域效果更优)
# 全局阈值法(对比用)
ret_global, image_global = cv2.threshold(image_gray, 127, 255, cv2.THRESH_BINARY)cv2.imshow('原灰度图', image_gray)
cv2.imshow('全局阈值二值化', image_global)
cv2.imshow('自适应二值化', image_binary)
cv2.waitKey(0)
cv2.destroyAllWindows()

4. 关键参数说明

参数作用
blockSize局部邻域大小(奇数),越大对明暗不均的适应能力越强,但细节保留越少;
C阈值修正常数,正数→局部阈值降低(更多像素变白),负数→局部阈值升高(更多像素变黑);
阈值计算方法ADAPTIVE_THRESH_GAUSSIAN_C(高斯加权,效果好) vs ADAPTIVE_THRESH_MEAN_C(均值,速度快);

五、补充:常见问题与注意事项

  1. 图片读取失败:确保路径正确(相对路径需与代码文件同级,绝对路径需写全),格式支持(JPG、PNG、BMP 等);
  2. 二值化结果过暗 / 过亮:
    • 全局阈值法:调整thresh(暗→降低阈值,亮→升高阈值);
    • 自适应法:调整C(暗→增大C,亮→减小C)或blockSize
  3. OTSU 效果差:检查图像灰度直方图是否为 “单峰”(明暗分布均匀),此类图需用自适应二值化;
  4. 代码效率:手动实现仅用于理解原理,实际项目用 OpenCV 接口(C++ 优化,速度远快于 Python 循环)。
http://www.xdnf.cn/news/18977.html

相关文章:

  • 云计算学习笔记——逻辑卷管理、进程管理、用户提权RAID篇
  • 利用亮数据MCP服务器构建个性化学习情报官智能体
  • 第三章 Vue3 + Three.js 实战:用 OrbitControls 实现相机交互与 3D 立方体展示
  • 《应用密码学》——基础知识及协议结构模块(笔记)
  • 第2.1节:AI大模型之GPT系列(GPT-3、GPT-4、GPT-5)
  • 箭头函数和普通函数的区别
  • websocket的应用
  • 【物联网】什么是 DHT11(数字温湿度传感器)?
  • 为什么不能创建泛型数组?
  • 【计算机408计算机网络】第三章:自底向上五层模型之数据链路层
  • 轮廓周长,面积,外界圆,外界矩形近似轮廓和模板匹配和argparse模块实现代码参数的动态配置
  • STL 深度解析之vector【C++每日一学】
  • AI接管浏览器:Anthropic发布Claude for Chrome,是效率革命还是安全噩梦?
  • 科技大会用了煽情BGM
  • Linux网络基础1(一)之计算机网络背景
  • 解密 Vue 3 shallowRef:浅层响应式 vs 深度响应式的性能对决
  • 答案引擎优化(AEO)制胜策略:抢占AI Overviews流量红利
  • 【基于hyperledger fabric的教育证书管理系统】
  • Maven安装、IDEA集成Maven、依赖管理、单元测试
  • Pinterest自动化 “Pin“得高效
  • Oracle SQL 性能调优的基石:深入解读与驾驭执行计划
  • SpringMVC相关梳理
  • 使用 Wheel Variants 简化 CUDA 加速 Python 安装和打包工作流
  • PyTorch 机器学习基础(选择合适优化器)
  • MTK Linux DRM分析(二十四)- MTK mtk_drm_plane.c
  • 如何为在线医疗问诊小程序实现音视频通话功能?
  • uniapp跨平台开发---uni.request返回int数字过长精度丢失
  • OpsManage:基于Django的企业级AWS云资源运维管理平台
  • 绿幕电商直播为什么要用专业抠图软件.
  • React 状态丢失:组件 key 用错引发的渲染异常