当前位置: 首页 > ai >正文

基于OpenCV实现实时颜色检测

文章目录

    • 一、引言
    • 二、系统概述
    • 三、代码解析
      • 1. 导入库
      • 2. 颜色识别函数
      • 3. 主程序循环
    • 四、HSV色彩空间详解
    • 五、颜色范围设定
    • 六、系统优化建议
    • 七、完整代码
    • 八、总结

一、引言

今天我将介绍一个使用Python和OpenCV库实现的实时颜色识别系统。这个系统能够通过摄像头捕捉视频流,并在视频中指定区域内识别主要颜色(红、黄、绿、蓝)。这种技术在机器人视觉、自动化检测和交互式应用中有着广泛的应用前景。

二、系统概述

该系统主要包含以下几个功能:

  1. 实时视频捕捉
  2. 在视频帧中划定特定检测区域
  3. 将检测区域转换为HSV色彩空间
  4. 分析区域内的色调(H)值
  5. 根据H值范围判断颜色类型
  6. 实时显示结果

三、代码解析

1. 导入库

import cv2

我们只需要导入OpenCV库,它提供了强大的计算机视觉功能,包括图像处理和视频捕捉。

2. 颜色识别函数

def get_color(img):H = []color_name = Noneimg = cv2.resize(img,(640,400),)# 将彩色图转换为HSVHSV = cv2.cvtColor(img,cv2.COLOR_BGR2HSV)# 画矩形框cv2.rectangle(img,(280,180),(360,260),(0,255,0),2)# 依次取出每行每列的H,S,V值放入容器中for i in range(280,360):for j in range(180,260): H.append(HSV[j,i][0])# 分别计算出H,S,V的最大最小H_min = min(H);H_max = max(H)# 判断颜色if H_min >= 0 and H_max <= 10 or H_min >= 156 and H_max <= 180: color_name='red'elif  H_min >= 26 and H_max <= 34 : color_name='yellow'elif  H_min >= 35 and H_max <= 77 : color_name='green'elif  H_min >= 100 and H_max <= 124 : color_name='blue'print(color_name)return  img,color_name

函数功能详解

  1. 图像预处理

    • 首先将输入图像调整为固定尺寸(640×400),确保处理一致性
  2. 色彩空间转换

    • 将BGR格式转换为HSV格式,HSV色彩空间更适合颜色识别
    • H(色调):表示颜色类型
    • S(饱和度):表示颜色的纯度
    • V(亮度):表示颜色的明暗程度
  3. 检测区域标记

    • 在图像上绘制一个绿色矩形框(280,180)到(360,260),标识检测区域
  4. 数据采集

    • 遍历检测区域内每个像素点,收集所有H值
  5. 颜色判断

    • 计算区域内H值的最小和最大值
    • 根据H值范围判断颜色:
      • 红色:0-10或156-180
      • 黄色:26-34
      • 绿色:35-77
      • 蓝色:100-124

3. 主程序循环

cap = cv2.VideoCapture(0)
while 1:_,frame=cap.read()img,cal = get_color(frame)cv2.imshow('',img)if cv2.waitKey(1) == 27:break
  1. 视频捕捉初始化

    • 创建VideoCapture对象,参数0表示使用默认摄像头
  2. 主循环

    • 不断读取视频帧
    • 调用get_color函数处理每一帧
    • 显示处理后的图像
    • 按ESC键(ASCII 27)退出程序

四、HSV色彩空间详解

为什么选择HSV而不是RGB进行颜色识别?

  1. RGB的局限性

    • RGB三个通道都与亮度相关
    • 对光照变化敏感
    • 颜色判断需要同时考虑三个通道
  2. HSV的优势

    • 将颜色信息(H)与亮度(V)、饱和度(S)分离
    • 对光照变化有一定鲁棒性
    • 颜色判断主要依据H通道

五、颜色范围设定

OpenCV中HSV的范围:

  • H: 0-180 (通常色彩空间为0-360,但OpenCV使用8位存储,所以除以2)
  • S: 0-255
  • V: 0-255

常见颜色H值范围:

  • 红色:0-10和170-180
  • 橙色:11-25
  • 黄色:26-34
  • 绿色:35-77
  • 蓝色:100-124
  • 紫色:125-155

可对比如下的颜色范围图
在这里插入图片描述

六、系统优化建议

  1. 增加饱和度(S)和亮度(V)的过滤

    • 可以排除低饱和度(接近灰色)或低亮度(接近黑色)的区域
  2. 使用均值而非极值

    • 当前使用min/max容易受噪声影响,可改为计算平均值
  3. 扩大检测区域

    • 当前区域较小(80×80像素),可以适当扩大
  4. 添加更多颜色识别

    • 如橙色、紫色等
  5. 优化性能

    • 当前双重循环效率不高,可以使用NumPy进行向量化操作

七、完整代码

import cv2def get_color(img):H = []color_name = Noneimg = cv2.resize(img,(640,400),)# 将彩色图转换为HSVHSV = cv2.cvtColor(img,cv2.COLOR_BGR2HSV)# 画矩形框cv2.rectangle(img,(280,180),(360,260),(0,255,0),2)# 依次取出每行每列的H,S,V值放入容器中for i in range(280,360):for j in range(180,260): H.append(HSV[j,i][0])# 分别计算出H,S,V的最大最小H_min = min(H);H_max = max(H)# 判断颜色if H_min >= 0 and H_max <= 10 or H_min >= 156 and H_max <= 180: color_name='red'elif  H_min >= 26 and H_max <= 34 : color_name='yellow'elif  H_min >= 35 and H_max <= 77 : color_name='green'elif  H_min >= 100 and H_max <= 124 : color_name='blue'print(color_name)return  img,color_namecap = cv2.VideoCapture(0)
while 1:_,frame=cap.read()img,cal = get_color(frame)cv2.imshow('',img)if cv2.waitKey(1) == 27:break

八、总结

本文介绍了一个基于OpenCV的实时颜色识别系统,通过HSV色彩空间转换和色调范围判断实现了基本颜色识别功能。该系统可以作为更复杂计算机视觉项目的基础,通过进一步优化和扩展,能够满足各种实际应用需求。

希望这篇文章能帮助你理解颜色识别的基本原理和实现方法。如果你有任何问题或改进建议,欢迎在评论区讨论!

http://www.xdnf.cn/news/13882.html

相关文章:

  • 嵌入式相关开源项目、库、资料------持续更新中
  • Linux 系统性能测试全指南:从磁盘 I/O 到网络带宽的实战方案
  • ArcGIS Pro 3.4 二次开发 - 工作流
  • 【60 Pandas+Pyecharts | 箱包订单数据分析可视化】
  • 数据结构——第二章 线性表之顺序表、单链表
  • NB-IoT-下行基本概率和时频资源分布
  • 城市排水管网液位流量监测系统解决方案
  • 1.14 express小项目 和 用到的 jwt详解
  • 【STM32的通用定时器CR1的CKD[1:0]: 时钟分频因子 (Clock division)】
  • 【PDF】常见纸张字体大小设置指南 / Common Paper Size Font Guidelines
  • 音视频之H.264的句法和语义
  • 基于 Java 的大数据分布式存储在视频会议系统海量数据存储与回放中的应用
  • Flutter Android打包和发布Build APK
  • PROFINET主站S7-1500通过协议网关集成欧姆龙NJ系列TCP/IP主站
  • HarmonyOS 5对React Native有哪些新特性?
  • 50种3D效果演示(OpenGL)
  • Elasticsearch索引wildcard查询
  • C++面试(10)---合并两个排序的链表
  • 历史交易数据涨跌分级
  • 《信号与系统》第 9 章 拉普拉斯变换
  • Chainlink VRF 深度解析与实战
  • 进阶四 带记忆功能的000-255 计数器
  • 基于Python的热门微博数据可视化分析-Flask+Vue
  • 蚂蚁集团法人变更:韩歆毅接任,公司治理的正常安排
  • 第17篇:数据库中间件的弹性伸缩与容量规划实战
  • MySQL库操作
  • 升级openssl后无法使用cmake和curl的解决方法
  • Logic Error: 如何识别和修复逻辑错误
  • C++题解 P4933 2.间谍原题:
  • 斗式提升机的负载特性对变频驱动的要求