当前位置: 首页 > ds >正文

OPenCV CUDA模块目标检测----- HOG 特征提取和目标检测类cv::cuda::HOG

  • 操作系统:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 编程语言:C++11

算法描述

cv::cuda::HOG 是 OpenCV 的 CUDA 模块中对 HOG 特征提取和目标检测 提供的 GPU 实现。它与 CPU 版本的 cv::HOGDescriptor 类似,但利用了 GPU 的并行计算能力以提高性能。

公共成员函数

创建与初始化

函数描述
static Ptr cv::cuda::HOG::create()创建一个默认配置的 HOG 对象。
void setSVMDetector(InputArray _svmDetector)设置 SVM 分类器权重向量,用于检测特定目标(如行人)。

参数设置(与 HOG 特征相关)

函数描述
void setWinSize(Size winSize)设置检测窗口大小(必须是 cell 大小的整数倍)。
void setBlockSize(Size blockSize)设置 block 的大小(单位:像素)。
void setCellSize(Size cellSize)设置 cell 的大小(单位:像素)。
void setBinCount(int nBins)设置每个 cell 的方向直方图 bin 数量。
void setBlockStride(Size blockStride)设置 block 移动步长(单位:像素)。
void setDerivativeAperture(int derivAperture)设置图像平滑/导数计算的孔径大小。
void setWinSigma(double winSigma)高斯窗口的标准差。
void setHistogramNormType(int histogramNormType)设置直方图归一化方式(L2Hys, L1, L1Sqrt, L2)。
void setL2HysNormalization(bool l2HysNormalization)是否启用 L2-Hys 归一化。
void setGammaCorrection(bool gammaCorrection)是否启用伽马校正。
void setNumLevels(int numLevels)设置金字塔层数。

检测方法

函数描述
void detectMultiScale(InputArray img, OutputArray foundLocations, double hitThreshold = 0, Size winStride = Size(), Size padding = Size())在图像中多尺度检测目标,并返回检测到的位置(矩形框)。

示例代码(GPU 上的行人检测)

#include <opencv2/cudaobjdetect.hpp>
#include <opencv2/opencv.hpp>int main()
{// 创建 HOG 对象cv::Ptr< cv::cuda::HOG > hog = cv::cuda::HOG::create();// 设置 SVM 分类器(行人检测)std::vector< float > detector = cv::HOGDescriptor::getDefaultPeopleDetector();hog->setSVMDetector( detector );// 读取图像(默认为 BGR 三通道)cv::Mat frame = cv::imread( "/media/dingxin/data/study/OpenCV/sources/images/00001.jpg" );if ( frame.empty() ){std::cerr << "无法读取图像!" << std::endl;return -1;}// 转换为灰度图(CV_8UC1)cv::Mat gray_frame;cv::cvtColor( frame, gray_frame, cv::COLOR_BGR2GRAY );// 上传到 GPUcv::cuda::GpuMat d_frame( gray_frame );// 执行检测std::vector< cv::Rect > found_locations;hog->detectMultiScale( d_frame, found_locations );// 绘制检测结果for ( const auto& r : found_locations ){cv::rectangle( frame, r, cv::Scalar( 0, 0, 255 ), 2 );}cv::imshow( "Pedestrian Detection", frame );cv::waitKey( 0 );return 0;
}

运行结果

在这里插入图片描述
效果仅供演示,要想效果专业一下,得自己去训练模型了。

http://www.xdnf.cn/news/12273.html

相关文章:

  • NoSQL之Redis配置与优化
  • 阿里云 Linux 搭建邮件系统全流程及常见问题解决
  • rust或tauri项目执行命令的时候,cmd窗口也会弹出显示解决方法
  • Flutter嵌入式开发实战 ——从树莓派到智能家居控制面板,打造工业级交互终端
  • LSTM-XGBoost多变量时序预测(Matlab完整源码和数据)
  • 【oobabooga 本地AI模型搭建】
  • SAP学习笔记 - 开发24 - 前端Fiori开发 Filtering(过滤器),Sorting and Grouping(排序和分组)
  • Neovim - LSP 底层原理,难点配置(二)
  • Java爬虫技术详解:原理、实现与优势
  • 什么是DevOps智能平台的核心功能?
  • 【已解决】MACOS M4 芯片使用 Docker Desktop 工具安装 MICROSOFT SQL SERVER
  • Android Settings 数据库生成、监听与默认值配置
  • 数学复习笔记 27
  • 更新版【飞云翻倍系统】新增支撑压力多线参考技术,操盘技术图文解说
  • 重温经典算法——希尔排序
  • AI全链路赋能内容创作:电商新势力起飞
  • 基础篇01|前端开发为何离不开构建工具?
  • Vehicle HAL(4)--vhal 的属性如何配置?
  • 【面经分享】滴滴
  • HCIE-Datacom笔试题库
  • 法律模型选型
  • 食品计算—Dpf-nutrition: Food nutrition estimation via depth prediction and fusion
  • U盘从Linux系统向Windows系统切换时出错
  • 【无标题】平面图四色问题P类归属的严格论证——基于拓扑收缩与动态调色算法框架
  • linux如何配置wifi连接
  • JAVASE:网络编程
  • 遥控器3nm模块技术解析!
  • 代码中的问题及解决方法
  • C++内联函数(inline)的作用
  • 核心线程池大小如何设置?