当前位置：首页 > news >正文

OpenCV CUDA模块设备层-----在 GPU上高效地执行两个uint类型值的最小值比较函数vmin2()

news 2025/9/1 21:54:28

操作系统：ubuntu22.04
OpenCV版本：OpenCV4.9
IDE:Visual Studio Code
编程语言：C++11

算法描述

OpenCV 的CUDA模块（cudev）中的一个设备端内联函数，用于在GPU上高效地执行两个uint类型值的最小值比较。
该函数返回两个无符号整数 a 和 b 中的较小值：

return (a < b) ? a : b;

函数原型

__device__ __forceinline__ uint cv::cudev::vmin2 	( 	uint  	a,uint  	b )

参数

a uint 第一个无符号整数（通常表示像素值）
b uint 第二个无符号整数（另一个像素值或参考值）

返回值

返回 a 和 b 中较小的那个值，类型为 uint。

使用场景

这个函数常用于以下图像/视频处理任务中：

图像增强（如取最小邻域值）
构建自定义滤波器（如最小值滤波）
多帧合成中的最小值投影（如去除高亮噪声）
GPU 并行像素级比较与选择操作

代码

#include <opencv2/cudev.hpp>
#include <opencv2/cudev/util/simd_functions.hpp>using namespace cv::cudev;// CUDA kernel
template <typename T>
__global__ void computeMinKernel(const PtrStep<T> src1,const PtrStep<T> src2,PtrStep<T> dst,int width,int height)
{int x = blockIdx.x * blockDim.x + threadIdx.x;int y = blockIdx.y * blockDim.y + threadIdx.y;if (x < width && y < height) {uint a = static_cast<uint>(src1(y, x));uint b = static_cast<uint>(src2(y, x));dst(y, x) = static_cast<T>(vmin2(a, b));  // 取最小值}
}int main() {// 加载两张图像cv::Mat h_src1 = cv::imread("/media/dingxin/data/study/OpenCV/sources/images/img0.jpg", cv::IMREAD_GRAYSCALE);cv::Mat h_src2 = cv::imread("/media/dingxin/data/study/OpenCV/sources/images/img1.jpg", cv::IMREAD_GRAYSCALE);if (h_src1.empty() || h_src2.empty()) {std::cerr << "Failed to load images!" << std::endl;return -1;}// 上传到 GPUcv::cuda::GpuMat d_src1, d_src2, d_min;d_src1.upload(h_src1);d_src2.upload(h_src2);d_min.create(h_src1.size(), h_src1.type());// 设置 kernel 参数dim3 block(16, 16);dim3 grid((d_src1.cols + block.x - 1) / block.x,(d_src1.rows + block.y - 1) / block.y);// 启动 kernel（显式指定模板参数 uchar）computeMinKernel<uchar><<<grid, block>>>(d_src1, d_src2, d_min, d_src1.cols, d_src1.rows);// 下载结果并显示cv::Mat h_min;d_min.download(h_min);cv::imshow("Min Image", h_min);cv::waitKey(0);return 0;
}