当前位置：首页 > ds >正文

c/c++的opencv图像金字塔缩放

ds 2025/8/26 10:19:36

图像金字塔缩放：OpenCV C/C++ 实践 📐

图像金字塔是计算机视觉中一种重要且基础的多尺度表示方法。它通过对原始图像进行连续的下采样（缩小）或上采样（放大）操作，生成一系列不同分辨率的图像。这些图像按尺寸大小排列，形似金字塔，故此得名。图像金字塔在诸如特征检测、图像分割、目标识别和图像融合等任务中扮演着关键角色。

本文将重点介绍如何使用 OpenCV C++ API 中的函数来实现图像金字塔的基本缩放操作：下采样和上采样。

图像金字塔简介

图像金字塔通常包含两种主要类型：

高斯金字塔 (Gaussian Pyramid)：用于图像的下采样。在每一层，图像首先经过高斯模糊处理，然后去除偶数行和偶数列，从而将图像尺寸减半。
拉普拉斯金字塔 (Laplacian Pyramid)：用于图像重建，可以从高斯金字塔中恢复图像。它存储了高斯金字塔中相邻层之间的差异信息。

本文主要关注构成高斯金字塔基础的下采样 (cv::pyrDown) 和其逆操作的上采样 (cv::pyrUp)。

图像下采样 (`cv::pyrDown`)

cv::pyrDown 函数用于将输入图像的宽度和高度都缩小一半。

函数原型：

void cv::pyrDown(InputArray src, OutputArray dst, const Size& dstsize = Size(), int borderType = BORDER_DEFAULT);

src: 输入图像。
dst: 输出图像，其尺寸将是输入图像的一半（除非指定了 dstsize）。
dstsize: 可选参数，指定输出图像的尺寸。如果未指定（默认），则输出图像尺寸计算为 Size((src.cols+1)/2, (src.rows+1)/2)。通常我们让其自动计算。
borderType: 像素外推方法，用于处理边界（一般使用默认值）。

工作原理：
cv::pyrDown 的典型实现步骤如下：

对输入图像应用高斯滤波器（通常是 $\times 5$ 的核）。
对滤波后的图像进行下采样，即删除所有偶数行和偶数列。

图像上采样 (`cv::pyrUp`)

cv::pyrUp 函数用于将输入图像的宽度和高度都放大一倍。这个操作试图从一个较低分辨率的图像重建一个较高分辨率的图像，但通常会伴随一些模糊，因为它无法凭空创造细节。

函数原型：

void cv::pyrUp(InputArray src, OutputArray dst, const Size& dstsize = Size(), int borderType = BORDER_DEFAULT);

src: 输入图像。
dst: 输出图像，其尺寸将是输入图像的两倍（除非指定了 dstsize）。
dstsize: 可选参数，指定输出图像的尺寸。如果未指定（默认），则输出图像尺寸计算为 Size(src.cols*2, src.rows*2)。通常我们让其自动计算。
borderType: 像素外推方法（一般使用默认值）。

工作原理：
cv::pyrUp 的典型实现步骤如下：

将输入图像的尺寸扩大两倍，新增的行和列通常用0填充（或者其他插值方式）。
对扩大后的图像应用高斯滤波器（与 pyrDown 中使用的核类似，但通常乘以4以保持亮度范围）。这一步是为了平滑由于插入0值而产生的块状效应。

C++ OpenCV 代码示例

下面的 C++ 代码演示了如何加载一张图像，对其进行下采样，然后再对下采样后的图像进行上采样，并显示结果。

#include <opencv2/imgproc.hpp>
#include <opencv2/highgui.hpp>
#include <iostream>int main(int argc, char** argv) {// 检查命令行参数if (argc != 2) {std::cout << "用法: " << argv[0] << " <图片路径>" << std::endl;return -1;}// 1. 加载源图像cv::Mat srcImage = cv::imread(argv[1], cv::IMREAD_COLOR);if (srcImage.empty()) {std::cerr << "错误: 无法加载图像 " << argv[1] << std::endl;return -1;}std::cout << "原始图像尺寸: " << srcImage.cols << "x" << srcImage.rows << std::endl;// 2. 图像下采样 (缩小一半)cv::Mat downsampledImage;cv::pyrDown(srcImage, downsampledImage);std::cout << "下采样后图像尺寸: " << downsampledImage.cols << "x" << downsampledImage.rows << std::endl;// 3. 图像上采样 (放大一倍，基于下采样后的图像)cv::Mat upsampledImage;cv::pyrUp(downsampledImage, upsampledImage);std::cout << "上采样后图像尺寸: " << upsampledImage.cols << "x" << upsampledImage.rows << std::endl;// 4. 为了比较，我们也可以对原始图像直接进行一次上采样cv::Mat upsampledOriginalImage;cv::pyrUp(srcImage, upsampledOriginalImage);std::cout << "原始图像直接上采样后尺寸: " << upsampledOriginalImage.cols << "x" << upsampledOriginalImage.rows << std::endl;// 5. 显示图像cv::imshow("原始图像", srcImage);cv::imshow("下采样图像 (pyrDown)", downsampledImage);cv::imshow("上采样图像 (pyrUp on downsampled)", upsampledImage);cv::imshow("原始图像直接上采样 (pyrUp on original)", upsampledOriginalImage);cv::waitKey(0); // 等待按键cv::destroyAllWindows(); // 关闭所有窗口return 0;
}

代码解释

包含头文件：
- opencv2/imgproc.hpp: 包含了图像处理函数，如 pyrDown 和 pyrUp。
- opencv2/highgui.hpp: 包含了图像的显示和加载函数，如 imread, imshow, waitKey。
- iostream: 用于控制台输出。
加载图像：使用 cv::imread() 从命令行参数指定的路径加载图像。
cv::pyrDown(srcImage, downsampledImage);：对原始图像 srcImage 进行下采样，结果存储在 downsampledImage 中。输出图像的宽高大约是输入图像的一半。
cv::pyrUp(downsampledImage, upsampledImage);：对之前下采样得到的 downsampledImage 进行上采样，结果存储在 upsampledImage 中。输出图像的宽高大约是输入图像的两倍。注意，upsampledImage 的尺寸应该与 srcImage 的尺寸大致相同（由于整数除法可能存在1个像素的差异），但其内容会比原始图像模糊，因为下采样过程丢失了信息。
显示图像：使用 cv::imshow() 分别显示原始图像、下采样后的图像以及上采样后的图像。cv::waitKey(0) 使程序暂停，直到用户按下任意键。

编译与运行

要编译以上 C++ 代码，你需要安装好 OpenCV，并有一个 C++ 编译器（如 g++）。

编译命令示例 (Linux/macOS):

g++ image_pyramid.cpp -o image_pyramid_app `pkg-config --cflags --libs opencv4` -std=c++11

(如果你的 pkg-config 配置的是 opencv 而不是 opencv4，请相应修改。-std=c++11 或更高版本均可。)

运行命令:

./image_pyramid_app <你的图片路径.jpg>

例如：

./image_pyramid_applena.png

应用场景 🖼️

图像金字塔在许多计算机视觉算法中都有广泛应用：

多尺度特征检测：如 SIFT、SURF 等算法会在图像金字塔的不同层上检测特征，以实现尺度不变性。
图像融合：例如，将多张不同曝光的图像融合成一张高动态范围 (HDR) 图像。
目标检测：在不同尺度上搜索目标，以适应目标大小的变化。
图像分割：先在低分辨率图像上进行粗略分割，然后逐步优化到高分辨率。
视频压缩和流媒体：根据带宽和设备能力提供不同分辨率的视频流。

总结

cv::pyrDown 和 cv::pyrUp 是 OpenCV 中实现图像金字塔缩放的基础操作。它们简单易用，且是许多高级图像处理和计算机视觉算法的重要组成部分。通过理解和运用这些函数，开发者可以有效地处理和分析不同尺度下的图像信息。

查看全文

http://www.xdnf.cn/news/9716.html

【代码训练营Day01】数组part1

Linux进程间通信----管道

人员睡岗检测算法AI智能分析网关V4打造工业/安防/交通等多场景应用方案

VMware安装Ubuntu实战分享大纲

Apifox 5 月产品更新｜数据模型支持查看「引用资源」、调试 AI 接口可实时预览 Markdown、性能优化

蓝牙芯片投影仪遥控器方案

网络出版服务许可证年检

MySQL数据库学习笔记

openFuyao开源发布，建设多样化算力集群开源软件生态

【大模型】Bert

计算机网络 | 1.1 计算机网络概述思维导图

Nginx代理、缓存与Rewrite

使用LSTM进行时间序列分析

流程自动化引擎：让业务自己奔跑

C++031（变量的存储类型-auto变量）

塔能空化泵节能方案：工厂能耗精准控制的革新之选

博图SCL基础知识-寻址调用及新建SCL

记一次前端逻辑绕过登录到内网挖掘

计算机内存管理全解析：从基础原理到前沿技术（含分页/分段/置换算法/大页/NVM/CXL等技术详解

C++ explicit关键字有什么作用

Dify+MCP Server打造禅道AI智能助手

LeetCode 136：只出现一次的数字 - 巧用异或运算的极致解法

Open3D上可视化Nuscenes 数据集

谷歌浏览器Google Chrome v137.0.7151.41 中文版本版+插件 v1.11.1

【Echarts】象形图

： influxdb + grafana+JMeter