当前位置: 首页 > news >正文

基于单应性矩阵变换的图像拼接融合

单应性矩阵变换

单应性矩阵是一个 3x3 的可逆矩阵,它描述了两个平面之间的投影变换关系。在图像领域,单应性矩阵可以将一幅图像中的点映射到另一幅图像中的对应点,前提是这两幅图像是从不同视角拍摄的同一平面场景。

常见的应用场景:

  • 图像拼接 :将多幅有重叠区域的图像拼接成一幅全景图像。
  • 增强现实 :将虚拟物体正确地投影到现实场景中。
  • 相机位姿估计 :通过已知的三维点和对应的图像点,估计相机的位置和姿态。

在 OpenCV 中,可以使用 cv2.findHomography 函数来计算单应性矩阵。该函数通常结合特征点检测和匹配算法使用,步骤如下:

  1. 特征点检测 :使用 SIFT、SURF、ORB 等算法在两幅图像中检测特征点。
  2. 特征点匹配 :通过特征描述子匹配两幅图像中的特征点,找到对应的点对。
  3. 计算单应性矩阵 :使用匹配的点对调用 cv2.findHomography 函数计算单应性矩阵。

代码示例

import cv2
import numpy as npdef stitch_images(img1, img2):# 1. 特征检测与匹配detector = cv2.SIFT_create()kp1, des1 = detector.detectAndCompute(img1, None)kp2, des2 = detector.detectAndCompute(img2, None)matcher = cv2.BFMatcher()matches = matcher.knnMatch(des1, des2, k=2)# 筛选优质匹配good = []for m, n in matches:if m.distance < 0.75 * n.distance:good.append(m)# 2. 计算单应性矩阵if len(good) >= 4:src_pts = np.float32([kp1[m.queryIdx].pt for m in good]).reshape(-1, 1, 2)dst_pts = np.float32([kp2[m.trainIdx].pt for m in good]).reshape(-1, 1, 2)H, _ = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 5.0)else:print("匹配点不足,无法计算单应性矩阵")return None# 计算变换后图像的四个角点h1, w1 = img1.shape[:2]h2, w2 = img2.shape[:2]pts1 = np.float32([[0, 0], [0, h1], [w1, h1], [w1, 0]]).reshape(-1, 1, 2)pts2 = np.float32([[0, 0], [0, h2], [w2, h2], [w2, 0]]).reshape(-1, 1, 2)pts1_transformed = cv2.perspectiveTransform(pts1, H)# 合并所有角点pts = np.concatenate((pts2, pts1_transformed), axis=0)# 找到新图像的边界[x_min, y_min] = np.int32(pts.min(axis=0).ravel() - 0.5)[x_max, y_max] = np.int32(pts.max(axis=0).ravel() + 0.5)# 调整单应性矩阵以补偿偏移translation = np.array([[1, 0, -x_min], [0, 1, -y_min], [0, 0, 1]], dtype=np.float32)H = translation.dot(H)# 3. 透视变换result = cv2.warpPerspective(img1, H, (x_max - x_min, y_max - y_min))result[-y_min:h2 - y_min, -x_min:w2 - x_min] = img2# 6. 裁剪黑色边缘gray = cv2.cvtColor(result, cv2.COLOR_BGR2GRAY)_, thresh = cv2.threshold(gray, 1, 255, cv2.THRESH_BINARY)contours, _ = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)if len(contours) > 0:x, y, w, h = cv2.boundingRect(contours[0])result = result[y:y + h, x:x + w]return result# 使用示例
if __name__ == "__main__":img1 = cv2.imread("left.jpg")img2 = cv2.imread("right.jpg")if img1 is not None and img2 is not None:panorama = stitch_images(img1, img2)if panorama is not None:cv2.imwrite("result.jpg", panorama)else:print("图像读取失败,请检查文件路径和完整性。")

左侧图片:
1

右侧图片:
2

拼接效果:
3

http://www.xdnf.cn/news/419581.html

相关文章:

  • 水滴Android面经及参考答案
  • React面试常问问题详解
  • AJAX 简介
  • 经典中的经典-比特币白皮书中文版
  • 【RabbitMQ】七种工作模式介绍
  • day19-线性表(顺序表)(链表)
  • 里氏替换原则:Java 面向对象设计的基石法则
  • langchain学习
  • nvidia驱动更新-先卸载再安装-ubuntu
  • Jsp技术入门指南【十三】基于 JSTL SQL 标签库实现 MySQL 数据库连接与数据分页展示
  • 解锁课程编辑器之独特风姿
  • pdf url 转 图片
  • loki grafana 页面查看 loki 日志偶发 too many outstanding requests
  • 基于大模型预测的视神经脊髓炎技术方案大纲
  • Flannel UDP 模式的优缺点
  • MySQL的Docker版本,部署在ubantu系统
  • Starrocks的主键表涉及到的MOR Delete+Insert更新策略
  • 2025年化学工程与材料物理国际会议(CEMP 2025)
  • [学习] RTKLib详解:qzslex.c、rcvraw.c与solution.c
  • 移动端前端开发调试工具/webkit调试工具/小程序调试工具WebDebugX使用教程
  • OpenCV的CUDA模块进行图像处理
  • 文件相关操作
  • 通过QPS和并发数定位问题
  • 网络体系结构(OSI,TCP/IP)
  • 3.4 数字特征
  • 关于网站提交搜索引擎
  • 【Cesium入门教程】第七课:Primitive图元
  • 算法备案部分咨询问题解答第三期
  • leetcode-hot-100 (滑动窗口)
  • Windows部署LatentSync唇形同步(字节跳动北京交通大学联合开源)