当前位置: 首页 > backend >正文

【pytorch】torch.nn.Unfold操作

说明

一个代码里涉及到了unfold的操作,看了半天官网都没整明白维度怎么变化的,参考这个链接搞明白了:
https://blog.csdn.net/ViatorSun/article/details/119940759
https://zhuanlan.zhihu.com/p/361140988

维度计算

输入( N, C, H, W)
输出(N,C×∏(kernel_size),L)
L 是通过卷积核 滑动裁剪 后,得到的区块的数量。

C×∏(kernel_size)是怎么来的?

从第一个参考链接的图可以看到,就是窗口滑动的时候,把窗口同一个位置的值放在了一个通道,所以窗口有多少个像素,就变成了多少个通道。
用参考博客的代码做一个示例:

inputs = torch.randn(1, 2, 4, 4)
print(inputs.size())
print(inputs)
unfold  = torch.nn.Unfold(kernel_size=(2, 2), stride=2)
patches = unfold(inputs)
print(patches.size())
print(patches)

输出结果

torch.Size([1, 2, 4, 4])
tensor([[[[ 0.4448, -1.8525, -1.8243, -1.0243],[ 0.0224, -1.2402, -0.7154, -1.2538],[-0.6515, -0.6022,  0.2263, -1.6286],[ 0.2067,  0.8257, -1.9318,  1.0372]],[[ 2.4799, -0.5248, -0.3170,  1.5934],[-0.3643,  1.1624, -1.5762, -0.1827],[-0.0553,  0.1629, -1.3280, -0.8468],[ 0.0671,  1.6328,  1.1706,  1.7891]]]])
torch.Size([1, 8, 4])
tensor([[[ 0.4448, -1.8243, -0.6515,  0.2263],[-1.8525, -1.0243, -0.6022, -1.6286],[ 0.0224, -0.7154,  0.2067, -1.9318],[-1.2402, -1.2538,  0.8257,  1.0372],[ 2.4799, -0.3170, -0.0553, -1.3280],[-0.5248,  1.5934,  0.1629, -0.8468],[-0.3643, -1.5762,  0.0671,  1.1706],[ 1.1624, -0.1827,  1.6328,  1.7891]]])

用两个窗口的情况来举例,每个位置对应的结果情况如下:
在这里插入图片描述

http://www.xdnf.cn/news/857.html

相关文章:

  • PyTorch实现糖尿病预测的CNN模型:从数据加载到模型部署全解析【N折交叉验证、文末免费下载】
  • Android端使用无障碍服务实现远程、自动刷短视频
  • 流量抓取工具(wireshark)
  • 大文件分片上传进阶版(新增md5校验、上传进度展示、并行控制,智能分片、加密上传、断点续传、自动重试),实现四位一体的网络感知型大文件传输系统‌
  • 二叉树操作与遍历实现
  • 详细介绍:MCP(大模型上下文协议)的架构与组件,以及MCP的开发实践
  • VTK官方C++ demo1
  • 论文分享:【2024 CVPR】Vision-and-Language Navigation via Causal Learning
  • Harbor对接非AWS对象存储
  • 零基础学Python——第六章:Python标准库
  • mongodb 存储数据的具体实现方式
  • 计算机视觉中的正则化:从理论到实践的全面解析
  • 缓存设计模式
  • HTTP与HTTPS的区别
  • 固定资产全生命周期管理:采购至报废的高效管理路径
  • CC注入Tomcat Upgrade/Executor/WebSocket内存马
  • 【网络安全】CI/CD 流水线漏洞
  • Python 金融量化分析
  • 【ESP32】【微信小程序】MQTT物联网智能家居案例
  • 模拟量数据信号采集模块的特点及应用
  • 无需接线!虚幻引擎变量跨次元绑定的无线电奥秘
  • Spring Boot 核心模块全解析:12 个模块详解及作用说明
  • 蓝桥杯 17.发现环
  • springboot对接阿里云大模型
  • 忽略 CS8616 警告在 Visual Studio 2022 中【C# 8.0 】
  • ios17 音频加载失败问题
  • Redis 慢查询分析与优化
  • 蓝桥杯 18.分考场
  • C++之unordered封装
  • 基于Python的设计模式之创建型模型