当前位置: 首页 > ds >正文

图像张量中的通道维度

通道维度”是图像张量中的一个非常重要的维度,它表示图像中有多少种颜色(或特征图),我们来详细解释一下:


✅ 什么是通道维度(channel dimension)?

在深度学习中,图像通常用一个 4维的张量(tensor) 来表示,维度结构如下:

[批量大小, 通道数, 高度, 宽度]batch_size, channels, height, width

举例:灰度图像 vs 彩色图像
  • 灰度图像(黑白图)

    • 通道数 = 1 → [batch_size, 1, height, width]

    • 每个像素只有一个数值,表示灰度(亮度)

  • RGB彩色图像

    • 通道数 = 3 → [batch_size, 3, height, width]

    • 每个像素由 R、G、B 三个值组成


✅ 若张量 X 的形状为

X.shape = [18, 1, 28, 28]

意思是:

  • 有 18 张图像(batch size = 18)

  • 每张图像是 28×28 的 灰度图像

  • 每张图像有 1 个通道(channel)


X.reshape(18, 28, 28) 是干什么的?

它把原本形状为 [18, 1, 28, 28] 的张量 去掉了通道维度 1,变成:

[18, 28, 28]

这是因为:

  • imshow 这个函数用于显示图像时,灰度图只需要 [height, width]

  • PyTorch 加载数据时默认保留通道维度 [1, 28, 28]

  • 为了显示,我们需要手动“压缩”掉通道维度:reshape(18, 28, 28)squeeze(1)


✅ 通道维度的作用(在 CNN 中)

在卷积神经网络中,通道维度非常重要:

  • 输入图像的通道数决定了第一层卷积核的大小

  • 中间每一层卷积通常会增加通道数,表示提取了更多特征

例如:

输入:[1, 28, 28]
第一层卷积后:[16, 28, 28](提取16个特征图)

✅ 总结一句话:

“通道维度”表示图像中颜色或特征的种类。灰度图是1个通道,RGB是3个通道。在可视化灰度图像时,我们通常会把形状 [1, 28, 28] 变成 [28, 28],以便 matplotlib 正确显示。

http://www.xdnf.cn/news/17103.html

相关文章:

  • 计算机网络:如何在实际网络中进行子网划分
  • 机器翻译入门:定义、发展简史与核心价值
  • Day23--回溯--39. 组合总和,40. 组合总和 II,131. 分割回文串
  • SQL 地理空间原理与实现
  • GLM-4.5 解读:统一推理、编码与智能体的全能王
  • PYTHON从入门到实践-18Django模版渲染
  • 电力电子技术知识总结-----PWM知识点
  • OS21.【Linux】环境变量
  • 第八章:进入Redis的SET的核心
  • adb 与pad 交互方法
  • [每周一更]-(第154期):Docker 底层深度剖析:掌控 CPU 与内存资源的艺术
  • idea中.xml文件的块注释快捷键
  • Suno的100个高质量歌词元标签(MetaTags)详解与使用指南
  • 网安-逻辑漏洞-23登陆验证
  • 文明存续的时间博弈:论地球资源枯竭临界期的技术突围与行动紧迫性
  • lua中 list.last = last 和list[last]=value区别
  • 悬挂的绳子,它的函数方程是什么样子的?
  • HiveMQ 2024.9 设计与开发文档
  • Android 之 MVVM架构
  • 大语言模型的解码策略:贪婪解码与波束搜索
  • [硬件电路-133]:模拟电路 - 信号处理电路 - 电荷放大器概述、工作原理、常见芯片、管脚定义
  • 使用ASIWebPageRequest库编写Objective-C下载器程序
  • 动感按钮:如何打造交互感十足的点击动画效果
  • Python-初学openCV——图像预处理(五)
  • GitHub 趋势日报 (2025年08月02日)
  • 机器学习第四课之决策树
  • C++-二叉树OJ题
  • 分布式文件系统05-生产级中间件的Java网络通信技术深度优化
  • ubuntu24.04安装selenium、edge、msedgedriver
  • Leetcode 12 java