当前位置：首页 > java >正文

图像分割算法入门：从基础到FCN

java 2025/6/27 4:26:34

本文围绕图像分割展开，介绍了基于深度学习的图像分割算法分类，包括语义分割和实例分割。深入分析传统基于 CNN 分割方法的缺点，并简要讲解全卷积网络（FCN）的原理、结构及相关概念。帮助读者了解图像分割基础算法，掌握 FCN 关键要点。

关键词：图像分割；语义分割；实例分割；FCN

一、图像分割算法分类

图像分割旨在预测图像中每个像素所属的类别或物体。基于深度学习的图像分割算法主要分为语义分割和实例分割两类。

语义分割为图像中的每个像素分配一个类别，例如能指出画面中所有物体各自的类别，就像为画面中的每个像素贴上类别标签一样，如下图所示：
请添加图片描述

实例分割则只对特定物体进行类别分配，但目标检测输出的是边界框和类别，而实例分割输出的是掩膜（mask）和类别，示例图如下：
请添加图片描述

二、传统的基于CNN的分割方法缺点

传统基于 CNN 的分割方法，是使用像素周围的图像块作为 CNN 的输入进行训练与预测。这种方法存在明显缺点：

存储开销大：若对每个像素使用 $15 \times 15$ 的图像块，并不断滑动窗口输入到 CNN 中进行类别判断，所需存储空间会随滑动窗口的次数和大小急剧上升。
效率低下：相邻像素块存在大量重复，针对每个像素块逐个计算卷积，会造成大量重复计算。
分类性能受限：像素块的大小限制了感受区域的大小，通常像素块远小于整幅图像，只能提取局部特征，导致分类性能受到影响。

三、FCN——全卷积网络

FCN 的出现改变了传统 CNN 在图像分割上的局限。一般的分类 CNN 网络，如 VGG 和 Resnet，会在网络最后加入全连接层，经过 softmax 后得到的是只能标识整个图片类别的 1 维概率信息，不适用于图像分割。而 FCN 把后面的全连接层换成卷积层，可获得 2 维的 feature map，后接 softmax 层就能得到每个像素点的分类信息，从而解决了分割问题，如下图所示：
请添加图片描述