当前位置: 首页 > news >正文

FCN语义分割笔记(1)

一、什么是语义分割

定义:为图像中的每一个像素赋予一个类别标签,语义分割提供更精细、像素级别的理解。比如有一个图片,图片里有一个西瓜和勺子,经过语义分割模型,输出一个结果,如果原来的图片是512*512,那么理论上来说要对应这么多个像素并且背景也算一个类别,每个像素掩码+类别信息。

应用场景:自动驾驶(道路、行人、车道线、交通标志)、医学图像分析(分割器官、肿瘤、病灶区域)、遥感图像处理(建筑物、农田、湖泊)

二、发展历史

传统模型:基于阈值、基于图像分层和纹理、基于聚类、基于边缘

深度学习模型:FCN(2014):全卷积神经网络,第一个将传统分类的CNN改造成像素级预测的架构,开创了基于深度学习的语义分割新时代。U-Net(2015):为医学图像分割设计,在参数量不打的前提下一九能跑出非常不错的效果。DeepLab(2016-2018):v1引入空洞卷积+CRF,v2加入ASPP多尺度特征,v3去除CRF强化ASPP,v3+加入E-D提升边缘精度。

三、FCN原理 

一般卷积模型进行分类的模型结构是:输入固定大小的图片,然后经过卷积层和池化层的特征提取,最终输出的特征图有一个特性,就是特征图的高宽下采样一定倍数,通道数变大,然后将特征图通过一定的方法进行展平和全连接层对接,最后一层全连接层的神经元个数应是类别的数量,最后利用softmax函数映射最后一层神经元的输出,输出值为概率值,所有值相加等于1.

利用FCN模型进行语义分割任务,本质上也是一个分类任务,只不过从任务的本质来说是对图像进行像素级的分类,并且模型的输入图片可以是任意大小(没有全连接层),模型的特征提取网络可以是任意卷积神经网络(可以是VGG也可以是ResNet等等),最后网络模型的输出为和输入图像一样高宽的高维向量。可以理解为输出一个概率矩阵。

输出解析:

假设有20类,那么输出的结果是21类,多出来的一个类为背景。

http://www.xdnf.cn/news/1132615.html

相关文章:

  • XSS-labs 1-8关
  • 系统性学习C语言-第十八讲-C语言内存函数
  • 从零开始的云计算生活——番外4,使用 Keepalived 实现 MySQL 高可用
  • xss-lab1-8关
  • AWS ML Specialist 考试备考指南
  • Liunx练习项目6-创建dns服务器
  • 图机器学习(10)——监督学习中的图神经网络
  • AI Agent开发学习系列 - langchain之LCEL(1):LangChain LCEL链式编排与RAG增强实践
  • 新手向:自动化图片格式转换工具
  • orfeotoolbox ResetMargin
  • 硬件设计学习DAY3——电源Buck电路深度解析:CCM/DCM/BCM模式与电感设计
  • Linux运维新手的修炼手扎之第21天
  • 【论文阅读】A Survey on Knowledge-Oriented Retrieval-Augmented Generation(4)
  • Kotlin比较接口
  • Kotlin获取集合中的元素操作
  • 力扣-146.LRU缓存机制
  • Xsens人形机器人拟人动作AI训练,提升机器人工作精度与效率
  • MybatisPlus-11.IService的批量新增
  • 高性能架构模式——高性能缓存架构
  • alpineLinux修改包管理为国内源
  • 【Linux】基本指令详解(二) 输入\输出重定向、一切皆文件、认识管道、man、cp、mv、echo、cat
  • LVS集群搭建
  • OpenCV稠密光流估计的一个类cv::optflow::DenseRLOFOpticalFlow
  • [AI-video] 字幕服务 | 视频素材服务 | 视频生成服务
  • 智能电网时代:双向WiFi电表在海外家庭能源中的战略价值
  • C++---emplace_back与push_back
  • 网络爬虫的相关知识和操作
  • lazyvim恢复gt键
  • 项目流程管理系统使用建议:推荐13款
  • 【27】MFC入门到精通——MFC 修改用户界面登录IP IP Address Control