当前位置: 首页 > news >正文

《计算机视觉度量:从特征描述到深度学习》—深度学习图像特征工程

        传统算法的图像特征分析和描述,一直贯穿图像算法的发展。2017年深度学习的出现,很多开发人员和技术人员认为,图像特征分析这个概念可以被深度学习完全取代。很长一段时间以深度学习为主的视觉方案成为主流,逐渐淡化了传统视觉的特征分析。

        随着深度学习的发展,在很多场景应用中,深度学习只能满足部分场景的需求,工程师开始逐渐对深度学习进行分析和拆解。到2020年自编码深度学习概念的出现,才开始对深度学习的图像特征编码进入深入的理解。逐渐发展出一套针对深度学习编码特征分析的方法。

        以Resnet为例,Resnet的结构主要为四个卷积层和一个线性回归层。在通过大数据ImageNet的训练过后,卷积层对1~1000的线性变量学习了一套卷积特征变换函数。通过对图像的卷积编码,获取到各卷积层输出的特征值。作为后续特征开发的重点,比如比较成功的MaskRcnn和FastRcnn模型就是在图像特征编码的后进行新的训练,完成对目标的检测和识别。以及后来针对VIT网络的YOLO模型。

        通过深度学习提取特征的方法,学术上称之为图片的深度BackOne提取。概念的提出也对深度学习的发展有了底层的根据。在2020~2022之间,工程界和学术界还是以主流的回归训练对深度学习特征进行总结和应用,衍生出很多优秀的模型。但是底层没有太大的改变,同样模型性能和场景也出现瓶颈。

        在2023年Bert(大语言模型的前身)模型的出现,采用新的数据对齐方法,对生成的深度的数据信息映射为一种人类可以理解的描述语言。这种方法就是目前我们看到的大模型时代,这也为图像分析带来了思路。最近的2024~2025年,不断出现针对图片的大模型应用,比如SAM和Dinov2,CLIP等。也开始出现生成式的图片模型的应用。也就衍生出一种非训练方式的数据对齐方案,比如Agent,MCP,RAG等技术。

        这些技术都是采用深度学习对数据的自编码,输出模型的自编码深度信息,并采用数据搜索的方式对信息进行匹配,用于更加准确的数据输出。这也是目前工业检测大模型的方法,具体的效果和应用可以DY搜索“军哥讲视觉”,或者WX搜索“军哥讲视觉”

http://www.xdnf.cn/news/87895.html

相关文章:

  • 动态加载内容时selenium如何操作?
  • Kubernetes相关的名词解释etcdctl(20)
  • 鸿蒙移动应用开发--渲染控制实验
  • 【MCP Node.js SDK 全栈进阶指南】初级篇(2):MCP基础服务器开发
  • Python3中使用jupyter notebook
  • Vue2 el-checkbox 虚拟滚动解决多选框全选卡顿问题 - 高性能处理大数据量选项列表
  • 高性能服务器配置经验指南1——刚配置好服务器应该做哪些事
  • 字符串全排列(Java版本自己用)
  • SpringBoot3集成MyBatis-Plus(解决Boot2升级Boot3)
  • MQ底层原理
  • AI代表企业签订的合同是否具有法律效力?
  • 第一章-语言基础\2.竞赛常用库函数\其他库函数
  • AXOP33552: 400MHz 高速双通道运算放大器
  • 《AI大模型应知应会100篇》 第33篇:大模型在法律文档处理中的应用
  • 第T9周:猫狗识别2
  • MySQL中根据binlog日志进行恢复
  • SAS宏调试:高效定位与解决典型问题
  • 德施曼重磅发布五大突破性技术及多款重磅新品,开启AI智能管家时代
  • 使用 rebase 轻松管理主干分支
  • 【Linux】静态库 动态库
  • ZLG嵌入式笔记 | 拯救NAND/eMMC:延长闪存寿命
  • OpenCv高阶(七)——图像拼接
  • 高级java每日一道面试题-2025年4月22日-基础篇[反射篇]-如何通过反射创建一个对象实例?
  • Redi的常见场景
  • Agent框架LangGraph:实现一个简单的Plan-and-Execute Agent
  • 使用Java调用TensorFlow与PyTorch模型:DJL框架的应用探索
  • xyz 瓦片leaflet地图组件 显示
  • 软考-高项,知识点一览十九 配置和变更管理
  • 低代码破局,助力工业互联网平台迈向智改数转新高地
  • 电脑硬盘丢失怎么找回?解决硬盘数据恢复的2种方法