当前位置: 首页 > java >正文

【valse2025】CV与ML领域重要进展

在这里插入图片描述


文章目录

  • 背景介绍
  • 十六个热门方向
  • 一、Al for Science(Al4S)成为科研新范式,正推动科学发现领域迈向新高度
  • 二、具身智能和空间智能持续火热,世界模拟加速落地推动具身智能进化
  • 三、DeepSeek-R1点燃复杂推理大模型热潮,迅速拓展至视觉领域
  • 四、在语言模型驱动下,视觉理解与生成架构趋于统一
  • 五、可控图像/视频生成方法百花齐放
  • 六、垂直领域大模型稳步发展,百花齐放
  • 七、长视频理解任务受到善遍关注,成为多模态理解的重要课题
  • 八、世界模型雏形涌现,成为推动智能体迈向更高层次通用智能的关键引擎
  • 九、多模态基础大模型成为业界“标准配置”
    • 在这里插入图片描述
  • 十名往后


背景介绍

在这里插入图片描述

  几大进展的标题来源于

  • 1.评选2024年5月-2025年4月之间,世界范围内视觉与学习领域的重要学术进展。
  • 2.责任AC提名候选进展共16个,通过组委会评议;VALSE2024-2025全体AC投票(选择6-12个进展)。截止5月18日,共收集有效选票128份,超过2/3的AC参与了投票。
  • 3.加权计算得分:若某个AC投票N个进展,则该AC为其投票的每个进展贡献1/N投票分。
  • 4.每个候选项总得分等于所有AC投票分之和,得票率等于总得分除以最大可能投票分。

  


十六个热门方向

在这里插入图片描述
  


一、Al for Science(Al4S)成为科研新范式,正推动科学发现领域迈向新高度

  来源:“东方理工大学”-金鑫。AI重构整个科学研究领域。
在这里插入图片描述

  


二、具身智能和空间智能持续火热,世界模拟加速落地推动具身智能进化

  中科院计算所-高林。具身智能视角下的时间、空间、物理感知力。CV是光学物理,实际客观世界还有力学、热学

在这里插入图片描述

  


三、DeepSeek-R1点燃复杂推理大模型热潮,迅速拓展至视觉领域

  来源于“港中文”-岳翔宇

在这里插入图片描述
  


四、在语言模型驱动下,视觉理解与生成架构趋于统一

  来源于“微软亚洲研究院”-元玉慧

在这里插入图片描述


五、可控图像/视频生成方法百花齐放

  来源“北航”-于茜。与世界模型一脉相承

在这里插入图片描述

  


六、垂直领域大模型稳步发展,百花齐放

  利物浦大学-程光亮。类似于教育的研究生与博士阶段,专用领域模型。

在这里插入图片描述


七、长视频理解任务受到善遍关注,成为多模态理解的重要课题

  来源于“华为”谢凌曦。从图像、短视频,到长视频的理解是很自然的趋势。在这里插入图片描述


八、世界模型雏形涌现,成为推动智能体迈向更高层次通用智能的关键引擎

  数据来源于“彭程实验室”-杨文瀚。SORA的发布被认为是世界模型的雏形。世界模型主要用于建模,预测,具有重要应用空间。

在这里插入图片描述


九、多模态基础大模型成为业界“标准配置”

  此资料收集于“南京大学”叶翰嘉。

在这里插入图片描述

十名往后

在这里插入图片描述

  视觉就是语言:
在这里插入图片描述


  

  

  

http://www.xdnf.cn/news/13304.html

相关文章:

  • 在线客服系统:企业成功的关键支柱
  • Xshell远程连接Kali(默认 | 私钥)Note版
  • SciencePlots——绘制论文中的图片
  • [java八股文][MySQL面试篇]索引
  • JavaScript事件循环机制详解
  • Unity轻松实现麦克风录音与播放
  • git管理github上的repository(二)
  • 中南大学无人机智能体的全面评估!BEDI:用于评估无人机上具身智能体的综合性基准测试
  • 嵌入式学习之系统编程(十三)数据库
  • STL 5 适配器
  • MySQL基础语法总结
  • 如何在 Python 中去除列表重复项并保留顺序
  • BeckHoff <--> 基恩士(CV-X300)三维机械手视觉系统的通讯 控制
  • minio私有桶授权访问
  • Leetcode 3574. Maximize Subarray GCD Score
  • java 面向对象编程
  • Linux下制作Nginx绿色免安装包
  • 7.4.分块查找
  • vue3 字体颜色设置的多种方式
  • sysctl优先级顺序
  • 第3章 MySQL数据类型
  • (八)深度循环神经网络:长序列建模、注意力机制与多模态融合
  • CloudReadering
  • Prompt Tuning、P-Tuning、Prefix Tuning的区别
  • c语言中的hashmap
  • ArkUI-X跨平台Bridge最佳实践
  • 张彬彬《龙骨焚箱》开机 奇幻冒险题材引期待
  • 在微服务架构中,怎么搭建Maven私服
  • crackme007
  • mysql8.4备份与恢复实践