当前位置: 首页 > news >正文

【动作】AVA:时空定位原子视觉动作视频数据集

【动作】2017:谷歌发布人类动作识别数据集AVA,精确标注多人动作

在这里插入图片描述

  • 论文地址

在这里插入图片描述
本文介绍了一个时空定位的原子视觉动作(AVA)视频数据集。AVA 数据集密集标注了 430 段 15 分钟视频剪辑中的 80 个原子视觉动作,其中动作在时空上被定位,产生了 1.58M 个动作标签,且每个人出现多个标签的情况频繁。我们的数据集的关键特征包括:(1) 定义原子视觉动作而非复合动作;(2) 精确的时空标注,每个人可能有多重标注;(3) 对这些原子动作在 15 分钟视频剪辑中进行全面标注;(4) 在连续片段中时间上关联的人;(5) 使用电影来收集多样化的动作表示。这与现有的时空动作识别数据集不同,后者通常在短视频片段中对复合动作提供稀疏标注。

http://www.xdnf.cn/news/961309.html

相关文章:

  • 【Dv3Admin】系统视图角色菜单按钮权限API文件解析
  • Doris “_stream_load“ 方式批量导入数据
  • Remmina远程访问如何开启本地音频?
  • (41)课60--61高级篇: MySQL体系结构(连接层、服务层、引擎层、存储层)。存储引擎是基于表的,可为不同表指定不同的存储引擎;查询表结构语句 show create table 表名
  • #Word“嵌入式”插图显示不全的解决教程
  • 在Word中使用 Microsoft Print to PDF和另存为PDF两种方式生成的 PDF文件
  • ubuntu24安装TensorRT
  • ubuntu24.04安装IDEA2025.1.2搭建java开发环境
  • 数据结构-链表OJ-回文链表,如何将时间复杂度控制为O(N),空间复杂度控制为O(1)?
  • POI设置Excel单元格背景色
  • DataFrame中.iloc 属性
  • HTAP 技术:融合事务与分析的数据处理新范式
  • 【数据篇】持久化核心:整合 JPA/MyBatis 实现优雅的数据库操作
  • pcie问答--0609
  • 激光隐形切割(Stealth Dicing)技术
  • Oracle数据库对IPv6的支持情况
  • 造成服务器重启的原因都有哪些?
  • Lang*生态系统多个专业框架及他们的作用
  • FTXUI::Dom 模块
  • 足球数据如何驱动 AI 模型进化:从数据采集到智能决策的技术解析
  • PH热榜 | 2025-06-09
  • 小红本批量改写 v1.2.0绿色版
  • 标注工具核心代码解析——def load_image【canvas.py]
  • BeckHoff -->电脑与PLC连接
  • 全微分证明 链式法则 乘法法则 除法法则
  • 基于正点原子阿波罗F429开发板的LWIP应用(6)——SNTP功能和lwiperf测速
  • 第一章 空间解析几何与向量代数 ~ 空间直角坐标系
  • 【Fifty Project - D35】
  • 在线学堂-第二章媒资管理模块上
  • 高效清理C盘