当前位置：首页 > news >正文

【动作】AVA：时空定位原子视觉动作视频数据集

news 2025/6/12 23:38:40

【动作】2017：谷歌发布人类动作识别数据集AVA，精确标注多人动作

在这里插入图片描述

论文地址

在这里插入图片描述
本文介绍了一个时空定位的原子视觉动作（AVA）视频数据集。AVA 数据集密集标注了 430 段 15 分钟视频剪辑中的 80 个原子视觉动作，其中动作在时空上被定位，产生了 1.58M 个动作标签，且每个人出现多个标签的情况频繁。我们的数据集的关键特征包括：(1) 定义原子视觉动作而非复合动作；(2) 精确的时空标注，每个人可能有多重标注；(3) 对这些原子动作在 15 分钟视频剪辑中进行全面标注；(4) 在连续片段中时间上关联的人；(5) 使用电影来收集多样化的动作表示。这与现有的时空动作识别数据集不同，后者通常在短视频片段中对复合动作提供稀疏标注。

http://www.xdnf.cn/news/961309.html

相关文章：

【Dv3Admin】系统视图角色菜单按钮权限API文件解析

Doris “_stream_load“ 方式批量导入数据

Remmina远程访问如何开启本地音频？

（41）课60--61高级篇： MySQL体系结构（连接层、服务层、引擎层、存储层）。存储引擎是基于表的，可为不同表指定不同的存储引擎；查询表结构语句 show create table 表名

#Word“嵌入式”插图显示不全的解决教程

在Word中使用 Microsoft Print to PDF和另存为PDF两种方式生成的 PDF文件

ubuntu24安装TensorRT

ubuntu24.04安装IDEA2025.1.2搭建java开发环境

数据结构-链表OJ-回文链表，如何将时间复杂度控制为O(N),空间复杂度控制为O(1)？

POI设置Excel单元格背景色

DataFrame中.iloc 属性

HTAP 技术：融合事务与分析的数据处理新范式

【数据篇】持久化核心：整合 JPA/MyBatis 实现优雅的数据库操作

pcie问答--0609

激光隐形切割（Stealth Dicing）技术

Oracle数据库对IPv6的支持情况

造成服务器重启的原因都有哪些？

Lang*生态系统多个专业框架及他们的作用

FTXUI::Dom 模块

足球数据如何驱动 AI 模型进化：从数据采集到智能决策的技术解析

PH热榜 | 2025-06-09

小红本批量改写 v1.2.0绿色版

标注工具核心代码解析——def load_image【canvas.py]

BeckHoff --＞电脑与PLC连接

全微分证明链式法则乘法法则除法法则

基于正点原子阿波罗F429开发板的LWIP应用（6）——SNTP功能和lwiperf测速

第一章空间解析几何与向量代数 ~ 空间直角坐标系

【Fifty Project - D35】

在线学堂-第二章媒资管理模块上

高效清理C盘