【动作】AVA:时空定位原子视觉动作视频数据集
【动作】2017:谷歌发布人类动作识别数据集AVA,精确标注多人动作
- 论文地址
本文介绍了一个时空定位的原子视觉动作(AVA)视频数据集。AVA 数据集密集标注了 430 段 15 分钟视频剪辑中的 80 个原子视觉动作,其中动作在时空上被定位,产生了 1.58M 个动作标签,且每个人出现多个标签的情况频繁。我们的数据集的关键特征包括:(1) 定义原子视觉动作而非复合动作;(2) 精确的时空标注,每个人可能有多重标注;(3) 对这些原子动作在 15 分钟视频剪辑中进行全面标注;(4) 在连续片段中时间上关联的人;(5) 使用电影来收集多样化的动作表示。这与现有的时空动作识别数据集不同,后者通常在短视频片段中对复合动作提供稀疏标注。