当前位置: 首页 > news >正文

【DE-III】基于细节增强的模态内和模态间交互的视听情感识别

abstract

在视听情感识别(AVER)中,捕捉视频和音频模态之间复杂的时间关系是至关重要的。然而,现有的方法缺乏对局部细节的关注,如视频帧之间的面部状态变化,这会降低特征的可区分性,从而降低识别准确率。

为此,本文提出了一种用于AVER的细节增强的模态内和模态间交互网络(DE-III)。我们引入光流信息,以丰富视频表示的纹理细节,更好地捕捉面部状态的变化。融合模块将光流估计与对应的视频帧相结合以增强面部纹理变化的表示。我们还设计了模态内和模态间特征增强模块,以进一步提高视频和音频表示的丰富性和可区分性。在3个基准数据集上的实验结果表明,无论是在具体情感识别还是连续情感识别方面,本文提出的模型都优于所有现有的情感识别方法。为鼓励进一步研究并确保可复制性,我们将在接受后发布完整代码。

intro

情感感知由于其广泛的应用而吸引了越来越多的研究关注,例如情感计算[32],人机交互[3]和社交机器人[34]。多模态情感识别,特别是集成音频和视频(即AVER),尤其重要,因为它利用了对人类交流至关重要的两种模态中存在的信息。与单模态情感识别不同,多模态情感识别可以从不同的模态获得对同一情感的不同表征

http://www.xdnf.cn/news/145783.html

相关文章:

  • LabVIEW轨道交通动力系统性能监控
  • Spring 与 ActiveMQ 的深度集成实践(一)
  • 佳博票据和标签打印:Web网页端与打印机通信 | iOS
  • freecad参数化三维模型装配体解析至web端,切换参数组或修改参数
  • 【维护窗口内最值+单调队列/优先队列】Leetcode 239. 滑动窗口最大值
  • 【数据结构】红黑树原理及实现
  • 如何在奥维互动地图里加载星图云卫星地图
  • 【文献阅读】建立高可信度的阴性样本,改进化合物-蛋白质相互作用预测
  • 《WebGIS之Vue零基础教程》(5)计算属性与侦听器
  • 数据库对比
  • C语言实现贪心算法
  • 嵌入式 C 语言面试核心知识点全面解析:基础语法、运算符与实战技巧
  • 企业网站html源代码 企业网站管理源码模板
  • linux centos7 python3安装
  • docker 代理配置冲突问题
  • 数据结构------C语言经典题目(6)
  • spring OncePerRequestFilter 作用
  • Zynq 7000的PS侧DDR3地址范围及相关信息
  • 《使用 Cesium 加载静态热力图显示的实现步骤》
  • 【LeetCode 热题 100】滑动窗口最大值 / 最小覆盖子串 / 轮转数组 / 缺失的第一个正数
  • 如何创建和推广高质量内容:SEO与内容营销的成功指南
  • Low Poly 风格 | 飞机飞行可视化系统
  • Vue3 上传后的文件智能预览(实战体会)
  • React 实现爱心花园动画
  • 漏洞管理体系:从扫描评估到修复验证的全生命周期实践
  • 3.4 Spring Boot异常处理
  • SkyWalking 安装与使用详细总结
  • No version of NDK matched the requested version21.0.6113669
  • uniapp 常用开发技巧与实战指南
  • 安装openstack-keystone教程