当前位置: 首页 > news >正文

2025年百度商业AI技术创新大赛赛道二:视频广告生成推理性能优化-初赛第五名,复赛第九名方案分享

官网在这里插入图片描述

赛事背景–简单的说就是优化视频生成推理速度

随着广告行业对个性化和创意内容的需求不断增加,利用大模型生成高质量视频素材已经成为一种创新趋势。然而,现有的大模型视频推理存在严重的性能挑战,如何在保证生成视频质量的同时加速推理,成为多模态视频生成的业内挑战。本次比赛将聚焦于如何提升大模型在广告视频生成任务中的推理效率,参赛者需要在加速推理速度的同时,保持一定的生成精度。 具体任务是利用大模型生成与广告内容相关的视频,同时优化模型的推理速度,确保其在实时广告生成场景中的应用可行性。 我们期待通过本次比赛,推动广告创作中的AI技术进步,探索加速大模型推理的新方法,满足日益增长的市场需求。

上分历程

从baseline的31.295分提升到79.251分。大大优化了视频生成的性能
在这里插入图片描述

修改方案

方案中应用了自己设计的注意力机制,性能可以提升10分,使用teacache技术进行优化,可以提升20分,最终通过不断修改,初赛第五名,复赛第九名
在这里插入图片描述

http://www.xdnf.cn/news/1459675.html

相关文章:

  • JVM 运行时数据区域
  • java面试中经常会问到的dubbo问题有哪些(基础版)
  • JVM 类加载全过程
  • Node-RED服务成本/价格很高?那这不到“三张”的怎么说?
  • QT卡顿的可能原因
  • TP8 数组在模板html文件中输出json字符串格式{“0“:“x1“,“1“:“x2“,“2“:“x3“}
  • 在Spring MVC中使用查询字符串与参数
  • 2025市面上比较实用的财会行业证书,最值得考的8个职业证书推荐
  • 本地部署开源数据生成器项目实战指南
  • HarmonyOS应用开发之界面列表不刷新问题Bug排查记:从现象到解决完整记录
  • JS函数进阶
  • Roo Code之自定义指令(Custom Instructions),规则(Rules)
  • 硬盘分区格式化后产生了哪些变化
  • OpenStack VLAN网络类型实训案例
  • 机器学习:后篇
  • LangChain4j的初步学习【逐步添加中】
  • 强化学习DQN解决Cart_Pole问题
  • claude code route 使用教程|命令大全
  • linux中的awk使用详解
  • 深度解读《实施“人工智能+”行动的意见》:一场由场景、数据与价值链共同定义的产业升级
  • 【8】C#上位机---泛型、委托delegate与多线程Task
  • 2025年代理IP服务深度评测:三大平台横评,谁是最强业务助手?
  • 检查数据集格式(77)
  • 计算机二级C语言操作题(填空、修改、设计题)——真题库(16)附解析答案
  • C++基础——模板进阶
  • 【C++题解】关联容器
  • Linux的权限详解
  • 一次死锁的排查
  • 激活函数:神经网络的“灵魂开关”
  • 阅读论文神奇Zotero下载安装教程以及划词翻译(Translate for Zotero)的配置