当前位置: 首页 > ai >正文

火山引擎发布豆包大模型 1.6 与视频生成模型 Seedance 1.0 pro

6 月 11 日,在火山引擎 FORCE 原动力大会上,字节跳动旗下火山引擎正式发布豆包大模型 1.6、豆包・视频生成模型 Seedance 1.0 pro、豆包・语音播客模型,豆包・实时语音模型也在火山引擎全量上线,豆包大模型家族已成为拥有全模态、全尺寸、高性价比的领先模型矩阵。截至 2025 年 5 月底,豆包大模型日均 tokens 使用量超过 16.4 万亿,较去年 5 月刚发布时增长 137 倍。

豆包大模型 1.6:推理、多模态与复杂任务处理的革新

全新发布的豆包大模型 1.6 系列由三个模型组成,为企业提供多样化选择。

  • doubao-seed-1.6:All-in-One 的综合模型,是国内首个支持 256K 上下文的思考模型,支持深度思考、多模态理解、图形界面操作等多项能力。支持选择开启或关闭深度思考、自适应思考三种方式,其中自适应思考模式可根据提示词难度自动决定是否开启思考,在推理效率与效果间达到精妙平衡。
  • doubao-seed-1.6-thinking:豆包大模型 1.6 系列在深度思考方面的强化版本,在代码、数学、逻辑推理等基础能力上进一步提升,支持 256K 上下文。其在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上的表现已跻身全球前列,能够深入分析问题,对各类复杂任务给出高质量解答。
  • doubao-seed-1.6-flash:豆包大模型 1.6 系列的极速版本,支持深度思考、多模态理解、256K 上下文,延迟极低,TOPT 仅需 10ms,视觉理解能力比肩友商旗舰模型。该版本在追求速度的同时,没有牺牲模型对文本、图像等多模态信息的理解能力,能够快速响应业务请求,满足对时效性要求极高的场景。

在推理速度、准确度与稳定性上,豆包大模型 1.6 实现了显著提升。以高考数学测评为例,有媒体针对今年的高考全国新一卷数学单科做了测评,豆包的成绩是 144 分,全国第一。而在高考前,在针对海淀区模拟全卷的测评中,相比去年的模型,豆包大模型 1.6 理科成绩显著提升了 154 分,文科提升了 90 分,充分展现其在复杂知识推理与问题解决上的进步。在多模态理解方面,此前豆包 1.5 的多模态能力在 60 个公开评测基准中取得 38 项最佳成绩,已广泛应用在电商识图、自动驾驶数据标注、门店巡检等场景。而豆包大模型 1.6 在此基础上更进一步,图形界面操作能力让其具备 “行动力”,可自动操作浏览器完成酒店预订,识别购物小票并整理成 Excel 表格等任务,将多模态理解与实际操作相结合,更好地处理真实世界问题。

豆包・视频生成模型 Seedance 1.0 pro:视频生成技术的新标杆

全新发布的豆包・视频生成模型 Seedance 1.0 pro 具备三大特性,代表着视频生成技术的新高度。

  • 无缝多镜头叙事:通过先进的语义理解和镜头语言规划技术,Seedance 1.0 pro 能够根据输入的文本或图片信息,生成逻辑连贯、情节流畅的多镜头视频。模型能够精准把握不同镜头之间的转场时机和方式,实现自然流畅的镜头切换,避免了传统视频生成模型在多镜头叙事时容易出现的情节断裂、场景突兀等问题 。
  • 多动作及随心运镜:该模型支持多种复杂的人物动作及灵活的运镜效果。在人物动作生成方面,它能够分析动作时序与空间关系,生成自然流畅的人物交互动作,使人物的运动轨迹、受力反馈更加契合现实规律。在运镜上,支持 360 度环绕、航拍、变焦、平移、跟随、手持等多种镜头语言,极大地丰富了视频的视觉表现形式,为创作者提供了更多创意表达的可能性。
  • 稳定运动与真实美感:在视频生成过程中,Seedance 1.0 pro 能够保证主体运动的稳定性,即使在复杂的动作和运镜下,也能确保视频主体清晰、稳定,不会出现抖动、模糊等现象。同时,模型生成的视频画面具有极高的自然度和真实美感,通过专业级光影布局和色彩调和,生成的视频画面极具视觉冲击力,接近实拍效果。

根据第三方权威榜单 Artificial Analysis 最新结果,Seedance 1.0 pro 在文生视频、图生视频两个维度都超越了业界诸多主流模型,登顶全球竞技场第一,彰显了其在视频生成技术领域的领先地位。

目前,豆包大模型已涵盖多模态、视频、图像、语音、音乐等丰富的模型品类,正全方位推进智能提升和应用落地,凭借不断革新的技术为企业的智能化转型和创新发展持续赋能。

http://www.xdnf.cn/news/13333.html

相关文章:

  • ABP vNext + Spark on Hadoop:实时流处理与微服务融合
  • 嵌入式学习笔记 - C语言访问地址的方式,以及指针的进一步理解
  • JMeter 处理 UTF-16 转 UTF-8 乱码问题解决方案(deepseek)
  • AnythingLLM配置Milvus后,上传文档提示向量数据库标识符错误的解决办法
  • 鹰盾Win播放器作为专业的视频安全解决方案,除了硬件翻录外还有什么呢?
  • 微信小程序分享带参数地址
  • UFS-Ver3.1-第八章
  • 6.11 打卡
  • 对话机器人预测场景与 Prompt / 模型选择指南
  • 探究:什么是扁平化组织?有什么益处?
  • gitlab相关操作
  • 实战案例-FPGA的JESD204调试问题解析
  • 青少年编程与数学 01-011 系统软件简介 13 Microsoft SQL Server数据库
  • 关于使用WebSocket时无法使用@Autowired 注入的问题
  • CompletableFuture浅谈
  • Efficient Attention 理解
  • 美团完整面经
  • Matlab解决无法读取路径中的空格
  • matlab分布式电源微电网潮流
  • uni-app 自定义路由封装模块详解(附源码逐行解读)
  • FEMFAT许可使用数据分析工具介绍
  • MySQL 主从复制与一主多从架构实战详解
  • Electron-vite【实战】MD 编辑器 -- 编辑区(含工具条、自定义右键快捷菜单、快捷键编辑、拖拽打开文件等)
  • 深入理解 TCP 套接字:Socket 编程入门教程
  • uniapp请求接口封装
  • C#引用传递代码记录
  • 第七章: SEO与渲染方式
  • 滚珠导轨在汽车自动化装配线中的核心传动
  • AVCap视频处理成帧和音频脚本
  • CKA考试知识点分享(9)---gateway api