当前位置: 首页 > web >正文

DeepSeek R2难产:近期 DeepSeek-V3.1 发布,迈向 Agent 时代的第一步

DeepSeek R2难产:近期 DeepSeek-V3.1 发布,迈向 Agent 时代的第一步

要说 AI 模型的江湖,这一年简直就是 「大模型修罗场」
前脚 R2 传出难产的风声,后脚 DeepSeek 就甩出了一张大招牌:DeepSeek-V3.1

这波操作不仅没有掉队,反倒像是提前踩进了 Agent 时代的大门
作为一只长年蹲在模型圈的猫头虎,看完更新细节后,忍不住和大家聊聊:
👉 这次升级到底意味着什么?
DeepSeek R2难产:近期 DeepSeek-V3.1 发布,迈向 Agent 时代的第一步

文章目录

  • DeepSeek R2难产:近期 DeepSeek-V3.1 发布,迈向 Agent 时代的第一步
    • 🌟 V3.1 三大核心升级
    • 🛠️ Agent 能力:更强的工具人
      • 💻 编程智能体
      • 🔍 搜索智能体
    • ⏳ 思考效率:同样的智商,更少的字
    • 📂 模型开源 & 部署须知
    • 💰 价格调整:9月6日见
    • 🦉 猫头虎的思考
    • 🎯 总结


🌟 V3.1 三大核心升级

1️⃣ 混合推理架构
一个模型同时支持 思考模式非思考模式,随时切换,更灵活。

2️⃣ 思考效率提升
相比 R1-0528,V3.1-Think 输出 token 数减少 20%-50%,在更短时间内给出答案。
👉 省字、省钱、省时间。

3️⃣ Agent 能力进化
后训练优化后,V3.1 在 工具调用任务执行 上有了显著提升,Agent 味越来越浓。

📌 官方 App & 网页端已同步升级;
📌 API 支持 deepseek-chat(非思考模式) 和 deepseek-reasoner(思考模式);
📌 新增 Anthropic API 格式支持,可无缝接入 Claude Code 框架。

DeepSeek R2难产:近期 DeepSeek-V3.1 发布,迈向 Agent 时代的第一步


🛠️ Agent 能力:更强的工具人

💻 编程智能体

图片

V3.1 在 代码修复(SWE)终端任务(Terminal-Bench) 中明显优于前代,所需轮数更少。
👉 写代码、跑命令行的场景里,Agent 变得更实用。

🔍 搜索智能体

图片

复杂搜索(browsecomp)多学科难题(HLE) 测试中,V3.1 大幅领先 R1-0528。
👉 检索+多步推理能力显著增强,更像个“知识猎手”。


⏳ 思考效率:同样的智商,更少的字

图片

测试显示:

  • 表现基本持平 R1-0528(AIME 2025: 87.5/88.4,GPQA: 81/80.1,liveCodeBench: 73.3/74.8);
  • token 消耗下降 20%-50%
  • 非思考模式下,输出也更简洁,不啰嗦。

👉 简而言之:更聪明的省话精


📂 模型开源 & 部署须知

DeepSeek 继续保持开放态度:

🔹 Base 模型(新增 840B tokens 训练)

  • Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
  • 魔搭: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

🔹 后训练模型

  • Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1
  • 魔搭: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1

⚠️ 注意事项:

  • V3.1 使用 UE8M0 FP8 Scale 精度,与 V3 不完全兼容;
  • 分词器 & chat template 变动较大,部署需看新版文档。

💰 价格调整:9月6日见

图片

2025 年 9 月 6 日凌晨起

  • 按新版价格表计费;
  • 取消夜间优惠

👉 在此之前,仍按老价格执行。
同时,DeepSeek 也扩容了 API 服务,调用更顺畅。


🦉 猫头虎的思考

  1. R2 难产,V3.1 扛旗
    这波算是战略补位,稳住用户心智。

  2. Agent 化是大趋势
    编程、搜索、工具调用都变强,说明 DeepSeek 已经在铺设 下一代 AI 工作流

  3. 价格与开源的平衡术
    一边涨价,一边开源,本质是 降成本、扩生态 的两手抓。


🎯 总结

DeepSeek-V3.1 不是一鸣惊人的“天花板式”大模型,但它足够 实用且前瞻

效率更高,省钱省时
Agent 能力更强,场景更广
开源透明,生态友好

在 AI Agent 的赛道上,DeepSeek 已经稳稳迈出第一步。


🦉 猫头虎观点:
别纠结 R2 了,V3.1 已经在布一盘更大的棋。


http://www.xdnf.cn/news/18544.html

相关文章:

  • (LeetCode 面试经典 150 题) 129. 求根节点到叶节点数字之和 (深度优先搜索dfs)
  • windows中bat脚本中一些操作(一)
  • 面试紧张情绪管理:如何保持冷静自信应对挑战
  • ES_预处理
  • 自定义SamOut模型在随机序列生成任务上超越Transformer
  • DINOv3 重磅发布
  • CLruCache::BucketFromIdentifier函数分析
  • k8s集群限制不同用户操作
  • 基于springboot的中医养生管理系统
  • 机器学习-聚类算法
  • 【算法精练】 哈夫曼编码
  • Kotlin-基础语法练习二
  • 【python】python测试用例模板
  • 深入理解Java虚拟机:JVM高级特性与最佳实践(第3版)第二章知识点问答(21题)
  • 效果驱动复购!健永科技RFID牛场智能称重项目落地
  • AI资深 Java 研发专家系统解析Java 中常见的 Queue实现类
  • 手机惊魂
  • MySQL高可用之MHA
  • 【智慧城市】2025年中国地质大学(武汉)暑期实训优秀作品(1):智绘旅程构建文旅新基建
  • 稀土元素带来农业科技革命
  • 哈尔滨服务器托管,如何实现高效稳定运行?
  • OBCP第四章 OceanBase SQL 调优学习笔记:通俗解读与实践指南
  • comfyUI背后的一些技术——Checkpoints
  • React:Umi + React + Ant Design Pro的基础上接入Mock数据
  • Unity编辑器相关
  • 基于STM32设计的大棚育苗管理系统(4G+华为云IOT)_265
  • RabbitMQ:技巧汇总
  • 如何用 SolveigMM Video Splitter 从视频中提取 AAC 音频
  • leetcode_238 除自身以外的数组乘积
  • 实践题:智能客服机器人设计