当前位置: 首页 > ds >正文

首发!PPIO派欧云上线DeepSeek-R1-0528-Qwen3-8B蒸馏模型

首发!PPIO派欧云上线DeepSeek-R1-0528-Qwen3-8B蒸馏模型

DeepSeek R1 系列的模型更新还在继续。

继昨天 PPIO派欧云首发上线 DeepSeek-R1-0528 模型后,今天 PPIO 再次首发 DeepSeek 最新开源的蒸馏模型 DeepSeek-R1-0528-Qwen3-8B。

DeepSeek-R1-0528-Qwen3-8B 是将 DeepSeek-R1-0528 的思维链提取出来,用于对 Qwen3 8B Base 进行后训练而得到的蒸馏模型。该 8B 模型在数学测试 AIME 2024 中仅次于 DeepSeek-R1-0528,超越 Qwen3-8B (+10.0%),与 Qwen3-235B 相当。

现在,你可以在 PPIO 平台快速体验该系列模型:DeepSeek-R1-0528-Qwen3-8B

同时,DeepSeek-R1-0528-Qwen3-8B 的价格与基本信息也一并发布:

1. DeepSeek-R1-0528-Qwen3-8B 实测

DeepSeek 本次更新的 R1 系列模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。

因此,我们分别测试了 DeepSeek-R1-0528-Qwen3-8B 在数学、编码与通用逻辑的表现。

数学题:

提示词:“用你所掌握的数学知识,用11、6、4、13计算出24。”

DeepSeek-R1-0528-Qwen3-8B 在第一次没有得出正确答案。

当告诉它可以不局限于四则运算法则,DeepSeek-R1-0528-Qwen3-8B 得出了一个答案,用到了指数运算。

这道题的正确答案是用阶乘:((13-4)-(11-6)!=24。

编程

提示词:生成一个网页版的贪吃蛇游戏。

将 DeepSeek-R1-0528-Qwen3-8B 给到的代码另存为html文件后在浏览器中打开,是一个审美很在线的贪吃蛇小游戏。

通用逻辑

提示词:未来的某天,李同学在实验室制作超导磁悬浮材料时,意外发现实验室的老鼠在空中飞,分析发现,是因为老鼠不小心吃了磁悬浮材料。第二天,李同学又发现实验室的蛇也在空中飞,分析发现,是因为蛇吃了老鼠。第三天,李同学又发现实验室的老鹰也在空中飞,你认为其原因是?

这个问题,DeepSeek-R1-0528-Qwen3-8B 的逻辑是严谨的,但更准确的答案应该是:老鹰本来就会飞。

这是一道经典的大模型测试题,目前市面上的大模型还无一答对。

2. 如何在 PPIO 体验 DeepSeek-R1-0528-Qwen3-8B?

  • 直接在模型广场体验(无须代码)

到 PPIO派欧云官网注册后,找到模型广场下的 DeepSeek-R1-0528-Qwen3-8B 模型直接进行体验。快速入口:DeepSeek-R1-0528-Qwen3-8B

  • 在第三方平台上集成 DeepSeek-R1-0528-Qwen3-8B

除了在 PPIO 模型广场直接体验,你也可以通过第三方应用来调用 PPIO API 的能力。目前 PPIO 支持在 20+ 主流平台中调用平台模型,具体包括:

  • 通用对话客户端:CherryStudioChatbox、LobeChat、Nextchat、ChatHub

  • 通用AI助手:OpenManus、UI-TARS

  • 代码开发工具:Cursor、CLINE

  • 开发/ API 平台:Dify、OneAPI、RAGFlow、FastGPT

  • 生产力套件集成:Word、WPS Office AI,这些是办公软件集成AI功能。

  • 智能翻译工具:沉浸式翻译、欧路词典、流畅阅读、沉浸式导读。

  • 知识管理工具:思源笔记、Obsidian、AnythingLLM

详细教程:https://ppio.cn/docs/third-party/overview

3.   在自己开发的应用程序中集成 API (针对开发人员)

如果你有自己开发的应用程序,也可以通过 PPIO 的 API 接口,将 DeepSeek-R1-0528-Qwen3-8B 无缝集成到你的应用程序、工作流或聊天机器人。PPIO 提供多语言 SDK(cURL、Python、JavaScript 等)。

如果是单轮或多轮对话应用、轻量集成、普通 chatbot 项目,可直接调用 API。以 Python 为例:

from openai import OpenAIbase_url = "https://api.ppinfra.com/v3/openai"
api_key = "<您的 API Key>"
model = "deepseek/deepseek-r1-0528-qwen3-8B"client = OpenAI(base_url=base_url,api_key=api_key,
)stream = True # or False
max_tokens = 1000response_format = { "type": "text" }chat_completion_res = client.chat.completions.create(model=model,messages=[{"role": "user","content": "Hi there!",}],stream=stream,extra_body={})if stream:for chunk in chat_completion_res:print(chunk.choices[0].delta.content or "", end="")
else:print(chat_completion_res.choices[0].message.content)

主要特点:

  • OpenAI 兼容接口:使用 /v3/openai 统一接口,兼容 openai.ChatCompletion 调用方式。

  • 无需部署模型:无需管理模型权重或基础设施,后端完全托管。

  • 输出方式:支持流式和一次性返回

如果是构建复杂的多代理工作流,比如使用 OpenAI Agents SDK,可以按照以下方式操作:

(1)前置条件:获取 API Base URL 以及 PPIO LLM API key;

(2)设置 Python 环境并安装 Agents SDK,输入以下代码即可完成操作:

python -m venv env
source env/bin/activate
pip install openai-agents==0.0.7

以输出功能为例。运行前,请确保已设置 PPIO API KEY 和 DeepSeek-R1-0528-Qwen3-8B 环境变量。

import os
from openai import AsyncOpenAI
from agents import (Agent,Runner,set_default_openai_api,set_default_openai_client,set_tracing_disabled,
)BASE_URL = "https://api.ppinfra.com/v3/openai"
API_KEY = "在此处粘贴 PPIO 官网的 API Key" #此处需修改
MODEL_NAME = "deepseek/deepseek-r1-0528-qwen3-8B"# 基于PPIO不支持responses API,因此我们使用chat completions API作为示例
set_default_openai_api("chat_completions")
set_default_openai_client(AsyncOpenAI(base_url=BASE_URL, api_key=API_KEY))# 在此示例中禁用追踪# 如需使用自定义追踪处理器,请参考:https://openai.github.io/openai-agents-python/tracing/#external-tracing-processors-list
set_tracing_disabled(disabled=True)agent = Agent(name="Assistant",instructions="You are a helpful assistant", model=MODEL_NAME)result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)#输出示例:
# Code within the code,
# Functions calling themselves,
# Infinite loop's dance.

http://www.xdnf.cn/news/9819.html

相关文章:

  • 【数据结构】图论核心算法解析:深度优先搜索(DFS)的纵深遍历与生成树实战指南​
  • Spring Boot 3.5.0中文文档上线
  • 在 WSL Ubuntu-24.04 上安装 Nacos 2.5.1 并使用 MySQL 数据库
  • 【Linux】网络--传输层--深入理解TCP协议
  • 计算机组成与体系结构:固态硬盘(Solid State Drives)
  • 数据驱动健康未来——大数据如何革新公共卫生监测?
  • [250528] NixOS 25.05 “Warbler“ 正式发布:GNOME 48、Kernel 6.12 及海量软件包更新!
  • vue3+element-plus项目主题色切换;element-plus换肤
  • DAX权威指南5:筛选上下文、表操作函数与层级结构
  • SSE vs WebSocket:两种通讯方案该如何选择?
  • MD650一对多透传场景联动
  • 二叉树迭代遍历——给一个属性便可实现迭代结构完美统一
  • Linux轻量级文件传输——tftp命令
  • 【QQ音乐】sign签名| data参数 | AES-GCM加密 | webpack(上)
  • 腾控产品在油田间抽节能中的应用
  • Python深度学习植被参数反演AI辅助代码生成—模型构建—实战案例
  • vue3 控制url更新但不让页面更新
  • 回溯算法找出来最优价格组合
  • 深度学习-梯度消失和梯度爆炸
  • 光的干涉、衍射与偏振
  • Python入门手册:模块和包的导入与使用
  • Cookie与Session深度解析:Web会话管理的核心技术
  • 健康管理软件未来趋势:三大核心功能深度解析
  • Windows下的Qtxlsx下载和编译打包成库
  • 消息队列从入门到实战:用外卖订单理解高并发系统的核心设计
  • YOLOv8 区域计数系统:基于计算机视觉的智能物体计数方案
  • vue3+element plus 自定义组件,单列的方块 图形加文字列表
  • 写作即是生活
  • 华南版权服务大厅启用:富唯智能携具身智能人形机器人亮相,赋能版权产业生态革新
  • 【深度学习-pytorch篇】2. Activation, 多层感知机与LLaMA中的MLP实现解析