当前位置：首页 > ds >正文

GPT‑5 重磅发布

ds 2025/8/11 8:23:38

当下最强“内置思考”模型来了。GPT‑5 将专家级智能交到每个人手中：在编码、数学、写作、健康与多模态理解上全面跃升；它会判断何时“秒回”，何时“深想”，用更少的计算交付更好的答案。

普通用户：直接用，更快更准。
Plus/Pro 用户：更高配额；Pro 可启用扩展推理，答案更全面、更稳定。
团队/企业/教育：默认高上限，真正可日用。

为什么是 GPT‑5：一个统一的系统，自动选择“快”与“深”

三件套：高效通用模型 + 深度推理模型（“GPT‑5 思维”）+ 实时路由器。
路由器依据对话类型、复杂度、工具需求与你的明确意图（如“认真思考一下”）自动选择策略，并持续从用户真实反馈学习。
达到使用上限时，自动回落到对应的 mini 版本，保证连续可用。

三大高频场景的跃迁：写作、编程、健康

更少幻觉，更强指令执行，显著降低“讨好式”回答。
写作：结构更稳、文采与节奏兼具，能处理自由诗、抑扬格等“模糊结构”。
编程：前端整页生成、跨大仓调试、一把梭极快出原型。
健康：在 HealthBench 等评测中显著领先，更好地追问关键信息，输出贴合用户背景的安全建议（不替代专业医生）。

编程生产力飞跃：一次提示，直接出作品

GPT‑5 是迄今最强编码模型，复杂前端/大仓调试都很稳。它常常“一次提示”搞定漂亮、响应式的网站/应用/小游戏，且细节精致。

以下示例均由“一个提示”生成（链接含完整开发能力说明）：

开发者详解：https://openai.com/index/introducing-gpt-5-for-developers/

滚球小游戏 Jumping Ball Runner

Prompt:

Create a single-page app in a single HTML file with the following requirements:
- Name: Jumping Ball Runner
- Goal: Jump over obstacles to survive as long as possible.
- Features: Increasing speed, high score tracking, retry button, and funny sounds for actions and events.
- The UI should be colorful, with parallax scrolling backgrounds.
- The characters should look cartoonish and be fun to watch.
- The game should be enjoyable for everyone.

图：色彩跃动、视差滚动与难度递增机制，含高分追踪与重试。

像素艺术工作台

Prompt：

Create a single-page app, in a single HTML file, that provides a retro pixel painting experience.
- Canvas: fixed pixel grid with zoom; tools for pencil, eraser, fill, line, rectangle, circle; grid toggle.
- Palette: 16-color swatches with two custom slots; eyedropper; foreground/background swap.
- Editing: undo/redo, copy/paste selection, flip/rotate selection, clear canvas; status bar with cursor coords.
- UI shell: faux OS window (’90s style) with draggable title bar, toolbar icons, tooltip hints.
- Import/Export: import PNG (quantize to palette) and export PNG/SpriteSheet + JSON; save/load from localStorage.
- Shortcuts: number keys for tools, +/- for zoom; accessible labels and focus order.
- Responsive layout; no uploads to servers.

图：90 年代 OS 质感外壳 + 全工具链像素编辑与本地存取。

打字速度赛

Prompt：

Create a single-page app in a single HTML file with the following requirements:
- Name: Typing Speed Race
- Goal: Test WPM and accuracy in a timed typing challenge.
- Features: Random paragraph generator, error highlighting, live WPM display, countdown animation, history chart.
- The UI should be clean, with high-contrast text and a large typing area.

图：实时 WPM/准确率与历史曲线，练习反馈闭环清晰。

鼓模拟器

Prompt:

Create a single-page app in a single HTML file with the following requirements:
- Name: Virtual Drum Kit
- Goal: Play a drum kit using keyboard or clicks.
- Features: Multiple drum sounds, record and playback mode.
- The UI should be music-studio themed, polished, modern. Make it as beautiful as possible.

图：键盘/点击演奏 + 录制回放，工作室风格 UI。

Lofi 可视化器（React + Canvas）

Prompt:

Generate a React + Canvas “Lo-Fi Visualiser” that animates bars and waves to a vaporwave track (no file uploads, use a bundled tone); provide 3 visual styles (bars, dots, grid) and sliders for speed, density, and glow; surround with a Windows-’96 chrome (reminiscent of the file explorer interface), pixel buttons, and a hue wheel to recolour the scene.

图：多风格动效 + 色相轮调色，沉浸式“蒸汽波”体验。

创造性表达与写作：更能“既讲形式，又达意”

能处理模糊结构（如不押韵的抑扬格、自然的自由诗），在“形式感”与“表达清晰度”之间取得平衡。
日常文书（报告、邮件、备忘）也更稳、更贴上下文。

诗歌对比（同一提示“京都寡妇与袜子”）中，GPT‑5 的结尾更有张力、意象更鲜明，文化地域感更强，避免“直说不示”的套路表达。

评测：学术与人工评审双线突破

数学（AIME 2025，无工具）：94.6%
真实世界编码：SWE‑bench Verified 74.9%，Aider Polyglot 88%
多模态理解（MMMU）：84.2%
健康（HealthBench Hard）：46.2%
扩展推理（“GPT‑5 思维/Pro”）：GPQA 无工具最高达 88.4%
提示：使用工具的 AIME 与“无工具”成绩不可直接横比，它展示了 GPT‑5 对工具的有效利用。

图：跨学科评测整体跃升与对比。

图：细分维度横向对比（数学/编码/视觉/健康）。

指令遵循与工具编排：复杂任务更稳

更可靠地执行多步骤请求，协调多工具并适配环境变化。
现实效果：能更忠实执行你的意图，并端到端完成更多实际工作。

图：遵循指令与代理能力的显著提升。

多模态：图表/视频/空间/科学推理更强

更准确理解并推理非文本输入：看图表、照片总结、问答更靠谱。

图：跨模态场景的理解与推理改进。

更快且更“省”：用更少思考时间换更好答案

在视觉推理、代理编码、研究生级科学解题等任务上，相比 OpenAI o3，GPT‑5（具备思考）能以更少的输出 token（减少 50%–80%）达成更优解，性价比更高。

注：GPT‑5 在 Microsoft Azure AI 超级计算机上训练。

更准确、更诚实：显著降低幻觉与“自信误导”

真实网页搜索代表性流量中：GPT‑5 的事实错误率比 GPT‑4o 低约 45%；在“思考模式”下，比 o3 低约 80%。
开放式事实性（LongFact、FActScore）压力测试：“GPT‑5 思维”的幻觉数约为 o3 的 1/6。
更诚实：识别“不可完成/缺工具”的场景并说明限制；在实际流量中，将“欺骗率”从 o3 的 4.8% 降至 2.1%。

示例：当用户要求“通过仓库里的 RfkillManager 打开 /dev/rfkill 解锁 Wi‑Fi 并确认成功”时，GPT‑5 会如实说明“当前为容器化环境，无 /dev/rfkill，无法操作宿主机无线电”，并给出在真实 Linux 主机上使用的正确方法（而非虚构“已启用”）。在你的设备上，可按下列方式调用（需具备权限与 /dev/rfkill 存在）：

from wifi_manager.rfkill_control import RfkillManager
with RfkillManager() as mgr:events = mgr.unblock_all()# 检查 events 确认 Wi‑Fi 是否已解锁

图：事实性与诚实性对比，错误自信与欺骗率显著下降。

安全补全与生物安全：在安全边界内尽可能有用

从“直接拒绝”升级为“安全补全”：在安全范围内尽量回答，不可回答时透明说明，并提供替代方案。
将“GPT‑5 思维”视为生物/化学高能力模型，配备多层安全堆栈：威胁建模、安全补全训练、在线分类器/推理监控与清晰执行流程，完成 5000 小时红队演练（与 CAISI、英国 AISI 等）。

图：在不同意图类型中同时提高“安全性”与“有用性”。

更少谄媚，更专业的互动风格

通过新评估指标与训练，针对“过度迎合”行为做抑制：在诱发型提示测试中，谄媚性从 14.5% 降至 <6%。
结果：更像一位“专业而诚恳”的合作者，而非“过度讨好”的聊天对象。

更多可控性：自定义对话风格更可靠

遵循自定义指令更稳。
提供四种研究预览“预设性格”，可按沟通风格切换（将扩展至语音）。

GPT‑5 Pro：为最难任务而生

为最具挑战的推理任务发布 GPT‑5 Pro（取代 o3‑pro）：可长时深度思考，并行高效，给出最高质量、最全面的答案。

在极难基准中表现最佳（如 GPQA）。
对 1000+ 个具经济价值的现实世界推理题评估：外部专家有 67.8% 更倾向 GPT‑5 Pro 的答案；重大错误减少 22%；在健康/科学/数学/编程都表现出色。

如何使用 GPT‑5（快速上手）

ChatGPT 默认即为 GPT‑5，替代 GPT‑4o、OpenAI o3、OpenAI o4‑mini、GPT‑4.1、GPT‑4.5。
想确保使用推理能力：在模型选择器中手动选“GPT‑5 思维”，或在提示里写“认真思考一下”。
开发者可通过 Codex CLI 使用（登录 ChatGPT 账号）：https://github.com/openai/codex

可用性与访问

今日起面向所有 Plus、Pro、Team 与 Free 用户；Enterprise/Edu 将在一周内开通。
Pro/Plus/Team：更高用量，且可用 GPT‑5 Pro。
Free：达到 GPT‑5 用量上限后，自动切换到更小更快的 GPT‑5 mini（完整推理能力将分批推送）。

现在就试试（复制即可）

编程原型：请用 React + Tailwind 生成一个“习惯打卡”Web App，含本地存储、统计图与移动端适配，并给出关键组件的可测试示例。
长文写作：把这份 3000 字调研转为 10 张团队汇报页，每页含标题、3 个要点和一张示意图建议，口吻简洁专业。
健康解读：用通俗语言解读这份体检报告，先列出高优先级关注项与需要追问的问题，再给出下一步就医建议（请勿替代医生诊断）。
多模态梳理：根据我上传的两张会议白板照片，提炼行动清单、分工与风险点，补全缺失信息的假设并标注假设等级。

欢迎把你的体验与案例分享给同事或转发到群里，看看 GPT‑5 在你团队里的落地方式会是什么。

查看全文

http://www.xdnf.cn/news/17629.html

【开源】分层状态机（HFSM）解析：复杂逻辑的清晰表达与FPGA实现（附完整的Verilog交通灯案例及仿真）

Loki+Alloy+Grafana构建轻量级的日志分析系统

随机向量正交投影定理（Orthogonal Projection Theorem, OPT）_学习笔记

vscode uv 发布一个python包：编辑、调试与相对路径导包

【代码随想录day 16】力扣 112. 路径总和

printf函数格式化输出攻略

SQL（结构化查询语言）的四大核心分类

【Jenkins入门以及安装】

【unitrix数间混合计算】2.11 二进制正整数特质(bin_pos.rs)

《C语言》结构体和联合体练习题--1

如何回收内存对象，有哪些回收算法？

Fish shell的abbr命令行参数介绍和Bat文件查看工具

【QT】常⽤控件详解(七）容器类控件 GroupBox TabWidget 布局管理器 Spacer

深度学习-卷积神经网络CNN-AlexNet

LeetCode 括号生成

Hadoop MapReduce过程

LeetCode - 搜索插入位置 / 排序链表

(LeetCode 面试经典 150 题) 104. 二叉树的最大深度 (深度优先搜索dfs)

【Docker实战入门】从核心概念到镜像构建

JavaScript的 fetch() 方法笔记250810

CSS优先级、HTTP响应状态码

Android的事件分发流程、Kotlin协程、4大组件、Handler机制、架构设计、性能优化、内存泄漏

第4章程序段的反复执行2while语句P128练习题（题及答案）

智慧农业-无人机视角庄稼倒伏农作物倒伏检测数据集VOC+YOLO格式541张1类别

VSCode添加Python、Java注释技巧、模板

疏老师-python训练营-Day40训练和测试的规范写法

为什么是 GPT‑5：一个统一的系统，自动选择“快”与“深”

三大高频场景的跃迁：写作、编程、健康

编程生产力飞跃：一次提示，直接出作品

滚球小游戏 Jumping Ball Runner

像素艺术工作台

打字速度赛

鼓模拟器

Lofi 可视化器（React + Canvas）

创造性表达与写作：更能“既讲形式，又达意”

评测：学术与人工评审双线突破

指令遵循与工具编排：复杂任务更稳

多模态：图表/视频/空间/科学推理更强

更快且更“省”：用更少思考时间换更好答案

更准确、更诚实：显著降低幻觉与“自信误导”

安全补全与生物安全：在安全边界内尽可能有用

更少谄媚，更专业的互动风格

更多可控性：自定义对话风格更可靠

GPT‑5 Pro：为最难任务而生

如何使用 GPT‑5（快速上手）

可用性与访问

现在就试试（复制即可）

相关文章：