当前位置: 首页 > ops >正文

js fetch流式请求 AI动态生成文本,实现逐字生成渲染效果

  1. 开启流式请求:向后端接口发起普通的 fetch,它会返回一个包含 ReadableStream 的 Response 对象
  2. 获取流式读取器:调用 response.body.getReader() 获取一个 ReadableStreamDefaultReader 实例
  3. 循环读取数据块:在 while(true) 循环或 for await 中,通过 reader.read() 或 for await (const chunk of response.body.values()) 拿到 Uint8Array 块
  4. 解码并追加显示:使用 TextDecoder 将二进制数据解码成字符串,然后每获取一段就更新到页面上,无需等待完整返回
    MDN Web Docs

发起流式

const response = await fetch('/api/chat', {method: 'POST',headers: { 'Content-Type': 'application/json' },body: JSON.stringify({ prompt: '你好,AI。' })
});
// response.body 即为 ReadableStream

fetch 默认支持流式响应,response.body 就是一个可读流

获取并使用 Reader

const reader = response.body.getReader();  // 锁定流,获取 reader 实例
const decoder = new TextDecoder('utf-8'); // 用于将 Uint8Array 解码为字符串
let done = false;while (!done) {const { value, done: streamDone } = await reader.read();done = streamDone;if (value) {const chunkText = decoder.decode(value, { stream: true });// 这里拿到了一段字符串 chunkTextappendToPage(chunkText);}
}

reader.read() 每次返回一个包含 { value: Uint8Array, done: boolean } 的 Promise
传入 { stream: true } 可以确保多次调用 decode 时不会丢失跨块字符

将数据边读边显示

<div id="chat"></div>
<script>function appendToPage(text) {const chat = document.getElementById('chat');chat.textContent += text;  // 或者用 chat.innerHTML += 转义/格式化后追加}
</script>

每次读取到 chunkText,就调用一次 appendToPage,实时更新 DOM,无需等到 done === true

React 示例

import React, { useState, useEffect } from 'react';function StreamingChat({ prompt }) {const [text, setText] = useState('');useEffect(() => {let cancelled = false;async function fetchStream() {setText('');const res = await fetch('/api/chat', { method: 'POST', body: JSON.stringify({ prompt }) });const reader = res.body.getReader();const decoder = new TextDecoder();let done = false;while (!done && !cancelled) {const { value, done: streamDone } = await reader.read();done = streamDone;if (value) {const chunk = decoder.decode(value, { stream: true });// 追加新内容setText(prev => prev + chunk);}}}fetchStream();return () => { cancelled = true; };}, [prompt]);return <pre style={{ whiteSpace: 'pre-wrap' }}>{text}</pre>;
}export default StreamingChat;

拓展与注意事项

  • 错误处理:在 reader.read() 或 fetch 抛错时,捕获后展示重试选项
  • 性能优化:若数据量巨大,可考虑每累积一定长度再更新一次状态,避免过多重渲染
  • 兼容性:Safari 对流式 API 支持不完全,若需兼容可使用 polyfill 或退回到普通 fetch().then(res => res.text())
  • 流式 JSON:若后端返回的是以换行分隔的 JSON 对象流,可在 decoder.decode 后按 \n 切分并 JSON.parse 逐条处理
http://www.xdnf.cn/news/5662.html

相关文章:

  • 个人博客系统测试报告
  • 常用激活函数总结
  • websocketpp 安装及使用
  • 基于OpenCV的人脸识别:Haar级联分类器
  • SATA—Link层状态机
  • Gmssl库的aes算法效率问题
  • 家具制造行业的现状 质检LIMS如何赋能家具制造企业质检升级
  • 见多识广7:KAIST(韩国高等科学技术院)——关注AI加速器方向
  • 复盘与导出工具最新版V23.0版本更新--新增韭菜异动轮动功能
  • 基于 Python 的后端开发学习路线
  • 【AI】mcp server是什么玩意儿
  • 【Linux网络】 HTTP cookie与session
  • DeepPrep:深度学习提升神经影像预处理
  • LeetCode算法题:电话号码的字母组合
  • Bodhi linux 系统详解
  • 分析红黑树工程实用的特点
  • 智能手表测试计划文档(软/硬件)
  • 读取.ini后缀类型的马达配置文件并进行赋值
  • AtCoder Beginner Contest 405(ABCD)
  • 搭建高可用及负载均衡的Redis
  • C++四种类型转换:static_cast、 dynamic_cast const cast、 reinterpret_cast
  • 详解RabbitMQ工作模式之通配符模式
  • 3.9/Q2,GBD数据库最新文章解读
  • 珠海金山2007逆向分析挑战赛-CrackMe看雪(九连环)(writeup)
  • 【运维】MacOS蓝牙故障排查与修复指南
  • 大地网接地电阻测试的必要性
  • Python如何使用进行风险管理和投资组合优化
  • 2025智能体基建在进化过程中带来的质变
  • 国外付费AI软件充值教程
  • 《棒球百科》MLB棒球公益课·棒球1号位