当前位置：首页 > news >正文

从零实现一个GPT 【React + Express】--- 【3】解析markdown，处理模型记忆

news 2025/9/2 23:52:05

theme: yu

highlight: a11y-light

摘要

这是本系列的第三章，在此之前我们先回顾一下上一篇文章：

# 从零实现一个GPT 【React + Express】— 【2】实现对话流和停止生成

在这一篇里，我们实现了前端对话流的基本交互，可以做到问答以及停止生成的效果：
请添加图片描述

但是会发现从效果上来看，似乎很丑，因为都挤在一起了，没有一点格式。

这个时候我们要看一下模型返回的内容是不是没有格式的，看一下接口你就会发现，其实模型返回的内容是markdown的内容，所以我们前端在处理的时候需要对其转换一下的。

本章重点

引入React Markdown，代码高亮
实现模型记忆
实现新建对话

引入ReactMarkdown

来到DialogCardList组件，之前我们只是通过一个div把answer包起来了，现在我们用ReactMarkdown给他包起来：

首先安装一下依赖：

npm i react-markdown

然后修改我们的组件：

// DialogCardList/index.tsximport ReactMarkDown from 'react-markdown';// 其他代码return (<div className={styles.scrollContainer}><div className={styles.dialogCardList}>{dialogCardListStore.dialogCardList.map((item) => {return (<div className={styles.dialogCard} key={item.cardId}><div className={styles.question}><p>{item.question}</p></div><div className={styles.answer}><ReactMarkDown>{item.answer}</ReactMarkDown></div></div>);})}</div></div>
);

这个时候在看一下效果，就发现现在的回答是有格式的了：

在这里插入图片描述

实现代码高亮

虽然我们引入了markdown，但是读者可以尝试输入这样一段query：”帮我写一段冒泡排序“。

会发现ReactMarkdown并不会对代码做高亮处理，但是呢，ReactMarkDown组件对外暴露了components属性，用户处理不同类型的标签，例如code类型。所以这里我们给ReactMarkdown加上components属性。

<ReactMarkDown components={{ code: getCode }}>{item.answer}
</ReactMarkDown>

然后我们实现getCode方法，这里为了实现代码高亮，我们引入react-syntax-highlighter

先安装一下依赖：

npm i react-syntax-highlighter

现在我们就可以实现getCode方法了：

import SyntaxHighlighter from 'react-syntax-highlighter';import { hybrid } from 'react-syntax-highlighter/dist/esm/styles/hljs';const getCode = (params: any) => {const { inline, className, children, ...props } = params;const match = /language-(\w+)/.exec(className || '');return !inline && match ? (<SyntaxHighlighterclassName={styles.codeBlock}language={match[1]}PreTag="div"style={hybrid}{...props}>{String(children).replace(/\n$/, '')}</SyntaxHighlighter>) : (<code className={className} {...props}>{children}</code>);
};

这样，我们的代码高亮就也实现了。

在这里插入图片描述

这部分的代码提交记录：

https://github.com/TeacherXin/gpt-xin/commit/58ca34ecf8f9f6c5b706639dbc732def554d8f65

后端处理模型记忆

其实现在，如果读者多尝试几次，会发现一个很不正常的问题，比如你这么发送query。

【曹操是谁？】
【模型回答: 曹操是。。。。。】
【他的儿子是谁】
【模型回答：请提供具体的人物。。。。。】

这体现了，模型对历史的对话是不保留记忆的，那如果模型不保留，我们就要给他保留。并且每次发送下一个问题的时候，把之前模型的回答都给模型传过去。这样模型就可以根据以往的回答，对历史保存记忆了。

之前我们使用模型的时候，是这么调用的：

const stream = await client.chat.completions.create({messages: [{ role: 'system', content: '你是一个风趣幽默的中文助手' },{ role: 'user', content: message },],model: 'gpt-3.5-turbo',stream: true,max_tokens: 5000, // 控制生成的 token 数
});

这里介绍一下，role字段的类型：

system：代表系统字段，就是一个初始化模型的字段。
user：代表用户输入的query。
assistant：代表模型输出的内容。

那如果我们把之前用户的提问和模型的回答组成一对，然后全放在messsages里面，模型不就能够把之前的对话记下来了吗。

但是我们又不能全记，应该是只记录当前会话的历史，比如用户创建了一个新的对话。那么之前对话里的历史就不应该存下来。所以这里我们要有一个sessionId的概念。

我们现在来模拟一下整个流程：

前端第一次发送sse请求，paloyd为用户输入的query
后端接受sse请求，发现没有sessionId，创建一个sessionId通过major返回。
前端接收到sessionId保存下来
前端第二次发送sse请求，paloyd为用户输入的query和sessionId
后端接受sse请求，发现有sessionId，将上一轮的问答传给模型
重复第四步
前端新建一个对话，将sessionId清空，回到第一步

现在我们就可以对后端的getChat方法进行改造了：


// chat.jslet historyList = [];const getChat = async (message, sessionId ,res) => {try {const majorData = {id: Date.now()};if (!sessionId) {sessionId = Date.now();majorData.sessionId = sessionId;historyList = [];}const stream = await client.chat.completions.create({messages: [{ role: 'system', content: '你是一个风趣幽默的中文助手' },...historyList,{ role: 'user', content: message },],model: 'gpt-3.5-turbo',stream: true,max_tokens: 5000, // 控制生成的 token 数});const eventName = 'major';res.write(`event: ${eventName}\n`);res.write(`data: ${JSON.stringify(majorData)}\n\n`);let answer = '';for await (const part of stream) {const eventName = 'message';if (Object.keys(part.choices[0]?.delta || {}).length > 0) {res.write(`event: ${eventName}\n`);res.write(`data: ${JSON.stringify(part.choices[0].delta)}\n\n`);answer += part.choices[0].delta.content || '';}}historyList.push({role: 'user',content: message,});historyList.push({role: 'assistant',content: answer,});console.log(historyList)res.end(); // 结束连接} catch (error) {console.error('Error during OpenAI API call:', error);res.end(); // 结束连接}
};

后端这部分的提交记录如下：

https://github.com/TeacherXin/gpt-xin-server/commit/6c350f063544ba8b06bb5eafe90efb3c92e6ec2b

前端处理新建对话

后端实现完了我们就来完善一下前端内容，首先我们要修改我们的connectSSE方法，sendData里有一个参数是sessionId，当前session第一次发送不携带，后续每次发送都需要携带该参数：

同时在major的callback里，我们要将sessionId存在store里面。

// DialogInput/index.tsx
const majorCallback = (major: Major) => {dialogCardListStore.changeLastId(major.id);if (major.sessionId) {dialogCardListStore.setSessionId(major.sessionId);}
};if (dialogCardListStore.sessionId) {data.sessionId = dialogCardListStore.sessionId;
}connectSSE(url, data, {message: messageCallback,major: majorCallback,close: closeCallback,
});

这个时候，你就可以发送一段连续的query了：

在这里插入图片描述

可以看到，模型对之前的内容保留了记忆。

最后来到久违的sidebar组件，增加一个新建对话的按钮并且绑定个事件：

// Sidebar/index.tsxconst newSessionClick = () => {dialogCardListStore.clear();
}

然后在实现一下clear方法：

// DialogCardList/store.tsclear: () => set(() => ({ dialogCardList: [], sessionId: '' })),

这部分的提交记录如下：

https://github.com/TeacherXin/gpt-xin/commit/dc50bdca0f133499b005667844878dd58581f699

查看全文

http://www.xdnf.cn/news/1102393.html

继承和多态扩展学习

没有Mac如何完成iOS 上架：iOS App 上架App Store流程

Django--02模型和管理站点

【Springboot】Bean解释

CPT203-Software Engineering: Project Managent 项目管理

继承示例

飞算 JavaAI：开启 Java 开发新时代

使用Python将目录中的JPG图片按后缀数字从小到大顺序纵向拼接，很适合老师发的零散图片拼接一个图片

Set 二分 -＞剑指算法竞赛

【9】PostgreSQL 之 vacuum 死元组清理

Ant ASpin自定义 indicator 报错

模拟开关、可编程增益仪表放大器电路

VLM-R1 + GRPO 算法完整复现全过程日志

随手记录第二十话 -- Python3版本虚拟环境安装与AI的接入使用

RuoYi+Uniapp(uni-ui)开发商城系统

python学习DataFrame数据结构

数据结构第一章复杂度的认识

【java17】使用 Word 模板导出带替换符、动态表格和二维码的文档

iOS 数组如何设计线程安全

提示工程：突破Transformer极限的计算科学

工具分享--IP与域名提取工具

Spring 声明式事务：从原理到实现的完整解析

小架构step系列11：单元测试引入

分享|2025年机器学习工程师职业技术证书报考指南

如何使用 Python 删除 Excel 中的行、列和单元格 – 详解

《探索电脑麦克风声音采集多窗口实时可视化技术》

xFile:高性能虚拟分布式加密存储系统——Go

上位机知识篇---Git符号链接

python的类型注解讲解

云、实时、时序数据库混合应用：医疗数据管理的革新与展望（中）

摘要

本章重点

引入ReactMarkdown

实现代码高亮

后端处理模型记忆

前端处理新建对话

相关文章：