当前位置: 首页 > news >正文

Lobechat使用WolframAlpha MCP工具减少LLM幻觉

为什么需要WolframAlpha

随着人工智能技术的飞速发展,大型语言模型(LLM)如GPT-4在自然语言处理和生成方面取得了显著的成就。然而,这些模型在处理复杂的科学和数学问题时,常常出现所谓的“幻觉”现象,即生成错误或不合理的结果。这种现象不仅影响了模型的可靠性,也限制了其在教育、科研等领域的广泛应用。[1]

大语言模型在生成文本时,往往依赖于其训练数据中的模式和关联,而缺乏对现实世界的物理规律和逻辑规则的深入理解。这导致在处理科学和数学问题时,模型可能会生成看似合理但实际上错误的答案。例如,在解决物理问题时,模型可能会忽略单位转换、物理定律的应用,甚至在数学计算中出现低级错误。这种幻觉现象不仅影响了问题解决的正确性,也使得模型在面对复杂问题时显得力不从心。
Wolfram Alpha是一个强大的计算知识引擎,能够处理各种科学、数学和技术问题。它基于广泛的数学和科学知识库,能够进行精确的计算、符号操作和公式推导。与大语言模型相比,Wolfram Alpha在处理复杂的数学公式、物理定律和科学概念时具有显著的优势。它能够准确地执行计算任务,避免因模型自身的局限性而导致的错误。[2]

Higress MCP 市场近期上线了WolframAlpha LLM API,可以通过Wolfram MCP形式调用,支持如Lobechat、Cline、Cherry Studio、DeepChat等多种调用形式。目前提供单用户10次/月的免费试用限额,欢迎大家试用!

配置流程

获取 WolframAlpha MCP 工具

进入 Higress MCP 市场主页:MCP Marketplace,点击WolframAlpha

在WolframAlpha中,使用自定义或试用的API-KEY 来生成URL

选择保存好生成的Streamable HTTP URL,用于后续的配置。

在 Lobechat 中配置 Higress MCP

安装Lobechat

Lobechat提供在线版本及开源版本,目前最新版均支持MCP工具的使用。

对于开源版本,需要用户在本地具有docker环境,执行以下命令,一键即可安装:

docker run -d -p 3210:3210 \--name lobe-chat \lobehub/lobe-chat:1.82.4

在设置界面,可以配置不同模型供应商对应的API-KEY。

配置Higress MCP

在lobechat的插件商店中,选择自定义插件:

选择MCP插件,并指定Streamable HTTP模式,填写上一步中获取的URL,然后安装插件。

在对话界面,启用wolframAlpha插件。

测试案例

对于一些基本的推理、常识性的知识,引入WolframAlpha能够很好解决推理过程中的幻觉问题。同时,对于计算、绘图等基本数学功能,WolframAlpha也能获得较好的表现。

数学推理

对于推理较难的非常识性数学知识,比如以下问题:

2^136279841-1是素数吗?

当没有调用WolframAlpha工具时,由于问题较为复杂,基于模型推理过程无法给出准确答案。

日常计算

对于一些日常数学问题,也可以借助WolframAlpha来进行计算:

假设当前有 10,000 元,未来 10 年 的通货膨胀率以 0.5% 的连续复利增长,那么这笔钱的未来购买力相当于今天的多少钱?

图像绘制

除此之外,WolframAlpha还支持一些基本的图像绘制及生成的功能:

获取10000以内素数的分布,使用合适的绘图方式表示出每千位素数数量的变化

此外,WolframAlpha LLM API 在调用出错的情况下,会根据返回结果来提示更优的提问方式;Agent在接收到类似的指令返回后,也会优化提问方式再次调用工具,从而获取正确的结果。

展望

通过结合Wolfram Alpha工具,可以有效解决大语言模型在处理科学和数学问题时的幻觉现象。WolframAlpha的精确计算能力和广泛的知识库能够弥补大语言模型的不足,提升其在复杂问题解决中的准确性和可靠性。未来,随着技术的进一步发展,这种结合方式有望在更多领域得到应用,推动人工智能技术的更广泛发展。

Higress MCP 市场目前已上架40+款 MCP 服务,包含如搜索、沙盒工具、基础信息查询等多个服务,欢迎使用接入!

[1] https://arxiv.org/html/2308.05713v4

[2] Wolfram|Alpha APIs: Computational Knowledge Integration


Higress MCP 市场上线 Product Hunt,快来给 Higress “upvote”!

https://www.producthunt.com/posts/higress

http://www.xdnf.cn/news/149473.html

相关文章:

  • Java 设计模式心法之第23篇 - 状态 (State) - 让对象的行为随状态优雅切换
  • 【蓝桥杯选拔赛真题104】Scratch回文数 第十五届蓝桥杯scratch图形化编程 少儿编程创意编程选拔赛真题解析
  • IPOF(Input-Process-Output-Feedback)方法学简介
  • XMOS空间音频——在任何设备上都能提供3D沉浸式空间音频且实现更安全地聆听
  • 【计算机视觉】CV实践项目- 基于PaddleSeg的遥感建筑变化检测全解析:从U-Net 3+原理到工程实践
  • numpy.random.normal与numpy.random.randn的区别与联系
  • 雷电模拟器怎么更改IP地址
  • 使用 Python 项目管理工具 uv 快速创建 MCP 服务(Cherry Studio、Trae 添加 MCP 服务)
  • Jetpack Compose 基础组件学习2.1:Surface
  • stack __ queue(栈和队列)
  • 分布式事务 两阶段提交协议(2PC的原理、挑战)
  • 大模型微调 - 自注意力机制
  • 【统计学习】递归最小二乘算法与奇异值分解
  • #什么是爬虫?——从技术原理到现实应用的全面解析 VI
  • Vue回调函数中的this
  • 【CF】Day43——Codeforces Round 906 (Div. 2) E1
  • Libconfig 修改配置文件里的某个节点
  • Linux 系统用户管理与权限掌控:从基础到精通
  • 《深入理解计算机系统》阅读笔记之第三章 程序的机器级表示
  • Python判断语句-语法:if,if else,if elif else,嵌套,if else语句扁平式写法,案例
  • LatentSync - 字节联合北交大开源的端到端唇形同步框架-附整合包
  • Cannot read properties of null (reading ‘classList‘)
  • 人工智能的100个关键词系统学习计划
  • Trae 实测:AI 助力前端开发,替代工具还远吗?
  • mysql 导入很慢,如何解决
  • 猿人学题库13题—动态css字体加密 记录
  • JavaScript性能优化实战(5):数据结构与算法性能优化
  • Python爬取天猫畅销榜接口的详细教程
  • Python基础语法:字符串格式化(占位拼接,精度控制,format()函数,快速格式化,表达式格式化)
  • dstream