当前位置: 首页 > java >正文

华为云Flexus+DeepSeek征文 | 基于华为云ModelArts Studio搭建AnythingLLM聊天助手

华为云Flexus+DeepSeek征文 | 基于华为云ModelArts Studio搭建AnythingLLM聊天助手

  • 引言
  • 一、ModelArts Studio平台介绍
    • 华为云ModelArts Studio简介
    • ModelArts Studio主要特点
  • 二、AnythingLLM介绍
    • AnythingLLM 简介
    • AnythingLLM主要特点
    • AnythingLLM地址
  • 三、安装AnythingLLM应用
    • 下载AnythingLLM软件
    • 安装AnythingLLM工具
  • 四、开通DeepSeek-R1-0528商用服务
    • 访问ModelArts Studio控制台
    • DeepSeek-R1-0528 介绍
    • 开通DeepSeek-R1-0528服务
    • 生成API Key
    • 复制及保存OpenAI SDK信息
  • 五、AnythingLLM基本配置工作
    • 设置系统语言
    • 配置AI提供商
    • 新建工作区
    • 测试对话
  • 六、使用体验
  • 七、实践总结

引言


随着人工智能技术的发展,本地化部署的大语言模型(LLM)逐渐成为构建个性化智能服务的关键。AnythingLLM 作为一个开源的本地聊天助手解决方案,以其高效、安全和易用性受到了广泛关注。借助华为云 ModelArts Studio 强大的 AI 工程化能力,我们能够快速搭建并部署 AnythingLLM,实现从概念到应用的无缝衔接。通过本次实践,我们将展示如何利用华为云的弹性计算资源和一站式服务,轻松创建一个功能强大的私有 AI 助手。


一、ModelArts Studio平台介绍

华为云ModelArts Studio简介

华为云ModelArts Studio是基于ModelArts构建的一站式大模型即服务平台(MaaS),深度整合昇腾算力资源与全链路开发工具,为开发者提供从数据准备、模型训练微调、提示词工程到应用部署的全流程解决方案。平台不仅预置主流开源大模型,还具备海量数据智能预处理、自动化标注、分布式训练及模型自动生成能力,全面覆盖AI模型全生命周期管理。无论是深耕算法的工程师、AI领域初学者,还是寻求智能化转型的企业,都能依托ModelArts Studio的高效开发能力,快速实现AI应用的高质量落地与规模化部署。

  • 华为云ModelArts Studio平台地址:https://www.huaweicloud.com/product/modelarts/studio.html

在这里插入图片描述

ModelArts Studio主要特点

  • 模型全、免配置、免调优、性能优
    业界 SOTA 大模型覆盖度高达 99%,内置最优超参配置,结合昇腾算子优化与显存管理,显著提升训练与推理性能。

  • 开箱即用,一站式模型开发服务
    提供模型调优、压缩、部署、评测等全栈工具,功能覆盖大模型全生命周期,用户无需搭建即可直接使用。

  • 资源一站式按需开通,建设周期短
    计算资源可分钟级获取,支持按需计费、弹性扩缩容,并具备断点续训与故障快速恢复能力。

  • 多服务组合竞争力,一站式应用能力集成
    支持 MCP Server、LangChain、RAG、Agent、Guard、九问等组件即插即用,灵活构建复杂 AI 应用场景。

  • 兼容性强,适配主流框架与自定义需求
    全面支持 TensorFlow、PyTorch、MindSpore 等主流 AI 框架,同时支持用户自研算法框架接入。

二、AnythingLLM介绍

AnythingLLM 简介

AnythingLLM 是由 Mintplex Labs Inc. 开发的一款企业级本地化文档聊天机器人解决方案,是目前全球首个支持完整本地大语言模型(LLM)交互的开源桌面应用。它不仅能够与任何文档内容进行智能对话,还提供强大的向量数据库管理、API 集成和多用户权限控制功能,适用于知识库问答、企业私有化部署、AI 助手构建等多种场景。Everything is local by default —— 模型、文档、聊天记录全部存储于本地,真正实现隐私优先、安全可控。

AnythingLLM主要特点

  • 🔐 无需账户注册,开箱即用,保护用户隐私
  • 💻 全平台支持,兼容 macOS、Windows、Linux
  • ⚙️ 一键安装,无需复杂配置即可快速启动
  • 📁 支持多种文档格式:PDF、TXT、DOCX、CSV、MD 等
  • 💬 双模式聊天体验:保留上下文的对话模式 & 快速问答的查询模式
  • 📚 自动向量化文档,高效处理大型资料库
  • 🔍 引用文献标注功能,回答结果来源清晰可查
  • 🧠 内置 LLM 支持,本地运行无依赖云端服务
  • 📈 成本优化设计,文档嵌入仅需一次费用,节省高达 90%
  • 🌐 开发者友好 API,便于深度集成与定制开发
  • 👥 多用户权限管理,满足团队协作与企业部署需求
  • 🧱 可嵌入网页小部件,轻松集成到网站或平台中
  • ☁️ 支持云端部署,灵活适配本地与在线使用场景

AnythingLLM地址

🚀 官网地址:https://useanything.com
📦 GitHub 地址:https://github.com/Mintplex-Labs/anything-llm


三、安装AnythingLLM应用

下载AnythingLLM软件

AingDesk下载地址:https://anythingllm.com/desktop,我们选择Windows x64位版本进行下载。

在这里插入图片描述

安装AnythingLLM工具

下载AnythingLLMk安装包后,在本地Windows上直接安装即可。

在这里插入图片描述

安装安装提示,依次点击下一步安装即可。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

安装AnythingLLM完成,打开后如下所示:

在这里插入图片描述

四、开通DeepSeek-R1-0528商用服务

访问ModelArts Studio控制台

我们登录华为云官网后,在ModelArts Studio介绍页中(官网地址:https://www.huaweicloud.com/product/modelarts/studio.html),我们点击“ModelArts Studio控制台”后,即可进入ModelArts Studio控制台页面。

在这里插入图片描述

在这里插入图片描述

DeepSeek-R1-0528 介绍

DeepSeek-R1-0528 是 DeepSeek 最新推出的大语言模型版本,专为提升复杂代码生成数学推理能力而设计。该模型在训练数据和算法架构上进行了深度优化,显著提升了以下方面的能力:

  • 逻辑推理准确性
  • 程序生成效率
  • 数学问题求解能力

适用于如自动化编程、科研辅助、金融建模、数据分析等对精度与性能要求极高的高端应用场景,是开发者与研究人员的理想选择。


☁️ 华为云 ModelArts Studio(MaaS 平台)正式接入 DeepSeek-R1-0528

华为云 ModelArts Studio 是一站式 AI 开发平台,现已全面接入 DeepSeek-R1-0528,进一步丰富了其 MaaS(Model as a Service)服务能力

基于 昇腾云的强大算力底座,用户可实现:

一键部署调用
低成本灵活扩展
高效应对复杂AI任务

此次合作不仅显著增强了平台在代码生成数学推理方面的表现,也大幅降低了使用门槛与成本,助力开发者与企业快速构建智能化应用,推动 AI 技术落地。


📌 立即体验 DeepSeek-R1-0528,开启智能开发新篇章!

开通DeepSeek-R1-0528服务

在ModelArts Studio控制台首页的左侧菜单栏中,我们选择模型推理——在线推理,选择商务服务DeepSeek-R1-0528,点击“开通服务”。

在这里插入图片描述

备注:

服务类型描述注意事项
免费服务适合用于体验模型,受严格的速率限制。平台可能会不定时调整其适用模型、免费额度、有效期等内容。
- 单个模型提供200万token推理额度。额度消耗完后可选择开通商用级别的推理API服务或部署为付费服务使用。
商用服务提供商用级别的推理API服务。开通后可获取付费API服务(仅限贵阳一)。
- 用户可以前往费用中心查看模型服务的优惠折扣发放和使用情况。可以前往“我的服务”部署为个人服务后付费使用。

点击“开通服务”后,我们勾选同意协议,确认“立即开通”。

在这里插入图片描述

生成API Key

进入API Key管理页面。可以选择“创建API Key”,注意保存此API Key,建议保存在本地以便后续使用。

在这里插入图片描述

复制及保存OpenAI SDK信息

我们可以查看DeepSeek-R1-0528的使用说明,只需要点击“调用说明”选项。

在这里插入图片描述

调用说明如下所示,我们将DeepSeek-R1-0528服务的OpenAI SDK相关文件复制,保存在本地文本文件或本地笔记中。

在这里插入图片描述

五、AnythingLLM基本配置工作

设置系统语言

点击界面左下角的设置图标,进入系统设置界面。

在这里插入图片描述

在外观——系统偏好——显示语言中,选择显示 AnythingLLM 界面所用的语言设置为Chinese。

在这里插入图片描述

配置AI提供商

🔐 LLM 首选项配置说明

LLM 首选项用于设置你所使用的 大语言模型(LLM)聊天服务与嵌入服务 的提供商凭据和相关参数。为确保 AnythingLLM 能够正常运行,请务必保证所填写的 API 密钥是最新的且准确无误。错误或过期的密钥将导致模型无法调用。

📘 建议参考以下配置信息进行设置,以确保服务顺利连接与运行。

  • LLM提供商:Generic OpenAI(通过自定义配置连接任何兼容 OpenAI API 的服务)
  • Base URL: https://api.modelarts-maas.com
  • API Key: 填写刚才保存的API Key
  • Chat Model Name: deepseek-r1-250528
  • Token context window: 2048 (模型能够处理的输入文本(包括对话历史和当前输入)的最大长度为 2048 个 token,超出此限制的部分将被截断。)
  • Max Tokens: 1024 (模型每次回复时最多生成 1024 个 token 的内容,这决定了输出响应的最大长度。

在这里插入图片描述

新建工作区

在AnythingLLM的主界面中,点击【新工作区】选项。

在这里插入图片描述

填写工作区名称,这里就填写为测试工作区,点击“保存”。

在这里插入图片描述

测试对话

我们先开始在对话框中寻味“你是谁”,AnythingLLM经过深度思考并给出回答。

在这里插入图片描述

六、使用体验

在本次基于 华为云 ModelArts Studio 搭建 AnythingLLM AI 聊天助手 的实践中,我深刻感受到华为云平台在 AI 工程化落地方面的强大能力。ModelArts Studio 提供了一站式的模型部署、服务管理与接口调试功能,极大简化了 AnythingLLM 的本地大模型运行环境搭建过程。无论是资源配置、容器管理还是公网访问设置,操作都直观高效,即使是初次接触 AI 部署的开发者也能快速上手。更令人印象深刻的是其出色的资源调度能力和稳定的运行表现,即使面对高并发请求,系统依然保持低延迟响应,充分展现了华为云 Flexus 弹性算力和 ModelArts Studio 服务的强大性能。

七、实践总结


🎯 实践总结

在本次基于 华为云 ModelArts Studio 搭建 AnythingLLM AI 聊天助手 的实践中,我深刻体会到华为云在 AI 开发领域的强大支撑能力。ModelArts Studio 提供了从模型部署、服务管理到 API 接口调用的一站式解决方案,极大地简化了本地大语言模型的部署流程。整个过程无需复杂配置,即可快速构建一个稳定、高效的 AI 助手运行环境,真正实现了“开箱即用”的智能开发体验。

⚡ 为什么选择华为云 ModelArts Studio?

  • 高效部署:一键部署 AnythingLLM,支持多种模型接入,操作流畅无卡顿
  • 🔧 灵活配置:资源弹性伸缩,适配不同规模的 AI 应用场景
  • 📊 可视化监控:实时查看服务状态与资源使用情况,运维更轻松
  • ☁️ 云原生架构:依托华为云 Flexus 弹性算力,保障高并发下的稳定响应
  • 🌐 公网访问便捷:内网穿透配置简单,快速对外提供服务

华为云 ModelArts Studio 不仅降低了 AI 开发的技术门槛,更为开发者提供了强大的工具支持与稳定的运行环境。无论是个人学习、团队协作,还是企业级应用落地,它都是值得信赖的选择!


http://www.xdnf.cn/news/13549.html

相关文章:

  • 支持在Windows电脑上使用的备忘录提醒小软件
  • 【大模型训练】中短序列attention 和MOE层并行方式
  • Java八股文——Spring「SpringBoot 篇」
  • 工业相机如何提高传输速度
  • 【从入门到精通】GIS数据制备,空间分析与高级建模实践应用
  • MySQL主从配置详细指南
  • leetcode 135. 分发糖果
  • 大模型Transformer触顶带来的“热潮退去”,稀疏注意力架构创新或是未来
  • HarmonyOSNext全栈数据存储双星解析:轻量级VS关系型存储终极指南
  • Linux 复制文件到另一个文件夹方法
  • 鹰盾视频加密器播放器Win32系统播放器兼容开发的技术要点与实践指南
  • [Linux入门] Linux安装及管理程序入门指南
  • VUE2个人博客系统
  • 禁止 Windows 更新后自动重启
  • 【鸿蒙表格组件】鸿蒙ArkTS轻量级表格高效渲染组件
  • Android Compose 自定义圆形取色盘
  • vscode 保存 js 时会自动格式化,取消设置也不好使
  • 运维之十个问题--2
  • ​​P值在双侧检验中的计算方法
  • 企业常见流量异常有哪些?
  • Cambridge Pixel为警用反无人机系统(C-UAS)提供软件支持
  • Vue2数组响应式问题:Object.defineProperty不能监听数组吗
  • ES Modules 与 CommonJS 的核心区别详解
  • python的时间管理库whenever的使用
  • Office2019下载安装教程(2025最新永久方法)(附安装包)
  • 【Vue】组件及组件化, 组件生命周期
  • 【AI大模型入门指南】概念与专有名词详解 (二)
  • CSP-J 2020 入门级 第一轮 阅读程序(1)
  • 【Zephyr 系列 19】打造 BLE 模块完整 SDK:AT 命令系统 + 状态机 + NVS + OTA 一体化构建
  • 华为云Flexus+DeepSeek征文 | 基于Dify构建多语言文件翻译工作流