当前位置: 首页 > java >正文

Ollama平替!LM Studio本地大模型调用实战

本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!

  • 🚀 魔都架构师 | 全网30W技术追随者
  • 🔧 大厂分布式系统/数据中台实战专家
  • 🏆 主导交易系统百万级流量调优 & 车联网平台架构
  • 🧠 AIGC应用开发先行者 | 区块链落地实践者
  • 🌍 以技术驱动创新,我们的征途是改变世界!
  • 👉 实战干货:编程严选网

0 前言

可像 Ollama 通过暴露本地端口,实现本地客户端调用。

1 选择模型

在 LM Studio 的 “开发者” 选项卡中选择模型:

2 端口暴露

设置暴露的端口(默认1234):

启用 CORS 后,可对接网页应用或其他客户端工具。

3 启动服务

点击状态选项卡:

控制台会显示运行日志和访问地址:

4 快速上手

4.1 快速ping

列出已加载并就绪的模型:

curl http://127.0.0.1:1234/v1/models/

这也是验证服务器是否可访问的一种有效方法!

4.2 聊天

这是一个类似调用OpenAI的操作,通过curl工具访问/v1/chat/completion端点:

  • 在Mac或Linux系统,可用任意终端运行
  • Windows系统用Git Bash
curl http://127.0.0.1:1234/v1/chat/completions \-H "Content-Type: application/json" \-d '{"model": "llama-4-maverick-17b-128e-instruct","messages": [ { "role": "system", "content": "Always answer in rhymes." },{ "role": "user", "content": "Introduce yourself." }], "temperature": 0.7, "max_tokens": -1,"stream": true}'

该调用是“无状态的”,即服务器不会保留对话历史记录。调用方有责任在每次调用时提供完整的对话历史记录。

流式传输 V.S 累积完整响应

注意"stream": true(流式传输:开启)参数:

  • true(开启)时,LM Studio会在预测出标记(token)的同时将其逐一流式返回
  • 如将此参数设置为false(关闭),在调用返回之前,完整的预测结果会被先累积起来。对于较长的内容生成或者运行速度较慢的模型,这可能需要花费一些时间!
http://www.xdnf.cn/news/2226.html

相关文章:

  • 509. 斐波那契数
  • 集合及相关
  • 什么是 Swagger 以及如何在 Spring Boot 中实现 Swagger:配置与实践指南
  • 【黑马JavaWeb+AI知识梳理】前端Web基础01 - HTML+CSS
  • 【leetcode100】单词拆分
  • C++:位图
  • 【Charles】抓包工具安装配置unknown问题解决
  • 《人件》第三章 正确的人
  • 在Windows11中配置Git+SSH环境,本此实践使用Gitee(码云),方法同样适用于其它绝大部分Git服务
  • Linux-进程控制
  • 安服实习面试面经总结(也适合hvv蓝初)
  • Linux渗透测试
  • x修改ssh版本号9.9可以躲过漏洞扫描器扫描
  • JAVA---字符串
  • 通过门店销售明细表用SQL得到每月每个门店的销冠和按月的同比环比数据
  • 可视化性能分析工具火焰图
  • function,bind,lambda的用法
  • Claude系列模型-20250426
  • Android12源码编译及刷机
  • JavaWeb——案例(14/x)- 文件上传-阿里云OSS-准备(阿里云 OSS 简介、使用阿里云 OSS 的流程、关键准备工作)
  • 【含文档+PPT+源码】基于Django框架的乡村绿色农产品交易平台的设计与实现
  • DeepSeek预训练追求极致的训练效率的做法
  • 【分布式系统中的“瑞士军刀”_ Zookeeper】二、Zookeeper 核心功能深度剖析与技术实现细节
  • 818协议知识笔记
  • ShaderToy学习笔记 03.多个形状和旋转
  • DHCP配置文件详解
  • 解决conda虚拟环境安装包却依旧安装到base环境下
  • AEB法规升级后的市场预测与分析:技术迭代、政策驱动与产业变革
  • 链接文件及功能安全:英飞凌官方文档摘录 - 基于Tasking与AURIX TC3xx MCAL中Link文件解析以及代码变量定位方法详解
  • C++学习:六个月从基础到就业——STL:分配器与设计原理