当前位置: 首页 > news >正文

大模型的第一天学习-LM studio的安装和本地大模型搭建

大模型的第一天学习-LM studio的安装和本地大模型搭建

    • 一、下载安装,加载模型
    • 二、使用本地服务器
    • 三、模型参数的学习
    • 四、一些必要的知识

一、下载安装,加载模型

  1. 直接在官网下载lm studio
  2. 将下载模型加载进来。可以通过hugging face下载模型,也可以直接拷贝。或者直接搜索“发现”

二、使用本地服务器

因为我对python和post链接熟悉一点,就打算使用python去链接lm studio来使用大模型,来实现本地化。

  1. 在“开发者”启动允许本地链接,并得到端口数据
  2. 在cmd钟输入ipconfig,得到ipv4地址
  3. 得到链接地址:http://localhost:1234/v1/chat/completions

在这里插入图片描述

下面是代码,要填入正确的ipv4和端口。( “top_k”: 10,“temperature”:0.9,。。。“max_tokens”: 30000,这些连七八糟的模型参数现在可以不加,不影响使用,以后慢慢来。。。)

import requests
url = "http://1.1.1.11:1234/v1/chat/completions"
data = {"model":"deepseek-r1-distill-llama-8b","messages": [{"role": "system", "content": "你是一个专业的助手。"},{"role": "user", "content": f"""
对于email信息,可以按以下分类方法进行分类:类型:<会议通知><信息知会><待办事宜><问询>紧急程度:<紧急><优先><普通>
分级方法:
如果包括手机等个人信息,为4级,否则为1级。
以下是两份email,请进行分类分级:
张三:
昨天下午,2378号项目出现现场故障,针对此问题,我们将于今天下午两点在3号会议室开会讨论请按时参加。有关项目的信息,可以与李四联系,联系电话13912345678"""}]
}try:# 发送 POST 请求(无数据)response = requests.post(url,json=data)# 打印响应状态码和内容print("Status Code:", response.status_code)print("Response Body:", response.text)except requests.exceptions.ConnectionError as e:print("连接失败,请确认:")print("- 目标服务器是否运行中")print("- 端口是否正确")print("- IP 地址是否正确")

三、模型参数的学习

  1. top_k (候选单词的个数)只有排名前k的词会被考虑
  2. top_p (概率)从模型的概率分布中抽样时,只会考虑累积概率达到top_p的那些词
  3. temperature 控制生成文本的随机性
  4. max_tokens 设置生成文本的最大长度
  5. frequency_penalty 正值减少高频词的出现
  6. presence_penalty 正值会惩罚重复出现的话题,鼓励探索新的主题

四、一些必要的知识

自回归生成:大语言模型是通过重复生成token序列(sequence)中的下一个token来运作的。每次模型想要生成另一个token时,会重新阅读整个token序列并预测接下来应该出现的token。

http://www.xdnf.cn/news/251119.html

相关文章:

  • 从0开始建立Github个人博客(hugoPaperMod)
  • 见多识广4:Buffer与Cache,神经网络加速器的Buffer
  • A2A Python 教程 - 综合指南
  • 体系结构论文(八十二):A Comprehensive Analysis of Transient Errors on Systolic Arrays
  • 目标检测中的损失函数(三) | SIoU WIoUv1 WIoUv2 WIoUv3
  • 【计算机视觉】三维视觉:Open3D:现代三维数据处理的全栈解决方案
  • [Verilog]跨时钟域数据传输解决方案
  • 【Linux】Petalinux U-Boot
  • 普通IT的股票交易成长史--20250502 突破(1)
  • 虚拟局域网(VLAN)实验(Cisco Packet Tracer)-路由器、交换机的基本配置
  • 2000-2022年上市公司数字经济专利申请数据
  • 使用Vite创建vue3项目
  • linux下抓包工具--tcpdump介绍
  • 2025年- H20-Lc128-240. 搜索二维矩阵 II(矩阵)---java版
  • C++ 动态内存管理
  • 【现代深度学习技术】现代循环神经网络03:深度循环神经网络
  • 通信协议记录仪-产品规格书
  • PostgreSQL常用函数
  • jdk8之后都有什么优化单例的方式
  • C++之IO流
  • 如何让模型聪明地选择特征:一种“蒸馏及选择”的方法
  • Seata客户端代理增强核心源码解析
  • Laravel 12 实现 OAuth2 登录
  • 鼎讯信通 智能通信干扰设备:多频段多模态信号压制解决方案
  • 【C++11】智能指针
  • 【学习笔记】机器学习(Machine Learning) | 第五章(2)| 分类与逻辑回归
  • 第 12 届蓝桥杯 C++ 青少组中 / 高级组省赛 2021 年真题
  • Python3 基本数据类型
  • Python 常用内置函数详解(八):对象属性操作getattr()、setattr()、delattr()、hasattr()、vars()函数详解
  • 【经管数据】上市公司企业资本要素和劳动要素投入数据(2000-2022年)