当前位置: 首页 > ai >正文

本地运行qwen3:30b-a3b速度测试

仍然使用的是ollama,运行的Q4_K_M量化版。
这个模型在相同硬件环境下对比我电脑上其他32b的模型速度(小于3 tokens/s)提升非常明显,并且可以设置是否打开思考模式。

注意: /no_think前有个空格

非思考模式:
在这里插入图片描述
思考模式:在这里插入图片描述

http://www.xdnf.cn/news/4265.html

相关文章:

  • Python Cookbook-7.3 在 Pickling 的时候压缩
  • transformer➕lstm训练回归模型
  • 行业赋能 | 电商平台API对接,订单信息自动抓取
  • 密码工具类-生成随机密码校验密码强度是否满足要求
  • 使用阿里AI的API接口实现图片内容提取功能
  • Jackson中的ObjectNode与JsonNode详解
  • 探索Hello Robot开源移动操作机器人Stretch 3的技术亮点与市场定位
  • 快速学会Linux的WEB服务
  • 基于STM32、HAL库的NS2009 触摸屏控制器驱动程序设计
  • 25_05_02Linux架构篇、第1章_03安装部署nginx
  • 力扣面试150题--对称二叉树
  • Twin Builder 中的电池等效电路模型仿真
  • 各国健康指标数据查询
  • 未来设计新篇章!2025 年 UX/UI 设计趋势,技术与体验的全新结合!
  • MySQL - 事务
  • 基于Dify的工作流实现python编码规则的检查
  • 【神经网络、Transformer及模型微调】
  • 六足机器人结构优化可载重20kg,适应河床、冰面等复杂地形
  • 【C语言】--指针超详解(一)
  • 对接印度股票数据实战 - Python实现完整指南
  • 结构体内存对齐规则与优化
  • iPaaS核心解析与牧场场景应用方案
  • 前端正则学习记录
  • 2025Mapbox零基础入门教程(8)geojson加载点要素
  • MySQL数据库中篇
  • python简易实现勒索病毒
  • 最小方差自校正调节器设计
  • Python: pipx详细解释
  • 【Day 20】HarmonyOS多语言适配开发实战
  • 使用OpenCV 和 Dlib 实现年龄性别预测