当前位置: 首页 > backend >正文

ollama调用千问2.5-vl视频图片UI界面小程序分享

1、问题描述:

ollama调用千问2.5-vl视频图片内容,通常用命令行工具不方便,于是做了一个python UI界面与大家分享。需要提前安装ollama,并下载千问qwen2.5vl:7b 模型,在ollama官网即可下载。 (8G-6G 显卡可用),用于识别图片信息。之前还下载了 qwen3:8b版,发现也可以此程序调用,比图片识别更快,用qwen3:8b文字直接提问,随便输入张图片即可。图片不起作用。 不知为何qwen2.5vl:7b 默认只支持cpu预处理图片,所以,图片推理的过程非常慢。qwen3:8b 默认支持gpu,速度快100倍,反应迅速,机会秒回复。这就是gpu 与cpu,推理的天壤之别吧,哈哈。南无阿弥陀佛。

如下图:
在这里插入图片描述
使用方法:很简单,

2、图片推理:

模型管理列表栏,选择相应的qwen2.5vl:7b模型,点击选择模型按钮,之后,直接在最下面,点击选择图片按钮,支持三张,太多图片推理太慢了。单张最快,cpu推理就是这样,之后,在提示词栏,输入要对图片做的推理要求,默认是描述图片内容,也可以问图片里的特殊的人事物,等等。也可以指定要求推理输出的文字字数,1000字以内没啥问题。
在这里插入图片描述

3、文字推理:

同理,在模型管理列表栏,选择相应的qwen3:8b模型,点击选择模型按钮,之后,直接在最下面,点击选择图片按钮,随便选张图,如果之前已经选了,就忽略此步。之后,在提示词栏,输入要提问的提示词即可,几千字以内似乎没啥问题。南无阿弥陀佛。

4、程序免费下载地址:

程序下载地址:https://download.csdn.net/download/tian0000hai/90856287
南无阿弥陀佛。

http://www.xdnf.cn/news/7214.html

相关文章:

  • 数据库中的锁机制
  • 电子数据取证(数字取证)技术全面指南:从基础到实践
  • c++线段树之单点修改区间最大子段和-----P4513 小白逛公园
  • 仿腾讯会议——房间界面用户设置
  • SRIO(Serial RapidIO)握手流程
  • 校园网--tarjan求缩点的两个经典问题
  • 《Python星球日记》 第90天:微调的概念以及如何微调大模型?
  • CCpro工程编程软件
  • 二:操作系统之进程的创建与终止
  • CVE-2018-1273源码分析与漏洞复现
  • 76.有符号数累加运算
  • c++进阶——位图、布隆过滤器
  • 菜鸟之路Day32一一多表查询,事物,索引
  • 【Linux网络】五种IO模型与阻塞IO
  • 多模态信息提取:打通数据价值的“最后一公里”
  • Linux进程信号(二)之信号产生1
  • 【Linux】第二十章 管理基本存储
  • Redis进阶知识
  • 数据库blog2_数据结构与效率
  • 选择之困:如何挑选合适的 Python 环境与工具——以 Google Colaboratory 为例
  • 0-1背包问题(求最优值和构造最优解)
  • 苍穹外卖--修改菜品
  • C++中的四种强制转换
  • web中路径问题
  • Leetcode134加油站
  • u深度学习 神经网络图像数据的预处理全解
  • RDD-数据清洗
  • 02 Nginx虚拟主机
  • 【Linux】第十七章 归档和传输文件
  • 为什么el-select组件在下拉选择后无法赋值