当前位置: 首页 > ds >正文

python调用硅基流动的视觉语言模型

参考: https://docs.siliconflow.cn/cn/userguide/capabilities/vision   

import base64
import json
from openai import OpenAI
from PIL import Image
import io# 初始化OpenAI客户端
client = OpenAI(api_key="sk-**********",  # 替换为实际API密钥base_url="https://api.siliconflow.cn/v1"
)def convert_image_to_webp_base64(input_image_path: str) -> str:"""将本地图片转换为WebP格式的Base64字符串"""try:with Image.open(input_image_path) as img:# 转换为WebP格式(优化大小)byte_arr = io.BytesIO()img.save(byte_arr, format='WEBP', quality=85)  # 调整质量平衡大小和清晰度byte_arr = byte_arr.getvalue()return base64.b64encode(byte_arr).decode('utf-8')except Exception as e:print(f"图片转换错误: {e}")return None# 1. 转换本地图片
input_image_path = "7125e2e3.jpeg"  # 替换为实际图片路径
base64_image = convert_image_to_webp_base64(input_image_path)if not base64_image:print("图片转换失败,请检查路径和格式")exit()# 2. 创建流式请求
response = client.chat.completions.create(model="Qwen/Qwen2.5-VL-72B-Instruct",messages=[{"role": "user","content": [{"type": "image_url","image_url": {"url": f"data:image/webp;base64,{base64_image}",  # 指定WebP格式"detail": "high"  # 平衡速度与精度}},{"type": "text","text": "使用ocr识别图片内容并输出"  # 替换为你的提示词}]}],stream=True,max_tokens=1000  # 控制响应长度
)# 3. 流式处理响应
print("模型响应:")
full_response = ""
for chunk in response:if chunk.choices[0].delta.content:text_chunk = chunk.choices[0].delta.contentprint(text_chunk, end='', flush=True)full_response += text_chunkprint("\n\n完整响应已接收")

http://www.xdnf.cn/news/10929.html

相关文章:

  • 自然语言处理(NLP)的系统学习路径规划
  • HarmonyOS运动开发:精准估算室内运动的距离、速度与步幅
  • docker中组合这几个命令来排查 import 模块失败 的问题
  • 数字商城小程序源码,开启便捷电商新体验
  • 【论文笔记】High-Resolution Representations for Labeling Pixels and Regions
  • RAG入门 - Reader(2)
  • 定时器:中央对齐模式剖析
  • Neovim - 打造一款属于自己的编辑器(一)
  • 第二章支线六 ·CSS幻纹术:背景、遮罩与视觉层级
  • 实验设计与分析(第6版,Montgomery著,傅珏生译) 第10章拟合回归模型10.9节思考题10.12 R语言解题
  • 大模型分布式训练笔记(基于accelerate+deepspeed分布式训练解决方案)
  • 互联网大厂Java求职面试:AI大模型与云原生技术的深度融合
  • Java面试八股--06-Linux篇
  • Linux或者Windows下PHP版本查看方法总结
  • 【C++项目】负载均衡在线OJ系统-1
  • 关于easyx头文件
  • 大模型备案、登记和算法备案主要区别总结
  • 升级:用vue canvas画一个能源监测设备和设备的关系监测图!
  • 【AI教我写网站-ECG datacenter】
  • Cookie 和 Session:Web 身份验证的核心机制
  • ArcGIS Pro 3.4 二次开发 - 地图创作 1
  • 解决 Ubuntu 20.04 虚拟机中 catkin_make 编译卡死问题
  • 06 APP 自动化- H5 元素定位
  • hive聚合函数多行合并
  • 纯色图片生成器
  • ARP (Address Resolution Protocol,地址解析协议)将IP地址解析为物理地址(MAC地址)
  • 缩量和放量指的是什么?
  • 默认网关 -- 负责转发数据包到其他网络的设备(通常是路由器)
  • websocket协议
  • 线性回归用于分类