当前位置: 首页 > java >正文

【Qwen2.5-VL 踩坑记录】本地 + 海外账号和国内账号的 API 调用区别(阿里云百炼平台)

API 调用

  1. 阿里云百炼平台的海内外 API 的区别:
    • 海外版:需要进行 API 基础 URL 设置
    • 国内版:无需设置。

本人的服务器在香港,采用海外版的 API 时,需要进行如下API端点配置 / API基础URL设置 / API客户端配置(API Client Configuration)

# 对于海外账号(包括香港)开通的 api key 都需要
dashscope.base_http_api_url = 'https://dashscope-intl.aliyuncs.com/api/v1'

这行代码在调用通义千问API之前,设置了API的基础URL。这个URL是阿里云提供的国际版通义千问API的端点地址。

技术上讲,这涉及到几个概念:

  1. API端点(API Endpoint):API服务器的URL地址,客户端通过此地址访问服务

  2. 基础URL(Base URL):API的根路径,所有API请求都会基于这个URL构建

  3. REST API配置:配置RESTful API客户端的地址和行为

在使用不同API密钥时遇到问题,可能是因为:

  1. API密钥与特定区域或端点绑定(例如,一个密钥可能只能用于中国区,另一个只能用于国际区)

  2. 需要根据不同的API密钥使用不同的端点URL(例如,国内版和国际版)

本地推理

  1. Qwen2.5-72b-instruct 的本地推理占用的 GPU memory 需求非常高(torch.float32的话好像需要 100G+)

出现 Floating point exception(核心已转储) 问题:

  • torch.bfloat16 改为 torch_dtype=torch.float16 后该问题依然存在。
  • torch.bfloat16 改为 torch_dtype=torch.float32 后该问题消失,但一直存在 OOM 的问题。
http://www.xdnf.cn/news/1370.html

相关文章:

  • 学习记录:DAY16
  • 2.RabbitMQ - 入门
  • 从入门到精通:CMakeLists.txt 完全指南
  • AI语音助手自定义角色百度大模型 【全新AI开发套件掌上AI+4w字教程+零基础上手】
  • 永磁同步电机控制算法-反馈线性化控制
  • 官方不存在tomcat10-maven-plugin插件
  • 【模板匹配】图像处理(OpenCV)-part10
  • 【金仓数据库征文】从Oracle到KingbaseES的语法兼容与迁移
  • 常用第三方库精讲:cached_network_image图片加载优化
  • Chrome/Edge浏览器使用多屏完美解决方案,http部署使用https部署的功能
  • 互联网金融岗位简历模板
  • 3.第三章:数据治理的战略价值
  • 【人工智能】Ollama 负载均衡革命:多用户大模型服务的高效调度与优化
  • Vue3父子组件数据同步方法
  • gbase8s存储学习一 rootdbs存储结构以及寻址分析
  • 08-IDEA企业开发工具-集成AI插件通义灵码
  • Java—— 正则表达式 练习
  • 代理模式:控制对象访问的中间层设计
  • C#学习1_认识项目/程序结构
  • 【无标题】spark安装部署
  • TCP 协议:原理、机制与应用
  • cursor改Goland操作习惯
  • 密码学(1)LWE,RLWE,MLWE的区别和联系
  • 校园外卖服务系统的设计与实现(代码+数据库+LW)
  • Transformer起源-Attention Is All You Need
  • 考研系列-计算机组成原理第一章:计算机系统概述
  • 【论文精读】Reformer:高效Transformer如何突破长序列处理瓶颈?
  • 23种设计模式-结构型模式之组合模式(Java版本)
  • Netty的心跳机制怎么实现的?
  • uniapp返回上一页接口数据更新了,页面未更新