当前位置: 首页 > news >正文

AI之FastAPI+ollama调用嵌入模型OllamaBgeEmbeddings

以下是对该 FastAPI 代码的逐行解析和详细说明:


代码结构概览

from fastapi import Depends  # 导入依赖注入模块def get_embedder():return OllamaBgeEmbeddings(base_url="http://ollama-cluster:11434",timeout=30,max_retries=5)@app.post("/embed")
async def embed_text(text: str,embedder: OllamaBgeEmbeddings = Depends(get_embedder)
):return {"embedding": embedder.embed_query(text)}

逐行代码解析

1. 依赖项定义
def get_embedder():return OllamaBgeEmbeddings(base_url="http://ollama-cluster:11434",timeout=30,max_retries=5)
  • 功能:创建并返回一个 OllamaBgeEmbeddings 实例
  • 关键参数
    • base_url:Ollama 服务集群地址(可以是负载均衡器地址)
    • timeout=30:请求超时时间(秒)
    • max_retries=5:失败请求最大重试次数
  • 设计意图
    将嵌入器的初始化逻辑封装为可复用的依赖项,实现配置集中管理

2. 路由定义
@app.post("/embed")
async def embed_text(text: str,embedder: OllamaBgeEmbeddings = Depends(get_embedder)
http://www.xdnf.cn/news/133309.html

相关文章:

  • SQL笛卡尔积运用-为每个用户初始化数据
  • [Windows] 卡巴斯基Kaspersky 21.21.7.384 免费版
  • 基于Axure的动态甘特图设计:实现任务增删改与时间拖拽交互
  • 打工人必看:Word中姓名对齐的高效方法
  • 计算器(WEB)
  • PWNOS:2.0(vulnhub靶机)
  • Java知识日常巩固(五)
  • 在GNS3中安装Kali Linux
  • 【深度好文】2、深入浅出 Milvus 数据库管理:从创建到删除的完整指南
  • spark-standalone模式
  • 设置Rocky Linux盒盖不休眠的3个简单步骤
  • 常见的几种分块策略,每种策略都有适用场景和优缺点
  • 题目 3320: 蓝桥杯2025年第十六届省赛真题-产值调整
  • 【爬虫】DrissionPage-获取douyim用户下的视频
  • 论文阅读:2024 NeurIPS Group Robust Preference Optimization in Reward-free RLHF
  • 幻读是什么项目中是怎么保证不会出现幻读
  • 高级电影感户外街拍人像摄影后期Lr调色教程,手机滤镜PS+Lightroom预设下载!
  • Gartner魔力象限(Gartner Magic Quadrant)
  • 你怎么通过postman或者fidder或者JMeter来获取到token,然后后面的请求怎么使用token
  • 银行网点款箱交接权限认证开锁与密钥时效双重监控
  • AI超级智能体教程(三)---程序调用AI大模型的四种方式(SpringAI+LangChain4j+SDK+HTTP)
  • 电子设备的“记忆大脑”:NAND、NOR、EEPROM谁在掌控你的数据?
  • 一文带你了解单例模式及其逐步优化~
  • 【差分隐私】假设检验的视角(高斯差分隐私)
  • 07 Python 字符串全解析
  • 基于LAB颜色空间的增强型颜色迁移算法
  • [Mybatis-plus]
  • IEEE期刊目录重磅更新!共242本期刊被收录!
  • ubuntu22.04部署Snipe-IT
  • C++初登门槛