当前位置: 首页 > ai >正文

【LangChain4J】LangChain4J 第三弹:多模态与文生图的实现

目录

一、文生图

1.1 基于通义万相实现文生图

1.2 基于智普实现文生图

二、多模态

2.1 使用场景

2.2 技术实现

2.3 多模态的实现(读取网络图片)

2.4 实现多模态(读取本地文件)


一、文生图

文生图 是多模态任务的一种具体形式,指通过文本描述生成对应图像的技术。其核心目标是将人类语言的抽象语义转化为视觉具象,广泛应用于创意设计、游戏开发、虚拟内容生成等领域。

1.1 基于通义万相实现文生图

1. 配置通义万相

@Configuration
public class ImageModelConfig {@Beanpublic ImageModel wanxImageModel() {return WanxImageModel.builder()// 生产级别配置到 Nacos.apiKey(System.getenv("ALIYUN-AK")).modelName("wanx2.1-t2i-plus").build();}
}

提供的模型列表如下:

  • wanx2.1-t2i-plus:生成图像细节更丰富,速度较慢。对应通义万相官网 2.1 专业模型。生成费用 0.20元/张。

  • wanx2.1-t2i-turbo:生成速度快、效果全面、性价比高。对应通义万相官网2.1极速模型。生成费用 0.14元/张。

  • wanx2.0-t2i-turbo:擅长质感人像,速度中等、成本较低。对应通义万相官网 2.0 极速模型。生成费用 0.04元/张。

2. 编写调用代码

import dev.langchain4j.model.image.ImageModel;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;@RestController
@RequestMapping("/img")
public class ImageController {@Autowiredprivate ImageModel wanxImageModel;@RequestMapping("/gen")public String gen(@RequestParam("msg") String msg) {String url = wanxImageModel.generate(msg).content().url().toString();System.out.println(url);return url;}
}

http://www.xdnf.cn/news/12813.html

相关文章:

  • leetcode_56 合并区间
  • el-table的select回显问题
  • 图解JavaScript原型:原型链及其分析 | JavaScript图解
  • Alight Motion汉化版:视频剪辑,轻松上手
  • odoo17 反常下表引用上表并能修改
  • 在数字工厂实施过程中,如何学会通过梳理流程的思想来分析解决问题
  • 2014-2023年 最新绿色债券数据
  • 大数据CSV导入MySQL
  • word操作(持续更新)
  • 从菜鸟到骑士:TypeScript 基础修炼手册
  • 磁盘空间清道夫FolderSize 系列:可视化分析 + 重复文件识别,
  • 设备健康管理的范式革命:中讯烛龙全链路智能守护系统
  • QTreeWidget 应用场景与用法详解
  • 华为OD机试-食堂供餐-二分法
  • 408第一季 - 数据结构 - 图II
  • MS8551/MS8552/MS8554 单电源、轨到轨输入输出、高精度运放,可替代AD8551/AD8552/AD8554
  • Android 大文件分块上传实战:突破表单数据限制的完整方案
  • 把二级域名绑定的wordpress网站的指定页面
  • 【论文阅读28】-CNN-BiLSTM-Attention-(2024)
  • UML用例模型与用例图
  • 【RK3588嵌入式图形编程】-Cairo- 变换、旋转、缩放、剪切
  • C++基础进阶:函数、内联函数与Lambda函数详解
  • 开源项目实战学习之YOLO11:12.8 ultralytics-models-utils.py
  • 分布式锁实战:Redisson vs. Redis 原生指令的性能对比
  • 论文MR-SVD
  • [嵌入式AI从0开始到入土]18_Ascend C算子开发环境(S5赛季)
  • 大模型在蛛网膜下腔出血预测与诊疗方案制定中的应用研究
  • 从零开始学Flink:揭开实时计算的神秘面纱
  • jieba实现和用RNN实现中文分词的区别
  • Git配置代理