当前位置: 首页 > ds >正文

SpringAI Alibaba实战文生图

1️⃣  前置准备:搭建开发环境与服务配置🚀

🔧 1.1 环境要求

        JDK 17+(推荐 JDK 21)、Spring Boot 3.x+(本案例使用 3.3.4)、阿里云百炼大模型服务 API Key。需在阿里云控制台完成服务开通并获取有效 API Key,用于后续身份验证。

 

🛠️ 1.2 Maven 依赖配置

        pom.xml中添加 Spring Boot Web 依赖、Spring AI Alibaba Starter,并配置 Spring Milestone 仓库以获取最新组件:

<parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>3.3.4</version>
</parent>
<dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><dependency><groupId>com.alibaba.cloud.ai</groupId><artifactId>spring-ai-alibaba-starter-dashscope</artifactId><version>1.0.0.1</version></dependency>
</dependencies><repositories><repository><id>spring-milestones</id><name>Spring Milestones</name><url>https://repo.spring.io/milestone</url><snapshots><enabled>false</enabled></snapshots></repository>
</repositories>

🔑 1.3 配置文件设置

        在application.yml中配置服务端口及阿里云 API Key:

server:port: 8080spring:ai:dashscope:api-key: "sk-xxx API_KEY"

 

2️⃣ 核心功能实现:基于 Spring AI 的文生图接口设计🎨

🖼️ 2.1  单图生成:获取图片 URL

接口设计

  GET /dashscope/image/generateImage,通过固定提示词 “为努力学习的自己生成一张励志海报” 调用模型,返回生成图片的 URL。

代码逻辑

        使用ImageModel注入模型实例,构造ImagePrompt并调用call()方法,校验返回的 URL 有效性后封装至响应体。若 URL 为空,抛出运行时异常提示生成失败。

example:

    /*** 返回生成图片URL* @return*/@GetMapping("/generateImage")public BaseResponse<String> generateImage() {ImagePrompt prompt = new ImagePrompt(PROMOTE);ImageResponse imageResponse = imageModel.call(prompt);String imageUrl = imageResponse.getResult().getOutput().getUrl();if (StrUtil.isEmpty(imageUrl)) {throw new RuntimeException("Image generation timeout or failed");}return ResultUtils.success(imageUrl);}

 

🖼️2.2  图片显示:流式传输图片内容

接口设计

   GET /dashscope/image,直接将生成的图片以流形式返回给客户端,支持浏览器直接渲染。

代码逻辑

        通过模型调用获取图片 URL 后,使用URLInputStream读取远程图片流,设置响应头为IMAGE_PNG_VALUE,将字节流写入HttpServletResponse。捕获 IO 异常并返回 500 状态码,确保错误处理的健壮性。

example:

    /*** 返回显示图片* @param response*/@GetMapping("/image")public void image(HttpServletResponse response) {ImagePrompt imagePrompt = new ImagePrompt(PROMOTE);ImageResponse imageResponse = imageModel.call(imagePrompt);String imageUrl = imageResponse.getResult().getOutput().getUrl();try {URL url = URI.create(imageUrl).toURL();InputStream in = url.openStream();response.setHeader("Content-Type", MediaType.IMAGE_PNG_VALUE);response.getOutputStream().write(in.readAllBytes());response.getOutputStream().flush();} catch (IOException e) {response.setStatus(HttpServletResponse.SC_INTERNAL_SERVER_ERROR);}}

 

🖼️2.3  多图生成:批量生成图片集合

接口设计

  POST /dashscope/image/generate/multiImage,接收包含提示词和图片数量的请求体,支持生成 1-10 张图片。

代码逻辑

        校验输入参数合法性(图片数量范围、提示词非空),通过ImageOptionsBuilder构建批量生成选项,构造带选项的ImagePrompt。调用模型后解析ImageResponse,提取所有结果的 URL 并以集合形式返回,满足批量生成需求。

 /*** 返回生成多张图片URL* @param imageRequest* @return*/@PostMapping("/generate/multiImage")public BaseResponse<Set<String>> generateMultiImage(@RequestBody ImageRequest imageRequest) {String imagePrompt = imageRequest.getImagePrompt();int imageCount = imageRequest.getImageCount();if (imageCount < 1 || imageCount > 10) {throw new BusinessException(ErrorCode.PARAMS_ERROR);}if (imagePrompt != null && StrUtil.isBlank(imagePrompt)) {throw new BusinessException(ErrorCode.PARAMS_ERROR,  "请输入图片描述提示词");}ImageOptions imageOptions = ImageOptionsBuilder.builder().N(imageCount).build();
//       # ImagePrompt 传递参数是 -- String 类型和 -- ImageOptions 类型ImagePrompt result = new ImagePrompt(imagePrompt, imageOptions);ImageResponse imageResponse = imageModel.call(result);Set<String> collect = imageResponse.getResults().stream().map(res -> res.getOutput().getUrl()).collect(Collectors.toSet());return ResultUtils.success(collect);}

3️⃣ 总结 📝

        Spring AI 提供的ImageModel抽象层简化了与阿里云百炼模型的交互,通过统一接口实现不同 AI 服务的无缝切换,适合快速落地文生图场景。

        应用场景可扩展至电商海报生成、营销图片批量制作、个性化图片定制等业务场景,结合用户输入动态生成视觉内容,提升产品智能化体验。

        通过以上实践,开发者可基于 Spring AI Alibaba 快速构建稳定、可扩展的文生图服务,充分利用 Java 生态与阿里云大模型的协同优势,实现 AI 功能的高效落地。

http://www.xdnf.cn/news/12807.html

相关文章:

  • 基于autodl的imageBind部署
  • 6️⃣Go 语言中的哈希、加密与序列化:通往区块链世界的钥匙
  • VSCode CUDA C++进行Linux远程开发
  • 行为设计模式之Command (命令)
  • 力扣HOT100之二分查找:153. 寻找旋转排序数组中的最小值
  • 管道与进程间通信
  • Riverpod与GetX的优缺点对比
  • KTO: Model Alignment as Prospect Theoretic Optimization
  • 【基础算法】差分算法详解
  • 机器学习的数学基础:神经网络
  • Ajax Systems公司的核心产品有哪些?
  • 华为云Flexus+DeepSeek征文|Dify - LLM 云服务单机部署大语言模型攻略指南
  • 基于Java+VUE+MariaDB实现(Web)仿小米商城
  • 机器学习-经典分类模型
  • 不要调用 TOARRAY() 从 LARAVEL COLLECTION 中获取所有项目
  • DeepSeek-R1-0528:开源推理模型的革新与突破
  • 深入理解 Vue.observable:轻量级响应式状态管理利器
  • UOS 20 Pro为国际版WPS设置中文菜单
  • C++:用 libcurl 发送一封带有附件的邮件
  • Go 并发编程深度指南
  • cmake编译LASzip和LAStools
  • # 主流大语言模型安全性测试(二):英文越狱提示词下的表现与分析
  • Oracle业务用户的存储过程个数及行数统计
  • Linux中MySQL的逻辑备份与恢复
  • 协程的常用阻塞函数
  • 用Ai学习wxWidgets笔记——在 VS Code 中使用 CMake 搭建 wxWidgets 开发工程
  • SQLMesh实战:用虚拟数据环境和自动化测试重新定义数据工程
  • 虚拟电厂发展三大趋势:市场化、技术主导、车网互联
  • Opencv查找图形形状的重要API讲解
  • springboot的test模块使用Autowired注入失败