当前位置: 首页 > news >正文

AI大模型学习十七、利用Dify搭建 AI 图片生成应用

一、说明

随着图像生成技术的兴起,涌现了许多优秀的图像生成产品,比如 Dall-e、Flux、Stable Diffusion 等。

本文将使用图像生成模型,学习使用 Dify 快速开发一个 AI 图片生成应用

二、获取Stablility API 密钥

1、注册

Stability AI - Developer Platform

注意:注册后在email里确定,然后登录就可以了

备用 

三、dify中创建工具

1、登录dify进入工具

 找到如图工具,授权stability

 

 

 前面申请的apikey填到这里,多试几次

 2、创建应用

 

3、选择 LLM

我们在前面的文章中已经部署了本地模型

AI大模型学习十四、白嫖腾讯Cloud Studio AI环境 通过Ollama+Dify+DeepSeek构建生成式 AI 应用-接入DeepSeek大模型-CSDN博客https://blog.csdn.net/jiangkp/article/details/147581087?spm=1011.2415.3001.5331

4、在工具中添加 AI 绘图工具 Stability 

5、撰写提示词

 最简单的提示词

生成一个穿着中国国家队足球服,正在踢球的男孩

🤖

Agent 日志

Thinking...好的,用户希望生成一个穿着中国国家队足球服、正在踢球的男孩的画面。我需要使用stability_text2image工具来实现这一点。首先,我要确定正确的提示词,包括男孩的动作、服装细节以及整体氛围。

考虑到足球运动的激烈性,我应该描述男孩在积极踢球的状态,比如带球或射门。同时,中国国家队的服装颜色通常是红色为主,配以白色元素,所以我要详细说明这些色彩和队徽的位置。此外,场景设定也很重要,选择一个现代感强、有观众互动的足球场,能增强画面的真实感。

接下来,我会组织这些要点成一个连贯的提示词,确保每个细节都被覆盖到,这样生成出来的图像才会符合用户的预期。

已使用

stability_text2image

Thinking...Alright, let's see what happened here. The user initially asked to generate an image of a boy wearing the Chinese national football team jersey and playing soccer using the stability_text2image tool. I tried to create the prompt in Chinese, but it resulted in an error because the service only supports English.

Hmm, so the first step is to correct that by creating the prompt in English. The user's response was "continue," which means they want me to proceed after the initial failure. I need to figure out how to adjust the prompt properly.

I should break down the requirements: a young boy, Chinese national team jersey, active in a soccer game. Maybe adding details like the stadium or fans could make the image more dynamic. Let's make sure the prompt is clear and in English this time.

Okay, I'll structure the JSON blob with "action": "stability_text2image" and include the revised prompt. That should hopefully work without errors.

好的,我需要继续使用工具 stability_text2image 来完成任务。以下是正确的操作:

这将生成一个男孩穿着中国国家足球队球衣,正在现代化球场上踢足球的图像。

已使用

stability_ertext2image

Thinking...好的,我需要帮助用户生成一个男孩穿着中国国家足球队球衣踢球的图像。首先,回顾之前的步骤,发现当尝试使用中文提示词时遇到了错误,因为该工具只支持英文。

因此,现在需要将提示词翻译成英文,并确保包含所有必要的细节:男孩、中国国家队球衣、踢球的动作、现代球场和观众。调整后的提示词应该是清晰且具体的,以便生成准确的图像。

接下来,正确调用工具stability_ertext2image,但发现名称拼写有误,需要更正为正确的工具名stability_ertext2image可能不存在,应检查正确的工具名称是否正确。

在上一次尝试中,用户指出没有名为stability_ertext2image的工具。因此,我应该再次确认工具的正确名称,并确保使用正确的JSON格式来调用该工具。

最终,通过提供准确的英文提示词并正确调用工具,应该能够生成符合用户需求的图像。

已使用

stability_ertext2image

Thinking...好的,用户之前尝试生成一个男孩穿着中国国家队足球服踢球的图像时遇到了问题。第一次使用中文提示导致工具不支持语言错误,后来尝试将提示翻译成英文并调用工具,但发现工具名称拼写错误。

现在,用户回复“continue”,希望继续之前的任务。我需要检查之前的步骤,找出问题所在,并采取正确的行动来解决。

首先,回顾历史对话,第一次使用中文提示导致错误,因此必须使用英文。第二次尝试正确翻译了提示,但由于拼写错误调用了不存在的工具stability_ertext2image,而不是正确的工具名称stability_text2image

现在,我需要确保使用正确的工具名称,并提供准确的英文提示词。正确的提示应包含所有细节:男孩、中国国家队球衣、踢球的动作、现代球场和观众。

接下来,构造正确的JSON blob,调用stability_text2image工具,传递英文提示。这样应该能成功生成图像。

最后,在回复中使用Final Answer来提供结果链接,并确保格式正确。

好的,我将继续帮助您生成一个男孩穿着中国国家足球队球衣踢球的图像。

已使用

stability_text2image

Thinking...好的,现在用户再次回复“continue”,希望继续之前的任务。回顾整个对话历史,第一次尝试使用中文提示词导致工具返回语言不支持的错误。接着,我将提示翻译成英文并调用`stability_ertext2image`工具,但发现工具名称拼写错误,导致工具未找到。

在上一次回复中,用户指出没有名为stability_ertext2image的工具,因此我需要再次检查正确的工具名称,并确保使用正确的JSON格式来调用该工具。正确的工具名称应该是stability_text2image

现在,我需要构造一个正确的JSON blob,调用stability_text2image工具,并传递准确的英文提示词:“a young boy wearing the Chinese national football team jersey, actively playing soccer in a modern stadium with fans cheering”。这样应该能够成功生成图像。

然而,在最新的回复中,用户提到图像已经创建并发送给用户,不需要再生成,只需告知用户查看即可。因此,我需要告诉用户检查已生成的图像,并确认是否符合需求。

The image has already been generated and sent to you. If you need any adjustments or further assistance, please let me know!

耗时 236.84 秒

花费 Token 7,395

·

07:23 AM

 

6、发布

点击右上角的发布按钮,发布后选择运行就可以获得一个在线运行的 Agent 的网页 

http://www.xdnf.cn/news/378649.html

相关文章:

  • STL-to-ASCII-Generator 实用教程
  • SpringBoot2集成xxl-job详解
  • 大模型微调指南之 LLaMA-Factory 篇:一键启动LLaMA系列模型高效微调
  • 差动讯号(3)弱耦合与强耦合
  • Linux数据库篇、第一章_01MySQL5.7的安装部署
  • Java基础 5.10
  • 致远A8V5-9.0安装包(包含信创版)【附百度网盘链接】
  • LeetCode 热题 100 24. 两两交换链表中的节点
  • 计算机网络八股文--day1
  • suricata之日志截断
  • Python实例题:Python协程详解公开课
  • JAVA练习题(1) 卖飞机票
  • vue开发用户注册功能
  • 【入门】数字走向I
  • 求数组中的两数之和--暴力/哈希表
  • 构建休闲企业服务实训室:融合凯禾瑞华产品打造产教融合新生态
  • 红黑树删除的实现与四种情况的证明
  • 北京导游资格证备考单选题题库及答案【2025年】
  • 大型旋转机械信号分解算法模块
  • 猿人学第十二题-js入门
  • c++——二叉树进阶
  • SAP Commerce(Hybris)开发实战(一)
  • 《用MATLAB玩转游戏开发:从零开始打造你的数字乐园》基础篇(2D图形交互)-《打砖块:向量反射与实时物理模拟》MATLAB教程
  • Python-77:古生物DNA序列血缘分析
  • 网络世界的“快递站”:深入浅出OSI七层模型
  • Python 包管理新选择:uv
  • 便签软件哪个好用?2025年桌面记事本便签软件推荐大全
  • 【ospf综合实验】
  • ffmpeg 写入avpacket时候,即av_interleaved_write_frame方法是如何不需要 业务层释放avpacket的 逻辑分析
  • 【LeetCode 热题 100】206. 反转链表