AI大模型学习十七、利用Dify搭建 AI 图片生成应用
一、说明
随着图像生成技术的兴起,涌现了许多优秀的图像生成产品,比如 Dall-e、Flux、Stable Diffusion 等。
本文将使用图像生成模型,学习使用 Dify 快速开发一个 AI 图片生成应用
二、获取Stablility API 密钥
1、注册
Stability AI - Developer Platform
注意:注册后在email里确定,然后登录就可以了
备用
三、dify中创建工具
1、登录dify进入工具
找到如图工具,授权stability
前面申请的apikey填到这里,多试几次
2、创建应用
3、选择 LLM
我们在前面的文章中已经部署了本地模型
AI大模型学习十四、白嫖腾讯Cloud Studio AI环境 通过Ollama+Dify+DeepSeek构建生成式 AI 应用-接入DeepSeek大模型-CSDN博客https://blog.csdn.net/jiangkp/article/details/147581087?spm=1011.2415.3001.5331
4、在工具中添加 AI 绘图工具 Stability
5、撰写提示词
最简单的提示词
生成一个穿着中国国家队足球服,正在踢球的男孩
🤖
Agent 日志
Thinking...好的,用户希望生成一个穿着中国国家队足球服、正在踢球的男孩的画面。我需要使用stability_text2image工具来实现这一点。首先,我要确定正确的提示词,包括男孩的动作、服装细节以及整体氛围。
考虑到足球运动的激烈性,我应该描述男孩在积极踢球的状态,比如带球或射门。同时,中国国家队的服装颜色通常是红色为主,配以白色元素,所以我要详细说明这些色彩和队徽的位置。此外,场景设定也很重要,选择一个现代感强、有观众互动的足球场,能增强画面的真实感。
接下来,我会组织这些要点成一个连贯的提示词,确保每个细节都被覆盖到,这样生成出来的图像才会符合用户的预期。
已使用
stability_text2image
Thinking...Alright, let's see what happened here. The user initially asked to generate an image of a boy wearing the Chinese national football team jersey and playing soccer using the stability_text2image tool. I tried to create the prompt in Chinese, but it resulted in an error because the service only supports English.
Hmm, so the first step is to correct that by creating the prompt in English. The user's response was "continue," which means they want me to proceed after the initial failure. I need to figure out how to adjust the prompt properly.
I should break down the requirements: a young boy, Chinese national team jersey, active in a soccer game. Maybe adding details like the stadium or fans could make the image more dynamic. Let's make sure the prompt is clear and in English this time.
Okay, I'll structure the JSON blob with "action": "stability_text2image" and include the revised prompt. That should hopefully work without errors.
好的,我需要继续使用工具
stability_text2image
来完成任务。以下是正确的操作:这将生成一个男孩穿着中国国家足球队球衣,正在现代化球场上踢足球的图像。
已使用
stability_ertext2image
Thinking...好的,我需要帮助用户生成一个男孩穿着中国国家足球队球衣踢球的图像。首先,回顾之前的步骤,发现当尝试使用中文提示词时遇到了错误,因为该工具只支持英文。
因此,现在需要将提示词翻译成英文,并确保包含所有必要的细节:男孩、中国国家队球衣、踢球的动作、现代球场和观众。调整后的提示词应该是清晰且具体的,以便生成准确的图像。
接下来,正确调用工具
stability_ertext2image
,但发现名称拼写有误,需要更正为正确的工具名stability_ertext2image
可能不存在,应检查正确的工具名称是否正确。在上一次尝试中,用户指出没有名为
stability_ertext2image
的工具。因此,我应该再次确认工具的正确名称,并确保使用正确的JSON格式来调用该工具。最终,通过提供准确的英文提示词并正确调用工具,应该能够生成符合用户需求的图像。
已使用
stability_ertext2image
Thinking...好的,用户之前尝试生成一个男孩穿着中国国家队足球服踢球的图像时遇到了问题。第一次使用中文提示导致工具不支持语言错误,后来尝试将提示翻译成英文并调用工具,但发现工具名称拼写错误。
现在,用户回复“continue”,希望继续之前的任务。我需要检查之前的步骤,找出问题所在,并采取正确的行动来解决。
首先,回顾历史对话,第一次使用中文提示导致错误,因此必须使用英文。第二次尝试正确翻译了提示,但由于拼写错误调用了不存在的工具
stability_ertext2image
,而不是正确的工具名称stability_text2image
。现在,我需要确保使用正确的工具名称,并提供准确的英文提示词。正确的提示应包含所有细节:男孩、中国国家队球衣、踢球的动作、现代球场和观众。
接下来,构造正确的JSON blob,调用
stability_text2image
工具,传递英文提示。这样应该能成功生成图像。最后,在回复中使用Final Answer来提供结果链接,并确保格式正确。
好的,我将继续帮助您生成一个男孩穿着中国国家足球队球衣踢球的图像。
已使用
stability_text2image
![]()
Thinking...好的,现在用户再次回复“continue”,希望继续之前的任务。回顾整个对话历史,第一次尝试使用中文提示词导致工具返回语言不支持的错误。接着,我将提示翻译成英文并调用`stability_ertext2image`工具,但发现工具名称拼写错误,导致工具未找到。
在上一次回复中,用户指出没有名为
stability_ertext2image
的工具,因此我需要再次检查正确的工具名称,并确保使用正确的JSON格式来调用该工具。正确的工具名称应该是stability_text2image
。现在,我需要构造一个正确的JSON blob,调用
stability_text2image
工具,并传递准确的英文提示词:“a young boy wearing the Chinese national football team jersey, actively playing soccer in a modern stadium with fans cheering”。这样应该能够成功生成图像。然而,在最新的回复中,用户提到图像已经创建并发送给用户,不需要再生成,只需告知用户查看即可。因此,我需要告诉用户检查已生成的图像,并确认是否符合需求。
The image has already been generated and sent to you. If you need any adjustments or further assistance, please let me know!
耗时 236.84 秒
花费 Token 7,395
·
07:23 AM
6、发布
点击右上角的发布按钮,发布后选择运行就可以获得一个在线运行的 Agent 的网页