当前位置: 首页 > news >正文

详细解释api

基础请求结构

{"type": "generate",          # 固定值,表示请求生成图像"numbers": 4,                # 生成图像数量"prompt": ["场景描述1", "场景描述2", ...],  # 每个图像的详细文字描述"neg_prompt": ["负面关键词1", "负面关键词2", ...],  # 需避免的特征"ratio": ["4:3", "4:3", ...] # 图像宽高比例
}

关键参数详解

1. type
  • 含义:请求类型
  • 可选值
    • "generate":生成新图像
    • "upscale":图像放大
    • "variation":基于现有图像生成变体
2. numbers
  • 含义:需要生成的图像数量
  • 注意
    • 通常建议单次请求不超过 5 张,避免超时
    • 部分 API 有并发限制(如免费版可能限制为 1-2 张)
3. prompt
  • 含义:图像详细描述,决定生成内容

  • 构成要素

    • 风格:如 "港风动漫"" 二次元 ""写实油画" 等
    • 场景:如 "大巴失控冲向悬崖"" 青楼内翩翩起舞 "
    • 人物:如 "身着古装的女子"" 表情惊恐的学生 "
    • 环境:如 "阴云密布的天空"" 灯光昏暗的侯府 "
    • 光影:如 "光影对比强烈"" 暖黄色灯光 "
    • 构图:如 "俯视角"" 人物在画面中心 "
  • 示例优化

    json

    "prompt": ["港风动漫风格,一辆倾斜的红色双层巴士冲向悬崖,玻璃碎裂,车内学生表情惊恐,暴雨倾盆,霓虹灯牌在雨中闪烁,侧逆光突出剪影,画面颗粒感强"
    ]
    
4. neg_prompt
  • 含义:需避免生成的内容
  • 常见关键词
    • 低质量相关:"blurry", "low quality", "pixelated"
    • 风格排除:"3D", "cartoon", "anime"(如果需要写实风格)
    • 特定元素:"ugly", "disfigured", "bad anatomy"
5. ratio
  • 含义:图像宽高比例
  • 常见值
    • 正方形:"1:1"
    • 横幅:"16:9", "21:9"
    • 竖幅:"9:16"
    • 标准:"4:3"(你当前使用的比例)

进阶参数(可选)

1. style
  • 作用:显式指定风格,与 prompt 中的风格描述互补
  • 示例

    json

    "style": "Hong Kong style animation",
    "prompt": ["一辆失控的大巴..."]
    
2. seed
  • 作用:固定随机种子,确保结果可复现
  • 示例

    json

    "seed": 12345,  # 相同seed+prompt会生成相似图像
    
3. quality
  • 作用:控制图像质量,影响生成时间
  • 可选值
    • "normal"(默认)
    • "high"(更高质量,更长生成时间)

使用建议

  1. 风格强化

    • 在 prompt 中重复关键风格词(如 "港风动漫")
    • 添加时代特征(如 "复古霓虹灯"" 老香港街道 ")
  2. 光影控制

    • 冷色调适合悬疑场景(如 "深蓝色调"" 雨夜霓虹 ")
    • 暖光营造复古感(如 "钨丝灯"" 昏黄路灯 ")
  3. 细节增强

    • 添加时代元素(如 "BB 机"" 繁体字招牌 ")
    • 人物服饰材质(如 "旗袍蕾丝边"" 皮革风衣 ")
  4. 负面提示优化

    json

    "neg_prompt": ["modern city", "clean environment", "flat lighting", "digital painting"
    ]
    

常见问题排查

  1. 生成结果不符合预期

    • 检查 prompt 是否包含矛盾描述(如 "明亮场景" 与 "阴森恐怖")
    • 增加 neg_prompt 排除干扰元素
  2. 比例异常

    • 部分 API 可能不严格遵守比例,需在生成后裁剪
  3. 风格不突出

    • 在 prompt 开头明确风格(如 "港风动漫,以... 为背景")
    • 参考同类成功案例的描述模板
http://www.xdnf.cn/news/471889.html

相关文章:

  • 不同进制的数据展示(十进制、十六进制、编码方式)
  • 理解 Viewport:让网页在手机端正确显示的秘诀
  • 星形测试卡:射线摄影获取焦点星卡射线照片的工具
  • win11安装Joplin Server私有化部署(docker)
  • 【应急响应工具教程】Windows日志快速分析工具——Chainsaw
  • 数智管理学(九)
  • MySQL 8.0 OCP 1Z0-908 题目解析(4)
  • Process exited with an error: 1 (Exit value: 1) 问题处理
  • Element Plus 取消el-form-item点击触发组件,改为原生表单控件
  • Seata源码—3.全局事务注解扫描器的初始化一
  • 5月15日day26打卡
  • 计量经济学——预测与chow检验
  • 以项目的方式学QT开发(三)——超详细讲解(120000多字详细讲解,涵盖qt大量知识)逐步更新!
  • C++ QT图片查看器
  • 软件设计师考试《综合知识》软件过程模型考点分析——求三连
  • 044-代码味道-数据类
  • 【YOLO 系列】基于YOLO的道路坑洞检测识别系统【python源码+Pyqt5界面+数据集+训练代码】
  • SWMM相关文档共享
  • BUUCTF——shrine
  • 牛客网 NC22167: 多组数据a+b
  • 差分振荡器:支持0.15ps超低抖动的高速时钟核心
  • 腾讯AI军备极速扩张
  • LCD电视LED背光全解析:直下式 vs 侧光式、全局调光 vs 局部调光与HDR体验
  • (6)python开发经验
  • hbit资产收集工具Docker(笔记版)
  • 电商热销榜的5种实现方案
  • [python] Python元组、字典与集合的全面解析
  • Linux常用命令41——passwd修改用户的密码值
  • OpenCV光流估计:原理、实现与应用
  • 深度解析物理机服务器故障修复时间:影响因素与优化策略