当前位置: 首页 > ops >正文

【记录】HunyuanVideo 文生视频工作流

HunyuanVideo 文生视频工作流指南

概述

本指南详细介绍如何在ComfyUI中使用腾讯混元HunyuanVideo模型进行文本到视频生成的全流程操作,包含环境配置、模型安装和工作流使用说明。
参考:https://comfyui-wiki.com/zh/install/install-comfyui/install-comfyui-on-linux

环境准备

1. ComfyUI安装与更新

  • 新安装:参考ComfyUI安装教程
  • 更新:确保使用最新版本(需包含EmptyHunyuanLatentVideo节点)

注意:必须更新至最新版本才能支持完整功能

模型配置

2.1 主模型

文件名称大小存放路径
hunyuan_video_t2v_720p_bf16.safetensors25.6GBComfyUI/models/diffusion_models

2.2 文本编码器

文件名称大小存放路径
clip_l.safetensors246MBComfyUI/models/text_encoders
llava_llama3_fp8_scaled.safetensors9.09GBComfyUI/models/text_encoders

2.3 VAE模型

文件名称大小存放路径
hunyuan_video_vae_bf16.safetensors493MBComfyUI/models/vae

目录结构示例

ComfyUI/
└── models/├── diffusion_models/│   └── hunyuan_video_t2v_720p_bf16.safetensors├── text_encoders/│   ├── clip_l.safetensors│   └── llava_llama3_fp8_scaled.safetensors└── vae/└── hunyuan_video_vae_bf16.safetensors

工作流配置

3. 工作流下载

  • 获取地址:HunyuanVideo工作流文件

  • 支持分辨率:

比例540p720p(推荐)
9:16544×960720×1280
16:9960×5441280×720
1:1720×720960×960

核心节点说明

4.1 模型加载

  • UNETLoader

    • 参数:hunyuan_video_t2v_720p_bf16.safetensors
    • 显存优化:可选fp8权重类型
  • DualCLIPLoader

    • 双编码器配置:
      • CLIP 1: clip_l.safetensors
      • CLIP 2: llava_llama3_fp8_scaled.safetensors

4.2 视频生成

  • EmptyHunyuanLatentVideo

    • 关键参数:Width/HeightFrame Count(建议129帧)
  • CLIPTextEncode

    • 提示词规范:
    [主体描述], [动作描述], [场景描述], [风格描述], [质量要求]
    

    示例:

    anime girl with fluffy tail, dancing gracefully, cherry blossom garden, studio ghibli style, 4k ultra HD
    

优化建议

5.1 显存优化

  1. 使用VAEDecodeTiled替代VAEDecode
  2. 调整参数:
    • Tile Size: 256 → 128
    • Overlap: 64 → 32

5.2 质量提升

  • 采样步数:20-30步
  • Guidance Scale:6.0-8.0
  • 推荐分辨率:720p(1280×720)

常见问题

显存不足

  • 解决方案:降低分辨率/使用fp8权重

生成缓慢

  • 优化方向:减少帧数/降低采样步数

🖼️ 画质问题

  • 检查要点:
    1. 提示词详细度
    2. 采样器选择(euler/dpm++_2m)
    3. 去噪强度(建议1.0)
      在这里插入图片描述在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
http://www.xdnf.cn/news/4685.html

相关文章:

  • 数字孪生[IOC]常用10个技术栈(总括)
  • 数据库的进阶操作
  • OCCT中的布尔运算
  • 机器学习 数据集
  • 第二章 Logback的架构(三)
  • Docker 核心目录结构
  • React知识框架
  • 【开源版】likeshop上门家政系统PHP版全开源+uniapp前端
  • 【5G通信】redcap和bwp 随手记
  • 路由交换实验
  • 【总结3】
  • ADC和DAC
  • 普冉MS32C001单片机,国产32位单片机,芯片特性和功能介绍
  • 什么是文本相似对比算法,原理是什么
  • 《100天精通Python——基础篇 2025 第16天:异常处理与调试机制详解》
  • 【言语理解】片段阅读之细节判断(9)
  • C#生成二维码和条形码
  • 在c++中static用在全局和局部有什么区别
  • Qt开发经验 --- 避坑指南(7)
  • 【链表扫盲】FROM GPT
  • P2392 kkksc03考前临时抱佛脚
  • mongodb升级、改单节点模式
  • 为什么虚拟环境下包找错路径?
  • 堡塔云WAF免费WEB防火墙,从搭建到应用
  • k8s监控方案实践(一):部署Prometheus与Node Exporter
  • 排序算法-冒泡排序
  • [数据库之十三] 数据库索引之散列索引
  • 如何在macOS上通过SSHFS挂载远程文件系统
  • 室内无人机自主巡检解决方案-自主方案
  • 批量清洗与修改 YOLO 标签:删除与替换指定类别