公開したてで細々とした調整や不具合修正をしています。
Update.bat
で問題が解決したり、このREADMEに重要なことが追記されたりしますので、ご注意ください。
Hunyuan Video を簡単に試せる環境です。
- 簡単インストールで Kijai 版 や Native 版 のモデルや LoRA も一式ダウンロード
- SageAttention, FastVideo, TeaChache の併用で Geforce RTX 3060 でも高速・省 VRAM 生成
- 日本語プロンプトや LLM・TIPO プロンプト拡張に対応
- アップスケール、フレーム補間、自動・手動モザイクに対応
- MMAudio による音声生成に対応
動作確認環境: NVIDIA Geforce 3060 12GB 搭載の Windows PC (RAM 64GB, ストレージ 100GB 程度)
- EasyHunyuanVideoInstaller.bat を右クリックから保存します。
- インストール先の空フォルダを
C:/EasyHunyuan/
などの浅いパスに用意して、ここにEasyHunyuanVideoInstaller.bat
を移動して実行します。WindowsによってPCが保護されました
と表示されたら、詳細表示
から実行
します。
- インストール先の
EasyHunyuanVideo/vs_BuildTools.exe
を実行して、Microsoft の Visual Studio Build Tools のC++ によるデスクトップ開発
をインストールします。
EasyHunyuanVideo/cuda_12.6.3_windows_network.exe
を実行して、NVIDIA の CUDA Toolkit をインストールします。Download.bat
を実行して、モデルや LoRA をダウンロードします。
ComfyUi.bat
で EasyHunyuanVideo が起動し、Update.bat
で更新できます。
- アバストなどの Windows Defender でないセキュリティソフトが有効だと、インストールに失敗する場合があります。
- Windows PC の管理者権限がないと、インストールに失敗する場合があります。
- ダウンロード中にエラーが発生する場合は、
EasyTools/Download/Aria_UseCurl.bat
を実行してから再インストールします。- または、PC の管理者権限で
EasyTools/EnableLongPaths.bat
を実行してから再インストールします。
- または、PC の管理者権限で
- VPN を利用していると、インストールに失敗する場合があります。
- プロキシ環境でインストールに失敗する場合は、Git for Windows と Python 3.10.x に パスを通してから 再インストールします。
チュートリアルは高速な Kijai 版 で解説していますが、Kijai 版は動作環境がシビアです。
動作しない場合は以下を試してみてください。
HunyuanVideo Model Loader
のattention_mode
をspda
にする。
- ComfyUI ネイティブ版の
Easy/20_HunyuanVideo_Native
を利用する。
ComfyUi.bat
を実行するとブラウザで ComfyUI が起動します。- インストール先の
Sample/
から好みの*.png
画像を選んで、ComfyUI にドラッグ&ドロップします。 実行
で動画の生成を開始します。初回はモデルの追加ダウンロードで時間が掛かります。- プロンプト入力欄左側の
Seed
ノードでRandomize Each Time
すると、バリエーションを生成できます。
- プロンプト入力欄左側の
- 生成した動画は
Output/
にあります。*.mp4
は通常の動画で、*.webp
は加工用の劣化しない動画(ただし大きくて重い)です。*.png
はワークフロー保存用の画像です。
- 気に入った動画が生成できたら、左側ツールバーの
📂
からEasy/40_Upscale.json
ワークフローを開きます。画像を読み込む
で*.webp
をドラッグ&ドロップなどで読み込んで実行するとアップスケールします。
- 同様に
Easy/50_Refine_NoobE
で、img2img で書き加えた*.webp
動画を生成します。- フレーム間のちらつきは
Tile ControlNet
の強度
を上げたり、Kサンプラー
のノイズ除去
を下げたりして抑え、フレーム補間でも滑らかにします。
- フレーム間のちらつきは
- 同様に
Easy/60_Detail_NoobE
で、顔などを拡大して img2img で書き加えた*.webp
動画を生成します。- フレーム間のちらつきは
Tile ControlNet
の強度
を上げたり、Kサンプラー
のノイズ除去
を下げたりして抑え、フレーム補間でも滑らかにします。
- フレーム間のちらつきは
- 同様に
Easy/70_Interpolate
で、フレーム補間によって滑らかにした*.mp4
動画を生成します。 - 最後に
Easy/80_MMAudio
で滑らかにした*.mp4
を読み込んで音声を生成します。Seed
違いの生成や、プロンプトの工夫で当たり音声を引いてください。
Easy/
以下のワークフローは更新 (Update.bat
) で最新状態になります。
編集したワークフローを残したい場合は別名で保存してください。
- VRAM 不足のエラーの後に、そのまま再度
実行
すると正常に動作する場合があります。 - 上部メニューの
Manager
の右にあるUnload Models
した後に実行
すると正常に動作する場合があります。 HunyuanVideo Sampler
ノードでwidth
,height
(384 x 512など),num_frames
(73 や 97 など) を下げます。
width
やheight
を下げた場合はflow_shift
も下げたほうがよいかもしれません。HunyuanVideo Decode
ノードで止まる場合は、spatial_tile_sample_min_size
を128
にします。Easy/20_HunyuanVideo_Native
ワークフローを使用すると、生成は遅くなりますが低 VRAM や低 RAM でも生成できる場合があります。
- プロンプト入力欄左の
ControlPanel
でいろいろな機能の有効無効を切り替えられます。 - 通常のプロンプト入力欄である
Prompt
では、Dynamic Prompt
を使用できます。TIPO
を有効にすると、少量のプロンプトからプロンプトのバリエーションを生成できます。
- LoRA は
ControlPanel
で LoRA 1-5 を有効にして、LoRA を選択してトリガーワードを指定します。- 左にある通常の LoRA 読み込みノードで LoRA を選択し、右クリックから
View Lora Info...
でトリガーワードや Civitai ページを確認できます。
Civitai の LoRA 作者のプロンプトをぜひ参考にしてください(画像生成よりプロンプトがシビアです)。
- LoRA の影響が強すぎる場合に、
Get_LbwDoble
と LoRA ノードを繋ぐと影響を軽減できる場合があります。
- 左にある通常の LoRA 読み込みノードで LoRA を選択し、右クリックから
LLM Prompt
では日本語プロンプトを英訳したり、さらにプロンプトの続きを生成したりできます。TranslateJa
を有効にすると、生成用プロンプトの日本語訳を確認できます。Shape Mosaic
では手動で指定した丸や四角のモザイクを、Segm Mosaic
では自動検出でモザイクをかけられます。*.webp
のロスレス出力を30_Mosaic
ワークフローで読み込んで、後からモザイク処理をすることもできます。*.webp
をネットで共有する場合は、ロスレス
をfalse
にしてください。
Upscale
,Interpolate
も同様に、後から処理できます。
- 動画の解像度や長さなどのパラメータは
HunyuanVideo Sampler
ノードで編集できます。- num_frames は 73(3秒)~ 145 (6秒) ぐらいがオススメです。
- 解像度や LoRA との相性?で、flow_shift を
6.0
~20.0
ぐらいに変更すると、結果が良くなる場合があります。
- NVIDIA Cosmos 対応を追加しました。
Download/Cosmos.bat
で必要なファイルをダウンロードしてから、ワークフローのEasy/Cosmos_ImageToVideo
やEasy/Cosmos_TextToVideo
で生成できます。- Geforce RTX 3060 で 1280x704 の 121フレーム生成に 45分程度掛かります。
- リファイン・アップスケール・フレーム補間などは Hunyuan 用のワークフローを流用できます。
- Flux example の ImageToVideo 例
- NoobAI Epsilon Prediction v1.1 と ControlNet Tile で、動画を詳細にする
Easy/50_Refine_NoobE
とEasy/60_Detail_NoobE
のワークフローを追加しました。- フレーム間のちらつきは
Tile ControlNet
の強度
を上げたり、Kサンプラー
のノイズ除去
を下げたりして抑え、フレーム補間でも滑らかにします。
- フレーム間のちらつきは
- サンプルを 4種追加しました。
- Python がインストールされていない環境で、Kijai 版ワークフローが動作しない不具合を修正しました。
- サンプルを 1 種追加しました。
- LoRA を 5 種追加しました。
Easy/20_HunyuanVideo_Native
ワークフローに First Block Cache のノードを追加しました。- ComfyUI の起動時に
--use-sage-attention
オプションを追加するComfyUi_SageAttention.bat
を追加しました。 Easy/
のワークフローで webp 保存のロスレスを無効にしました。ComfyUI/user/default/workflows
へのリンクをWorkflow/
に作成しました。- アンインストール について追記しました。
Easy/20_HunyuanVideo_Native
ワークフローで TeaChache による高速化に対応しました。- LoRA を 8 種追加しました。
- EasyHunyuanVideo を公開しました。
- サンプルのダウンロードの不具合を修正しました。
- 各種ノードによる HuggingFace からのダウンロードに失敗する一部環境のために、
Download.bat
でダウンロードするファイルを増やしました。
- インストール先のフォルダを削除します。
- 容量の多くをインストール先のフォルダが占めていますので、これでアンインストール完了とするのがオススメです。
- Visual Studio Build Tools と CUDA Toolkit は Windows の
アプリ
-インストールされているアプリ
からアンインストールできます。- ただし、CUDA Toolkit といっしょにインストールされる
NVIDIA グラフィックス ドライバー
、NVIDIA オーディオ ドライバー
、PhysX システム ソフトウェア
あたりはアンインストールすると PC が正常に動作しなくなる可能性があります。 - Visual Studio Build Tools のアンインストールで問題が起こる可能性は低い想定です。
- ただし、CUDA Toolkit といっしょにインストールされる
このリポジトリの内容は MIT License です。
別途ライセンスファイルがあるフォルダ以下は、そのライセンスです。