Skip to content

Zuntan03/EasyHunyuanVideo

Repository files navigation

EasyHunyuanVideo

公開したてで細々とした調整や不具合修正をしています。
Update.bat で問題が解決したり、このREADMEに重要なことが追記されたりしますので、ご注意ください。

Hunyuan Video を簡単に試せる環境です。

  • 簡単インストールで Kijai 版Native 版 のモデルや LoRA も一式ダウンロード
  • SageAttention, FastVideo, TeaChache の併用で Geforce RTX 3060 でも高速・省 VRAM 生成
  • 日本語プロンプトや LLM・TIPO プロンプト拡張に対応
  • アップスケール、フレーム補間、自動・手動モザイクに対応
  • MMAudio による音声生成に対応

動作確認環境: NVIDIA Geforce 3060 12GB 搭載の Windows PC (RAM 64GB, ストレージ 100GB 程度)

インストール

  1. EasyHunyuanVideoInstaller.bat を右クリックから保存します。
  2. インストール先の空フォルダを C:/EasyHunyuan/ などの浅いパスに用意して、ここに EasyHunyuanVideoInstaller.bat を移動して実行します。
    • WindowsによってPCが保護されました と表示されたら、詳細表示 から 実行 します。
  3. インストール先の EasyHunyuanVideo/vs_BuildTools.exe を実行して、Microsoft の Visual Studio Build ToolsC++ によるデスクトップ開発 をインストールします。
  4. EasyHunyuanVideo/cuda_12.6.3_windows_network.exe を実行して、NVIDIA の CUDA Toolkit をインストールします。
    • CUDA Toolkit に対応したドライバや Geforce Experience も同時にインストールされます。
      Geforce Experience が不要な場合は、インストールオプションカスタム から変更します。
  5. Download.bat を実行して、モデルや LoRA をダウンロードします。
    • ダウンロードには Civitai の API Key が必要です。
      Civitai にログインして アカウント設定 から API Key をコピー&ペーストしてください。

ComfyUi.bat で EasyHunyuanVideo が起動し、Update.bat で更新できます。

インストールのトラブルシューティング

  • アバストなどの Windows Defender でないセキュリティソフトが有効だと、インストールに失敗する場合があります。
  • Windows PC の管理者権限がないと、インストールに失敗する場合があります。
  • ダウンロード中にエラーが発生する場合は、EasyTools/Download/Aria_UseCurl.bat を実行してから再インストールします。
    • または、PC の管理者権限で EasyTools/EnableLongPaths.bat を実行してから再インストールします。
  • VPN を利用していると、インストールに失敗する場合があります。
  • プロキシ環境でインストールに失敗する場合は、Git for WindowsPython 3.10.xパスを通してから 再インストールします。

チュートリアル

チュートリアルは高速な Kijai 版 で解説していますが、Kijai 版は動作環境がシビアです。
動作しない場合は以下を試してみてください。

動画の生成

  1. ComfyUi.bat を実行するとブラウザで ComfyUI が起動します。
  2. インストール先の Sample/ から好みの *.png 画像を選んで、ComfyUI にドラッグ&ドロップします。
  3. 実行 で動画の生成を開始します。初回はモデルの追加ダウンロードで時間が掛かります。
    • プロンプト入力欄左側の Seed ノードで Randomize Each Time すると、バリエーションを生成できます。
  4. 生成した動画は Output/ にあります。
    • *.mp4 は通常の動画で、*.webp は加工用の劣化しない動画(ただし大きくて重い)です。*.png はワークフロー保存用の画像です。
  5. 気に入った動画が生成できたら、左側ツールバーの 📂 から Easy/40_Upscale.json ワークフローを開きます。
    • 画像を読み込む*.webp をドラッグ&ドロップなどで読み込んで実行するとアップスケールします。
  6. 同様に Easy/50_Refine_NoobE で、img2img で書き加えた *.webp 動画を生成します。
    • フレーム間のちらつきは Tile ControlNet強度 を上げたり、Kサンプラーノイズ除去 を下げたりして抑え、フレーム補間でも滑らかにします。
  7. 同様に Easy/60_Detail_NoobE で、顔などを拡大して img2img で書き加えた *.webp 動画を生成します。
    • フレーム間のちらつきは Tile ControlNet強度 を上げたり、Kサンプラーノイズ除去 を下げたりして抑え、フレーム補間でも滑らかにします。
  8. 同様に Easy/70_Interpolate で、フレーム補間によって滑らかにした *.mp4 動画を生成します。
  9. 最後に Easy/80_MMAudio で滑らかにした *.mp4 を読み込んで音声を生成します。
    • Seed 違いの生成や、プロンプトの工夫で当たり音声を引いてください。

Easy/ 以下のワークフローは更新 (Update.bat) で最新状態になります。
編集したワークフローを残したい場合は別名で保存してください。

VRAM 不足 (CudaOutOfMemory) 対策

  • VRAM 不足のエラーの後に、そのまま再度 実行 すると正常に動作する場合があります。
  • 上部メニューの Manager の右にある Unload Models した後に 実行 すると正常に動作する場合があります。
  • HunyuanVideo Sampler ノードで width, height(384 x 512など), num_frames(73 や 97 など) を下げます。
    widthheight を下げた場合は flow_shift も下げたほうがよいかもしれません。
  • HunyuanVideo Decode ノードで止まる場合は、spatial_tile_sample_min_size128 にします。
  • Easy/20_HunyuanVideo_Native ワークフローを使用すると、生成は遅くなりますが低 VRAM や低 RAM でも生成できる場合があります。

Easy/10_HunyuanVideo_Kijai ワークフロー

  • プロンプト入力欄左の ControlPanel でいろいろな機能の有効無効を切り替えられます。
  • 通常のプロンプト入力欄である Prompt では、Dynamic Prompt を使用できます。
    • TIPO を有効にすると、少量のプロンプトからプロンプトのバリエーションを生成できます。
  • LoRA は ControlPanel で LoRA 1-5 を有効にして、LoRA を選択してトリガーワードを指定します。
    • 左にある通常の LoRA 読み込みノードで LoRA を選択し、右クリックから View Lora Info... でトリガーワードや Civitai ページを確認できます。
      Civitai の LoRA 作者のプロンプトをぜひ参考にしてください(画像生成よりプロンプトがシビアです)。
    • LoRA の影響が強すぎる場合に、Get_LbwDoble と LoRA ノードを繋ぐと影響を軽減できる場合があります。
  • LLM Prompt では日本語プロンプトを英訳したり、さらにプロンプトの続きを生成したりできます。
  • TranslateJa を有効にすると、生成用プロンプトの日本語訳を確認できます。
  • Shape Mosaic では手動で指定した丸や四角のモザイクを、Segm Mosaic では自動検出でモザイクをかけられます。
    • *.webp のロスレス出力を 30_Mosaic ワークフローで読み込んで、後からモザイク処理をすることもできます。
      • *.webp をネットで共有する場合は、ロスレスfalse にしてください。
    • Upscale, Interpolate も同様に、後から処理できます。
  • 動画の解像度や長さなどのパラメータは HunyuanVideo Sampler ノードで編集できます。
    • num_frames は 73(3秒)~ 145 (6秒) ぐらいがオススメです。
    • 解像度や LoRA との相性?で、flow_shift を 6.0 ~ 20.0 ぐらいに変更すると、結果が良くなる場合があります。

最近の更新履歴

2025/01/19

  • NVIDIA Cosmos 対応を追加しました。
    • Download/Cosmos.bat で必要なファイルをダウンロードしてから、ワークフローの Easy/Cosmos_ImageToVideoEasy/Cosmos_TextToVideo で生成できます。
      • Geforce RTX 3060 で 1280x704 の 121フレーム生成に 45分程度掛かります。
      • リファイン・アップスケール・フレーム補間などは Hunyuan 用のワークフローを流用できます。
    • Flux example の ImageToVideo 例

2025/01/13

  • NoobAI Epsilon Prediction v1.1ControlNet Tile で、動画を詳細にする Easy/50_Refine_NoobEEasy/60_Detail_NoobE のワークフローを追加しました。
    • フレーム間のちらつきは Tile ControlNet強度 を上げたり、Kサンプラーノイズ除去 を下げたりして抑え、フレーム補間でも滑らかにします。
  • サンプルを 4種追加しました。

2025/01/11

  • Python がインストールされていない環境で、Kijai 版ワークフローが動作しない不具合を修正しました。
  • サンプルを 1 種追加しました。
  • LoRA を 5 種追加しました。

2025/01/09

  • Easy/20_HunyuanVideo_Native ワークフローに First Block Cache のノードを追加しました。
  • ComfyUI の起動時に --use-sage-attention オプションを追加する ComfyUi_SageAttention.bat を追加しました。
  • Easy/ のワークフローで webp 保存のロスレスを無効にしました。
  • ComfyUI/user/default/workflows へのリンクを Workflow/ に作成しました。
  • アンインストール について追記しました。

2025/01/08

2025/01/07

  • EasyHunyuanVideo を公開しました。
  • サンプルのダウンロードの不具合を修正しました。
  • 各種ノードによる HuggingFace からのダウンロードに失敗する一部環境のために、Download.bat でダウンロードするファイルを増やしました。

アンインストール

  • インストール先のフォルダを削除します。
    • 容量の多くをインストール先のフォルダが占めていますので、これでアンインストール完了とするのがオススメです。
  • Visual Studio Build Tools と CUDA Toolkit は Windows の アプリ - インストールされているアプリ からアンインストールできます。
    • ただし、CUDA Toolkit といっしょにインストールされる NVIDIA グラフィックス ドライバーNVIDIA オーディオ ドライバーPhysX システム ソフトウェア あたりはアンインストールすると PC が正常に動作しなくなる可能性があります。
    • Visual Studio Build Tools のアンインストールで問題が起こる可能性は低い想定です。

ライセンス

このリポジトリの内容は MIT License です。
別途ライセンスファイルがあるフォルダ以下は、そのライセンスです。

About

HunyuanVideoを簡単に試せる環境です。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published