ComfyUIでLTX-Videoを試す（Windows編） - シンギュラリティ実験ノート

UM790 ProでVRAM16GBを使用できるようになった。これまで8GBではStable Diffusionまでしか動かなかったが、16GBあれば最近公開されたLXT-Videoも動くのではと思い試してみた。Windows環境とUbuntu環境の両方で試した。

結論から言うと残念ながらどちらの環境でもLXT-VideoはGPUでは動かなかった。CPUでは動作するが、当然ながら非常に遅い。Stable DiffusionはGPUでも動作する。とりあえず導入方法をここにメモしておく。

GithubからWindows用ポータブル版をダウンロード

ComfyUI_windows_portable_nvidia.7z をダウンロードし解凍する
事前に導入したMinicondaでComfyUI用のPython仮想環境を作成
```
conda create -n comfyui python==3.12
```
作成したComfyUI用のPython仮想環境を起動
```
conda activate comfyui
```
pipでtorch-directmlを導入
```
pip install torch-directml
```
pipでその他必要なライブラリを導入
```
pip install -r requirement.txt
```

npakaさんのサイトの記事の通り。関係する必要な作業のみを以下に引用。

ワークフロー「Image to Video」のCPUでの実行時間
4901.88sec （81.7分）

ComfyUIでLTX-Videoを試してみた。
UM790 Pro　CPUで4901sec(81.7分）（笑） pic.twitter.com/plS9ieaHsT
— Takuji (@takuboo15) 2024年12月9日
Stable Diffusion「cat wearing sunglasses」のGPU＋DirectMLでの実行時間
60.35sec

GPU動作時のタスクマネージャーの様子

2024-12-10 追記
上記ではVRAMが正しく16GBに設定されていなかったようだ。16GBに設定してやり直した際のタスクマネージャーは以下であった。
LTX-VideoをGPU+DirectMLで実行した場合
「the dimesion of at::Tensor must be 4 or lower, but got 5」というエラーが出る。