概要
Stabily.aiが出した最新の3D生成モデルである「Stable Zero123」を Window11のローカル環境で動かしてみた。
Stable Zero123 のご紹介: 単一画像からの高品質3Dオブジェクト生成 — Stability AI Japan
環境
- OS : Windows11
- GPU : NVIDIA GeForce RTX 3080Ti
- Python : 3.10.6
セットアップ
threestudioをインストール
- リポジトリをクローン
git clone https://github.com/threestudio-project/threestudio.git cd threestudio
- 仮想環境を作成
python -m venv venv .\venv\Scripts\activate
- ライブラリのインストール
- インストール前に環境変数のパスに「C:\Program Files (x86)\Microsoft Visual Studio\2019\Community\VC\Tools\MSVC\14.29.30133\bin\Hostx64\x64」が設定されている場合、一時削除しないと「tiny-cuda-nn」のインストールに失敗する。
python -m pip install pip==23.0.1 pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121 pip install ninja pip install -r requirements.txt # インストールに約20分くらいかかる
モデルのダウンロード
stabilityai/stable-zero123 at main
- 上記リンクから「stable_zero123.ckpt」をダウンロードし、「load/zero123」に配置。
実行
画像の用意
3Dモデルを作成する画像を用意
用意した画像を「load/images」に配置
学習の実行
- 以下のコマンドで学習を実行を開始
python launch.py --config configs/stable-zero123.yaml --train --gpu 0 data.image_path=./load/images/dog_rgba.png
学習結果
- 20時間で学習が完了(600Step)