Stable Zero123をWindow11で動かす

概要

Stabily.aiが出した最新の3D生成モデルである「Stable Zero123」を Window11のローカル環境で動かしてみた。

Stable Zero123 のご紹介: 単一画像からの高品質3Dオブジェクト生成 — Stability AI Japan

環境

  • OS : Windows11
  • GPU : NVIDIA GeForce RTX 3080Ti
  • Python : 3.10.6

セットアップ

threestudioをインストール

  • リポジトリをクローン
 git clone https://github.com/threestudio-project/threestudio.git
 cd threestudio
  • 仮想環境を作成
python -m venv venv
.\venv\Scripts\activate
  • ライブラリのインストール
    • インストール前に環境変数のパスに「C:\Program Files (x86)\Microsoft Visual Studio\2019\Community\VC\Tools\MSVC\14.29.30133\bin\Hostx64\x64」が設定されている場合、一時削除しないと「tiny-cuda-nn」のインストールに失敗する。
python -m pip install pip==23.0.1
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121
pip install ninja
pip install -r requirements.txt
# インストールに約20分くらいかかる

モデルのダウンロード

stabilityai/stable-zero123 at main

  • 上記リンクから「stable_zero123.ckpt」をダウンロードし、「load/zero123」に配置。

実行

画像の用意

  • 3Dモデルを作成する画像を用意

  • 用意した画像を「load/images」に配置

学習の実行

  • 以下のコマンドで学習を実行を開始
python launch.py --config configs/stable-zero123.yaml --train --gpu 0 data.image_path=./load/images/dog_rgba.png

学習結果

  • 20時間で学習が完了(600Step)