テク×てくブログ

Stable Zero123をWindow11で動かす

AI

概要
環境
セットアップ
- threestudioをインストール
- モデルのダウンロード
実行

概要

Stabily.aiが出した最新の3D生成モデルである「Stable Zero123」を Window11のローカル環境で動かしてみた。

Stable Zero123 のご紹介: 単一画像からの高品質3Dオブジェクト生成 — Stability AI Japan

環境

OS : Windows11
GPU : NVIDIA GeForce RTX 3080Ti
Python : 3.10.6

セットアップ

threestudioをインストール

リポジトリをクローン

 git clone https://github.com/threestudio-project/threestudio.git
 cd threestudio

仮想環境を作成

python -m venv venv
.\venv\Scripts\activate

ライブラリのインストール
- インストール前に環境変数のパスに「C:\Program Files (x86)\Microsoft Visual Studio\2019\Community\VC\Tools\MSVC\14.29.30133\bin\Hostx64\x64」が設定されている場合、一時削除しないと「tiny-cuda-nn」のインストールに失敗する。

python -m pip install pip==23.0.1
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121
pip install ninja
pip install -r requirements.txt
# インストールに約20分くらいかかる

モデルのダウンロード

stabilityai/stable-zero123 at main

上記リンクから「stable_zero123.ckpt」をダウンロードし、「load/zero123」に配置。

実行

画像の用意

3Dモデルを作成する画像を用意
用意した画像を「load/images」に配置

学習の実行

以下のコマンドで学習を実行を開始

python launch.py --config configs/stable-zero123.yaml --train --gpu 0 data.image_path=./load/images/dog_rgba.png

学習結果

20時間で学習が完了(600Step)