Gradient Checkpointing

Stable Diffusionの学習速度をいろいろ比較する

タイトルの通り比較します。バッチサイズはなるべく大きい値にする WD1-5を対象にする（SD1.x系はもっと遅くなります） nvidia-smiを適当にうちこんでVRAM使用量を記録しますプログレスバーの時間をそのまま記録します samples/秒は1秒で何枚学習できるかと ...

GitHub

Efficient Gradient Checkpointing for Memory-Constrained Deep Learning

This repository contains a Jupyter notebook (Efficient Gradient Checkpointing.ipynb) that demonstrates gradient checkpointing in PyTorch to reduce GPU memory usage during training of large models. It ...

note

Stable Diffusion学習のVRAM使用量を調査する

調査に使う学習コードは疑似的に作成したものになります。画像データ等は使わず、ランダムなテンソルをネットワークに入力します。VAEは使いません。共通設定を以下のようにします。モデル：Stable-Diffusion-v1.5 これを基本設定として、ある項目を変えて ...

GitHub

Multi-GPU Training with DP or DDP combined with reentrant gradient checkpointing dies at ...

As a precision: setting gradient_checkpointing_kwargs to {"use_reentrant":False} works, but I think. the default settings (which are to use the reentrant variant of checkpointing) should work. I am ...

一部の結果でアクセス不可の可能性があるため、非表示になっています。

アクセス不可の結果を表示する