RTX2060 12GBでStableDiffusionの生成速度が16倍に!

昨年から大流行のStableDiffusionですが、GoogleColabを課金して利用したり、自宅PCにもインストールして使っていましたが、やっぱり不便です。何がと言えば、

  • GoogleColabはランタイムを再接続して最初からインストールし直さないと上手く動かないことが多々ある。
  • 自宅PCはとにかく生成が遅い。

ってことです。

特にGoogleColabの場合は課金すれば多少は連続使用できるかと思っていましたがアイドル時間の制限もあるし、連続使用も制限もある。で、ある程度の閾値を超えると初期化して最初からインストールし直さないとダメってことで、自分の使い方が悪いのかもしれませんが、これではStableDiffusionのインストールをしている待ち時間のほうが長い気がしてしまって、使いたいときにすぐ使えません。

自宅PCはグラボがGeForce GTX 1650 OCなんで、VRAMも4GBです。
Stable Diffusion web UI(AUTOMATIC1111版)がかろうじて動くものの、生成が遅く、様々なプロンプトを試すというのには向いてません。

それでも、一度上手くいったプロンプトで、夜間に大量に画像を生成する、ということであれば使えなくもないのですが、いったん512×512の解像度で生成してからアップスケールしようとすると当然遅い&上手く動いてくれないということもあるので、おとなしくグラボを買い替えることにしました。

さすがに最新モデルは無理なので、コスパ重視でグラボを探す

買い替え候補としては30000円台でできるだけ高性能。となると当然中古で、RTX2060 or RTX3060あたりが候補になりました。どちらもVRAM12GB版があるため、このどちらかを入手するため、探し始めました。

結果としてRTX2060 12GBのグラボを34000円で入手でき、さっそく生成速度を比較したのですが、これがもう十分早いです。

GTX1650 vs RTX2060の画像生成速度対決の結果

GTX1650(VRAM 4GB)
Steps: 20, Sampler: DPM++ SDE Karras, CFG scale: 7, Seed: 4258044796, Size: 512×768, Model hash: b581904c9b, Model: chilled_re-generic_v2

Time taken: 2m 44.39s
Torch active/reserved: 2676/3206 MiB, Sys VRAM: 4096/4096 MiB (100.0%)

RTX2060(VRAM12GB)

Steps: 20, Sampler: DPM++ SDE Karras, CFG scale: 7, Seed: 1280329040, Size: 512×768, Model hash: b581904c9b, Model: chilled_re-generic_v2

Time taken: 10.37s
Torch active/reserved: 2899/4050 MiB, Sys VRAM: 5975/12288 MiB (48.62%)

ということでどうでしょう!
生成した画像がどれだったかわからなくなってしまったので表示できないのが恐縮ですが、ここに記載していないプロンプトも含め、生成条件は同じ、ということだけ理解してもらえばいいと思います。

肝心なのはその速度。2分44秒かかっていたのが10秒ちょっとです。約16倍の速さって。。。
いやマジでGoogleColabでちまちまやってる場合じゃなかった。確かに高額出費ではありますし、PS5も欲しかったけど(笑)、我慢してグラボを買って大正解でした。

ちなみに、ほかの方が記載されている記事を見てもそこまで差はない人もいましたので、プロンプトやPCの構成などで違いがあるのかもしれません。
この結果だけを鵜呑みにしないほうがいいですが、速くなることは間違いないですし、速さは力だな、と思いました。


最後に、一応同じグラボが新品でも売っていたのでご紹介しておきます。

MSI-GeForce-RTX-2060-VENTUS

サーバ・PC・ネットワークカテゴリの最新記事