マイニングがオワコン化し、ビデオカードが大変安く購入できるようになりました。
RTX3090が9万円以下で購入できましたので、過去にもっていたグラボと電力効率を比較します。
GDDR6XのVRAM24GBが9万円で手に入るのは安すぎる!!
Real-ESR GANの電力効率曲線
Real-ESRGANは、画像をAIできれいに拡大できる超解像ソフト、VulkanAPIで動作しているようです。
テスト内容の詳細
- 以下は1280×720の画像を4倍に拡大したときのフレームレートを計測しています。
- アルゴリズムは[realesrgan-x4plus-anime]です。
- パワーリミットはMSI Afterburnerを使用し、最小電力~100%までの電力制限を1%刻みで測定しています。
- 測定はPyAutoGUIで完全に自動化しています。
- Excelの多項式近似機能でシンプルに表示しています。
- 基本的に15枚の平均速度、RTX3090では60枚の平均速度から電力効率を算出しています。(速すぎて誤差が大きいと判断したため)
縦軸を固定して見ると同じ消費電力のときの性能、横軸を固定して見ると同じ性能のときの消費電力が一目でわかります。
また、グラフ左上にあるほど電力効率が優れています。
消費電力と電力効率を表しています。
グラボをチューニングされるときにお使いください。
考察
GTX1660Ti,RTX2070SuperはTSMCの12FFN、RTX3090はSamsungの8Nで製造されています。
プロセスルールの数字が細かいのはSamsung 8Nである一方で、最高の電力効率はASUS DUAL-RTX2070S-O8G-EVOに最大の電力制限(58%)をかけたときでした。
TSMCの電力効率の優秀さがよくわかりますね。GeekerWan氏の動画にある通り、電力効率においてはSAMSUNGは遅れているようです。
最初12nmから8nmになって、電力効率めっちゃ上がるんじゃないかと思ってたんですが、そうではなかったことが明らかになりました。
プロセス | トランジスタ密度 |
---|---|
TSMC 12FFN(GTX16xx,RTX20xx) | 24.7 MTr/mm2 |
Samsung 8N(RTX30xx) | 45.1 MTr/mm2 |
12FFN→8Nでトランジスタ密度は約1.8倍に向上していますが、電力効率はほぼ改善しないどころかむしろ下がっています。また、8NのNはnmのNじゃなくてNvidiaのNなようです。
あと、どうやら8Nプロセス(8nmプロセス)だからといってどこかの長さが8nmというわけではなく、トランジスタ密度を相対的に表してわかりやすくした数値のようです。これ初めて聞いたとき、すごく納得しました。商品名みたいなもんですかね。
Intelがnm表記(14nm++++++++)から、Intel 7のような表記に移行したのも納得がいきます。
安くて高性能を目指すために、ある程度電力効率は犠牲にしたのでしょうか?
TSMC 4NのRTX40xx系も是非とも電力効率曲線を作成したいところですが、そんなお金ない…
参考
コメント