シンギュラリティ実験ノート

購入した1000ドルPCで何がどこまでできるのか実験した記録です。

MINISFORUM UM790 Pro を購入した理由

約10年ぶりにPCを購入したので、その経緯と選定理由について書きたい。

経緯

これまで私が使用してきたマシンはMac mini(Late2012)である。このMac miniインテル系CPU(i5-3210M 2.5GHzデュアルコア)でGPUもなくメモリは4GBしか積んでいない。こいつに何年か前からpythonをインストールして機械学習のサンプルソフトを動かすことから始め、次に将棋AIのソフトをインストールして遊んでいた。GPUがないのでCPUでの動作になるが、DeepLearning系将棋AIのdlshogiやふかうら王をインストールして動作までもっていくのは苦労したが楽しい作業であった。しかしいかんせん性能が低い。最新のGPUで動作させた場合と比べると2桁以上性能が低いのである。

ちなみにMac mini(Late2012)のコンピューティング能力は80GFLOPSである。

選定理由

当初、NVIDIAGPUを搭載したPCを検討した。GPUでDeepLearningのソフトを動かそうとするとNVIDIAGPUを使うことがデファクトとなっているからだ。NVIDIAは早くからCUDA、cuDNNといったライブラリや、TensorRTと言う性能のよいニューラルネットワーク推論ライブラリを提供しており、AI分野で顧客囲い込みに成功している。わたし的にはこの状況はStableDiffusionが出たころまでは続いていた。しかし大規模言語モデル(LLM)が2023年に次々と現れた頃から状況が変化してきた。これまでGPUボードに搭載されるVRAMは8GB程度で、StableDiffusionであれば8GBのVRAMにモデルを展開して動かすことができる。しかし大規模言語モデルになると最低でもモデルは30億パラメタとなり、1パラメタを32ビット浮動小数点(4バイト)とすると、30億(=3ギガ)パラメタは3G×4Bで12GBのVRAMを必要とする。つまりこれまでのGPUではメモリ不足で動作しないのである。

このVRAM容量問題のおかげで、私はGPUは当然あった方がよいが、むしろ高性能なCPUとCPU用に大量のメモリを積んだPCの方が良いのではないか、スピードは遅いとしても大規模言語モデルをCPUで動かすことができるのではないか、と考えるようになった。

そんな時に目にしたのがMINISFORUMが2023年のおそらくクリスマスころから初めていたセールであった。UM790 Pro 64GBメモリ 1TB SSDで定価153,980円が116,980円となっていたのである。高性能なMINI PCとして着目していた商品である。早速年末12月29日に注文し、年明けの1月8日にこれを入手した。(出荷を知らせるメールが届かず心配になりサポートに問い合わせたところ、Yahooメールが何故かブロックされいただけで出荷は正常にされていたらしく、問い合わせした翌日に届けられた)

UM790 Proが搭載するGPUはRadeon780Mで理論性能は8.12TFLOPSとなっている。Mac mini(Late2012)の性能の100倍である。CPUはpassmarkというベンチマークで比較するとMac mini(Late2012)が2471、Ryzen9 7940HSが30995で約12.5倍である。

余談

このPCの購入を決定したもう一つの大きな要因は、「1000ドルPC」だったことである。「1000ドルPC」という言葉は、レイ・カーツワイル氏の著書「シンギュラリティは近い」の中に登場する。いわゆる廉価版PCの代名詞である。カーツワイル氏は2005年に発表されたこの著書の第3章の中で「人間の知能レベルに到達するために必要なコンピューティングとメモリの量を分析し、20年以内(つまり2025年まで)に廉価なコンピュータで、その水準に到達できる」と考える理由を述べている。その前提として人間の脳の能力を10の16乗CPSCPSは1秒あたりの計算回数)と見積り、「1000ドルPC」がこの性能に達する時期を2025年と予測している。

UM790 ProはGPUで8TFLOPS、CPUが平行動作できるとしてGPUの1/4の性能があると仮定すると10TFLOPS。これは10の13乗CPSに相当するので、現時点ではカーツワイル氏の予測の1000分の1の能力となる。

人間の脳の能力にはまだ届かないが、この「1000ドルPC」で何がどこまでできるのか実験してみたいと思っている。