2024-01-01から1年間の記事一覧
8BのLLMでStockfishとチェスの対局をさせたところ全く歯が立たなかったのは先日の記事の通りである。では70BのLLMではどうなるのか。 GroqのOpenAIのI/FでLlama3.1-70BとつないでStockfishと対局させてみた。結論から言うと、70Bのモデルでも8Bのモデ…
redditを眺めていたら気になる投稿があった。「What Happens When LLMs Play Chess? And the Implications for AGI」というタイトルだった。LLMにチェスをプレイさせるとどうなるか、という内容のようだ。著者のブログにはStockfishと複数のLLMのELOレーティ…
dlshogi作者の山岡忠夫氏がブログにて最新のdlshogiがレーティングでどれくらい強くなっているのかを公開した。 それによると、3年前の「第2回世界将棋AI電竜戦エキシビジョンVer」に対して最新モデル(探索なし方策のみ)はレーティングで+395.1強いことを…
あるブログ記事を見ていて、Open WebUIを使うとClaude 3.5で動くArtifactsと同じ機能が使えることを知った。Artifactsについてはよく知らないが、AIにコーディングさせた結果を画面上ですぐに確認できる機能のようだ。一度使ってみたかったので導入してみる…
新しいMac miniが予約開始となった。ミニPC好きの私としてはこの新Mac miniでLLMを動かした場合の性能に興味がある。新Mac miniのM4 Proで8Bクラスおよび70BクラスのLLMを動かした場合の性能を見積もり、我が1000ドルPCと比較してみたい。 Mac mini M4 Pr…
ブログのサイドバーに「注目記事」を表示するようにした。直近のアクセスでアクセス数の多い記事が表示される。これを見るとブログ開設当時に書いた2つの記事が常に1位、2位となっている。Googleで「ROCm」と検索すると1位の「AMD ROCmを使うことで何が…
MicrosoftからBitNetのLlama 8B版が公開された。CPUのみで爆速で動くことが特徴。GPUが不要なので省エネになるし、モバイル端末でも使えるようになることが期待できるらしい。我が1000ドルPCでも動くのか試してみた。 導入方法 導入先環境はUbuntu 22.04…
Nvidiaが「Llama-3.1-Nemotron-70B-Instruct」(以下Nemotron-70B)を公開した。一部のベンチマークではOpenAIのGPT-4oやAnthropicのClaude 3.5 Sonnetを上回るらしいので、早速試してみることにした。 「ストロベリー問題」と言って、これまでGPT-4oやClaud…
「AIエージェント」を作ってみたいと思っていた。私が欲しいAIエージェントは、アプリ導入時に発生したトラブルの解決策を見つけてくれるAIエージェントである。この場合の作業タスクは以下のようになる。 エラーメッセージからキーワードを見つける キーワ…
増設SSDに作業環境をほぼ移行できたので、もともとのSSDにあったWindows11を再インストールすることにした(以下「インストール」を「導入」という)。最近は短い時間に何度もブルー画面が出るくらいWindows環境が不安定になっていた。 個人的に作成したメモ…
AIに関する記事を読んでいると「進化的アルゴリズム」という言葉をよく見かける。また似たような言葉で「進化的プログラミング(または遺伝的プログラミング)」というのも見かける。それぞれどのような概念で、どのような違いがあるのか。私は全く分かって…
Anthropic CEOのダリオ・アモデイ氏が「Machines of Loving Grace(愛しき恩寵の機械たち)」という格調高いタイトルのエッセイを公開した。 Machines of Loving Grace 要約 Machines of Loving Grace: my essay on how AI could transform the world for th…
新しいキーボードを購入した。Corsairの「K65 RGB MINI」という機種である。 Amazonのタイムセールで価格18,754円のところ11,812円で購入した。 CORSAIR USB-A K65 RGB MINI CherryMX SPEED 日本レイアウト ゲーミングキーボード CH-9194014-JP Corsair Amaz…
UbuntuにROCmを導入するとGoogle Chromeが起動できなくなった。この問題の対応方法をメモしておきたい。 Chromeが動かなくてもFirefoxとか他のブラウザ使えばいいだろうと思われるかもしれないが、私はChromeのブックマークでWindowsやMacとブックマークを…
これまでUSB接続の2.5インチHDDにUbuntuを入れていたため、Ubuntuを立ち上げるだけで数分かかっていた。せっかくSSDを増設できる内臓スロットがあるのでSSDを増設し、ここにUbuntuでのLLM環境を構築することにした。 SSDの購入 Amazonで1TBのSSDを購入した。…
孫正義氏がSoftbank World 2024の講演で「超知性」について語った。10月7日から配信される動画を見ないと詳細は分からないが、レポートがネットに掲載されているのでおおよその内容は現時点でも知ることができる。 孫さんは冒頭で以下のように述べている(ら…
Ubuntu 22.04でEmacs29をビルドし、EllamaというElispパッケージの導入に成功した。導入方法と使用してみた感想などをメモしておきたい。まだ使い込んでいないのと、非常にマニアックな環境なため強くオススメはできないが、ローカルLLM実行環境としては最強…
OllamaをWindowsのWSL2環境に導入した。更にLM-StudioでダウンロードしてあるLlama3-ELYZA-JP-8Bの量子化済みモデルを変換してOllamaから使えるようにしてみた。 Ollamaの導入(Windows-WSL2環境) 最近はWindows(Preview)版もあるのだが、練習をかねてLin…
以前の記事で、Tanuki-8x8Bのオリジナル版が動く環境について調べた。96GBのVRAMが必要で400万円クラスのマシンが必要であることが分かった。 今回は、Tanuki-8x8Bの量子化版、あるいは70B(700億パラメタ)クラスのLLMがローカルで快適に使える環境について…
OpenAIのサム・アルトマンCEOが「The Intelligence Age」と題する記事を公開し、「数千日以内に超知能(superintelligence)が誕生するかもしれない」と述べた。 superintelligenceとは、つまりArtificial Super Itelligence(ASI:人工超知能)のことであろ…
OpneAIがOpneAI o1を発表し、課金ユーザにのみ開放した。 GPT-4oよりも数学とコーディングの能力が優れていて、数学オリンピックの問題も解けるらしい。数独パズルも解いたというXのポストを見た時は、ついにここまで来たかと正直おどろいた。 数独の問題を…
Colab Proの高性能GPUを使ってdlshogi(DeepLearning系将棋AI)を動かすとNPS値がどれくらい上がり、ELOレーティングがどれくらい上がるのか試してみた。 A100 GPUの性能 使用したA100 GPUの性能は、GoogleのAIのGemini1.5Proの回答によると以下の通り。 A10…
DeepLearning系の将棋AIの本来の強さを知るためには、NVIDIA製GPUと高性能な推論ランタイムライブラリであるTensorRTの環境が必要である、ということは先日の記事で書いた通りだ。 そこで今更ではあるが、dlshogiと水匠5をColab環境の有料版にインストールし…
Tanuki-8x8Bのオリジナル版のモデルサイズは94~95GBくらいある。このサイズになると通常のPCクラスでは動かすことができない。そこでColab ProのようなクラウドのGPUを借りることになる。しかしワークステーションと呼ばれるクラスのマシンを購入すればロー…
せっかくColab Proが使えるようになったので、ローカルPCでは動かせないような大規模言語モデルを動かしてみたい。そこで選んだのが東大松尾・岩澤研が最近発表したTanuki-8x8Bである。8x8Bとは公開ページの説明によると「8Bモデルを8つに複製し、それぞれを…
DeepLearning系の将棋AIを十分な性能のGPUで動かしたい時に、Google Colab Pro(以下、Colab Pro)が使えそうだと思った。支払い方法が気になるのでそこから調べたところ、Googleアカウントに登録した支払い方法がColab Proの支払いに使われることが分かった…
GPU性能は将棋AIの強さに影響する。dlshogiのようなDeepLearning系の将棋AIソフトに本来の強さを発揮させるには、最低でも20~30万円クラスのゲーミングPCの能力が必要と言われている。我が1000ドルPCでもdlshogiは内蔵GPU+onnxruntime版で動いているのだが…
AIと言葉だけで遊ぶゲームができたら面白いと思う。前回、AI(Llama3.1-8B)と「しりとり遊び」をしてみたが、うまく続かなかった。「まんが」というと、AIの中では「MANGA」となり最後の1文字を「A」と認識するようだった。 しかしAIは人と会話した流れを…
AIが日本語音声応答してくれるPythonスクリプトを作成した。PythonのOpneAIライブラリを使うことでAIの処理と音声合成の処理を比較的簡単に並列処理させることができた。これにより、これまでのようにAIが回答し終わるまで待つことなく、回答し始めたら適切…
Llama3.1の軽量サイズ(80億パラメタ)を1000ドルPCで動かし、どの程度まともな会話ができるのかを実験してみた。ある程度の応答速度が得られるなら、ローカルPC上で音声認識ー>AI推論ー>音声合成まで行う会話アプリを実装したい、というのが私の野望だ。…