シンギュラリティ実験ノート

購入した1000ドルPCで何がどこまでできるのか実験した記録です。

2024-11-01から1ヶ月間の記事一覧

LLMはチェスでStockfishに勝てるか(その後)

LLMにチェスをプレイさせるとどれくらい強いのか、という話題で興味深い記事があった。その記事の内容と私が追試した結果についてメモしておきたい。 参考にした記事 GIGAZINEの記事によると、『大規模言語モデルをチェスの標準的なAIと対戦させた結果、多く…

Llama3.1-8Bで動く将棋AIを作ってみた

LLMで動くUSIプロトコルの将棋エンジン(将棋AI)を作ってみた。作成の基本方針は先日の記事の通りである。使用したモデルはLlama3.1-8Bでollamaを介して動かしている。 RAG機能と言っていいのか分からないが、テキストファイルに「SFEN形式の説明」と「序盤…

Llama3.1-8Bと将棋を指してみた

LLM(大規模言語モデル)を使ってチェスができるなら将棋だってできるだろう。そう思って試してみることにした。LLMで動くUSIプロトコルの将棋エンジン(将棋AI)を作るというのが、今回の最終的な目標である。 基本方針 先日の記事では、LLMとチェスAI(Stoc…

70BのLLMはチェスでStockfishに勝てるか

8BのLLMでStockfishとチェスの対局をさせたところ全く歯が立たなかったのは先日の記事の通りである。では70BのLLMではどうなるのか。 GroqのOpenAIのI/FでLlama3.1-70BとつないでStockfishと対局させてみた。結論から言うと、70Bのモデルでも8Bのモデ…

LLMはチェスでStockfishに勝てるか

redditを眺めていたら気になる投稿があった。「What Happens When LLMs Play Chess? And the Implications for AGI」というタイトルだった。LLMにチェスをプレイさせるとどうなるか、という内容のようだ。著者のブログにはStockfishと複数のLLMのELOレーティ…

将棋AIの性能向上の歴史(その2)

dlshogi作者の山岡忠夫氏がブログにて最新のdlshogiがレーティングでどれくらい強くなっているのかを公開した。 それによると、3年前の「第2回世界将棋AI電竜戦エキシビジョンVer」に対して最新モデル(探索なし方策のみ)はレーティングで+395.1強いことを…

Open WebUIでOllamaを使ったらすごく便利だった

あるブログ記事を見ていて、Open WebUIを使うとClaude 3.5で動くArtifactsと同じ機能が使えることを知った。Artifactsについてはよく知らないが、AIにコーディングさせた結果を画面上ですぐに確認できる機能のようだ。一度使ってみたかったので導入してみる…

新Mac miniでLLMを動かした場合の性能

新しいMac miniが予約開始となった。ミニPC好きの私としてはこの新Mac miniでLLMを動かした場合の性能に興味がある。新Mac miniのM4 Proで8Bクラスおよび70BクラスのLLMを動かした場合の性能を見積もり、我が1000ドルPCと比較してみたい。 Mac mini M4 Pr…