シンギュラリティ実験ノート

購入した1000ドルPCで何がどこまでできるのか実験した記録です。

生成AI-言語処理AI

Claudeは数独パズルを論理的に解けるか

Claude Codeを使うためにClaude Proを契約した。これによりデスクトップからSonnet4.6以外にOpus4.6も使えるようになった。 有料のクラウドAIを使えるようになったので以前から気になっていた「最新のクラウドAIは数独パズルを論理的に解けるのか」という疑…

Qwen3.5 27Bを内蔵GPUで試す

久しぶりにUbuntu環境でLM-Studio(0.4.6)を動かしたところ内蔵GPUの使用ありでもgpt-oss-20Bをロードできることが分かった。 LM-Studioの設定画面でHardwareを表示するとGPUのVRAMが26.28GBと表示されている。 BIOS設定上ではVRAMは16GBなのに何故26GBも使…

天才プログラマ金子勇氏のサンプルプログラムAnimeBodyを再現する

Claude Proを契約してClaude Codeが使えるようになった。自分では難しいプログラミングをClaude Codeにやらせてみたい。そう思った時に以前に金子勇氏のNekoFlight for javaを動かしたことを思い出した。 天才プログラマ金子勇氏のサンプルプログラムNekoFli…

共通テスト2026地理の1問目だけAIに解かせてみた

前回は数IAの1問目だけを試した。クラウドAIのChatGPT、Gemini3、Sonnet4.5ではおよそ80%の正解率だった。今回は地理の問題を試すことにした。地理の問題では当然ながら地図などの図を使った問題が出題されるので画像認識能力も試されることになる。 クラ…

共通テスト数学I・数学Aの問題をAIに解かせてみた

AIが大学入試の2026年共通テスト問題に挑戦し9科目で満点をとったというXのポストがあった。 17〜18日実施の大学入学共通テストに挑戦した米オープンAIの最新AIモデルが、主要15科目のうち9科目で満点を取ったことが分かりました。大学入学共通テスト、Open…

相続税の計算をAIにやらせてみた

相続税の申告手続きは素人には難しく税理士に任せるケースが多いと思う。 しかし税理士に頼む前に相続税の計算を概算で把握しておくことは大切だ。 相続税の計算を間違って理解し、相続の前提条件を間違えると、勘違いと思い違いによりまとまる話もまとまら…

ベネズエラの通貨がどうなっているのか分析してみた

ベネズエラとアメリカが大変な事になっている。アメリカの武力行使が国際法から見て正当化できるのかといった政治的なことをここで書くつもりはないが、ベネズエラが経済的にどうなっているのかについては興味がある。 政治的に不安定で治安も最悪な国の経済…

Mac mini M4でgpt-oss-20Bを動かした場合の性能

以前に新Mac miniでLLMを動かした場合の性能という記事を書いたところ私のブログでの人気記事になっている。記事ではMac mini M4 Proの性能をUM790 Proを基準に予測した。生成速度で4倍、プロンプト評価速度で6倍というのが私の予測だった。 手元にあるの…

クラスタ化したミニPCで大型LLMは動くか

Discordを久しぶりに眺めていたらMINISFORUMの公式チャンネル内で10月24日に以下の投稿があった。 We did it!Our 4× MS-S1 MAX AI Cluster successfully ran the DeepSeek-R1 671B (Q4) large language model — fully local, no internet connection. MS-S1…

Kimi K2 Thinkingは数独パズルを解けるか

Kimi K2 Thinkingがオープンソースとして公開された。1兆パラメタもあるのでローカル環境で動かすことは不可能だ。幸いにしてKimi.comにID(メールアドレス)を登録しサインインして試すことができる。私が今回試したのは数独パズルである。 本ブログでも数…

Qwen3-Coder-30B-A3BでHeptagonを試す

Qwen3-Coder-30B-A3Bのコーディング能力を試すため、Heptagonをやらせてみた。Heptagonとは回転する七角形の中で弾む20個のボールをシミュレートするプログラムのことだ。 結果がビジュアルに現れ、出来不出来がわかり易いので私は好んでこのテーマを使って…

Qwen3-coderでNekoFlightのJavaScript版を作成

Qwen3-coderのunsloth版が7/22に公開されたので我が1000ドルPCでも試している。 480B-A35Bは少なくとも150GBのユニファイドメモリがないと動かない。私が試したのは30B-A3Bである。こちらは33GBのRAMがあれば動く。 NekoFlightのオリジナルは30年近く前に作…

NekoFlight for javaをWSLで動かす

NekoFlight for javaはWindowsでもjavaが動く環境さえあれば動かすことができる。 WSL環境にjavaを導入してNekoFlight for javaを動かした。ニーズがあるかどうか分からないが、javaとNekoFlight for javaの導入手順を紹介したい。 なお、前提としてWindows…

天才プログラマ金子勇氏のサンプルプログラムNekoFlight for javaを再現する

Winny作者として知られる金子勇氏であるが、知る人ぞ知る天才プログラマーであった。Winnyが世間で騒がれた当時は知らなかったが、映画「Winny」を見た後で金子勇氏の才能について私もようやく知るようになった。 金子氏の過去のホームページは亡くなられた…

Llama4 Scoutのマルチモーダルを試してみた

Redditのr/LocalLLaMAを眺めていたらまた面白そうなネタがあった。 Can your favourite local model solve this? 比較的簡単な幾何学の問題をローカルLLMで解くことができるかというテーマである。 図の三角形のxの角度を求めよという問題だ。画像を理解でき…

Llama4 ScoutでIn-context Learningを試してみた

最近、ローカルLLMを使わずにクラウドLLM(gemini2.5Proなどの大型LLM)を使うことが多くなった。難しいプログラムになるとローカルLLM(30B〜70Bクラス)には難しく、まともに動くプログラムができなかったからだ。 しかし本ブログのテーマは「1000ドルPCで…

AIによる準天頂軌道シミュレーションプログラムの作成(結果発表)

前回、準天頂軌道を衛星が周回する様子をシミュレーションするプログラムをAI(gemini2.5pro)に作成してもらった。 この時のプロンプトを使い、私が現在利用できる他の代表的なAIで正しくシミュレーションプログラムが作成できるか試してみた。今回はその結…

準天頂衛星みちびきの軌道シミュレーションプログラム

JAXAのH3ロケット打ち上げ成功物語に感動した。JAXAで働く方達に敬意を表すとともに、その仕事の難しさを自分も少しだけ疑似体験してみたいと思った。 今回私が選んだテーマはタイトルに書いた通り、準天頂衛星みちびきの軌道シミュレーションプログラムの作…

AIは簿記3級の試験問題を解けるか

暇だったのでAIに簿記3級の試験問題を解かせてみた。 Grok3に描いてもらいました 仕分けの問題 簿記3級の試験問題は第1問が仕分け、第2問が各種台帳への記帳、第3問が決算処理というのが一般的パターンだったと思う。 まずは小手調べに仕分けをやらせて…

AIによる剛体シミュレーションプログラムの作成(結果発表)

様々なAIで「回転する七角形の中で跳ねる20個のボール」をシミュレーションするPythonプログラムを作らせてみた。主な結果をここにまとめておきたい。 Blenderというソフトではこの種のシミュレーションを「剛体シミュレーション」と呼ぶらしい。Blenderでは…

多角形の中で弾むボールのシミューレーションプログラム(その後)

AIが作成してくれたシミュレーションプログラムでボールを眺めていると、商店街の抽選会で使われるガラガラと回す”アレ”を思い出した。”アレ”の名前は何だろうと重い調べてみたら正式名称は「新井式回転抽選器」という。「ガラガラ」または「ガラポン」は俗…

Qwen3-235Bのコーディング能力を検証してみた

Qwen3がリリースされたので試してみた。 私が試したのは「回転する七角形の中で跳ねる20個のボール」のシミュレーションだ。このテーマはボールの重力による落下、壁との衝突、ボール同士の衝突や摩擦による回転などを考慮する必要があり、かなり難易度が高…

多角形の中で弾むボールのシミューレーションプログラム

redditを眺めていたら面白い投稿を見つけた。「回転する七角形の中で跳ねる20個のボール」をシミュレーションするプログラムを様々なLLMに作らせた結果が報告されていた。 Added GPT-4.1, Gemini-2.5-Pro, DeepSeek-V3-0324 etc... 同じ内容がXにもポストさ…

相互関税による世界経済への影響をAIに聞いてみた

トランプ大統領による相互関税の発動で世界経済に大きな影響が出ている。株価も大きく下落し、日経平均株価は4月9日時点で31,714円となり約1年半前のレベルに戻っている。 これから世界経済はどうなるのか。AIに聞いてみたいと思った。しかし普通に「これ…

gemma3 導入に必要となるソフトウエア更新の手順(Ubuntu編)

軽量で高性能なLLMであるgemma3を導入した。導入にあたってはソフトウエアのバージョンアップが必要だった。今後も必要になることがあると思うのでバージョンアップ手順をメモしておきたい。 なお、ソフトウエアとは、Ollama+Open WebUI、LM-Studio、llama.c…

llama.cppでGPUを使ってLLMを動かす(Windows編)とその顛末

先日はUbuntu環境でllama.cppを使ってGPUに乗せるレイヤー数を指定してLLMを動かす方法を紹介した。今回はWindows環境で同様にレイヤー数を調整してGPUとCPUを同時に使ってLLMを動かす様子を紹介したい、と思っていた。 が、しか~し、 GPUにオフロードする…

llama.cppでGPUを使ってLLMを動かす方法(Ubuntu編)

DeepSeek-R1 Dynamic 1.58-bitを試すため、先日初めてllama.cppを導入した。NvidiaのGPUがないためCUDAのオプションをOFFにすることでCPUのみで動作させることができた。 llama.cppのGitHubの説明(README)によると、llama.cppは様々なデバイス(GPUやNPU)…

ミニPCでDeepSeek-R1の1.58bit版を動かしてみた

DeepSeek-R1の1.58bit版は、量子化しているとはいえモデルサイズは131GBもある。本来の性能を発揮させるには160GBのメモリが必要だそうだ。20GBのメモリとCPUさえあればとりあえず動くのだが、遅すぎて実用的ではないということらしい。遅くてもいいので…

フラクタル図形を描くプログラムをLLMに作らせてみた

フラクタル図形(マンデルブロ集合)を描くプログラムをLLMに作らせてみた。 いきなりだがマンデルブロ集合は以下の数式で定義される。 が無限大に発散しないという条件に当てはまる複素数 の集合をマンデルブロ集合という。 一見シンプルな数式だが、 で が…

DeepSeek-R1の蒸留版を試す

DeepSeek-R1の蒸留版が私の環境でも動くようになった。OpenAI o1と同程度の性能と言われるほどなのでいろいろ試している。 暗号を解かせてみた o1のプレビュー版が公開された時の説明資料に「Chain of Thought」の概念の説明があり、そこで「Chain of Though…