AIプログラムの開発演習に使う低消費リソースローカルLLMはQwen3 1.7B Q4がベスト

LLM

AIプログラムの開発、つまり、AIにコードを書かせるのではなくて、LLMを呼び出したりRAGを実装したりエージェントを作ったりといったAIを組み込むプログラミングの演習をしたいときに、参加者のPCに十分なリソースを前提とできないことは多いと思います。 Ja…

2025-08-27

AIコーディングエージェントは100倍速くなる

CerebrasがQwen3 Coderのホストをして2000tok/secを出してるという話があって、試したいなぁと思ってたのですよ。 Qwen3 Coder 480B is Live on Cerebras ただ、$50/monや$200/monの定額プランは早々に売り切れ。けど、1M tok/dayまで無料という噂を聞いて…

2025-08-23

LLMで実現されたデザインパターンの夢

GoFの「デザインパターン」の「終わりに」という章の「終わりに」という項は次のようになっています。もっとも良い設計は、全体がたくさんのデザインパターンをぴったりとつなぎ合わせて、組み合わせてできているものである GoFのデザインパターンのコンセ…

2025-08-15

AIに激詰めしてしまうのはAIだからじゃなく、そのくらい言わないとわからなそうだから

AI

みなさん、AIコーディングしてますか？そうですよね、やってますよね。みなさん、AIに激詰めしてますか？罵声あびせてますか？やってますよね。「おめーは何回いえばわかるんだ」みたいなことを、そんなこと書いても意味ないとわかってるのにやってしまい…

2025-08-13

GPUメモリ4GBあればGPT-oss 20Bが14tok/secで動く

LLM

llama.cppにMoEに適したCPU/GPUの振り分けのオプションが入って、LM Studioでもそのオプションに対応したことによって、MoEモデルであるGPT-ossが少ないGPUメモリでもそれなりに動くようになりました。拡大するとわかりますが、LM Studioの右下の表示による…

2025-08-11

GPT-5とClaude Sonnet 4でコーディング比較。ChatGPTはツールとして使い物にならない

ChatGPT AI

GPT-5が出ましたね。コーディング能力もめっちゃあがってる！みたいなことが書いてあるので、いろいろ試してみました。開発者向け GPT-5 のご紹介 | OpenAI 結論を書いておくと、GPT-5のコーディング能力は確かにあがってSonnet 4と同等くらいになってるけ…

2025-08-08

「JavaでAIプログラミングをはじめよう」という短期連載をgihyo.jpで出しました

AI java

技評さんのサイトで「JavaでAIプログラミングをはじめよう」という短期連載をやってました。 LLMを動かして接続してRAGやMCPも組んでひととおりやってみるという連載になってます。 JavaでAIプログラミングをはじめよう記事一覧 | gihyo.jp ● 初回は、LM St…

2025-08-06

OpenAIのオープンモデルGPT-oss 20Bがすごすぎる

AI ChatGPT LLM

OpenAIのオープンモデルが来ました。 120Bと20B。どちらもMoEで、アクティブパラメータはそれぞれ5.1B、3.6Bです。そして4bit浮動小数点での量子化があるので、120Bは80GBのVRAM、20Bは16GBのVRAMで動きます。 Introducing gpt-oss | OpenAI LM Studioで動…