本文へスキップ
Edition · Tokyo

Tool · Snapshot 2026-04-29

ローカルLLM レコメンダー

自分のGPU(RTX 50/40/30 シリーズ、Apple Silicon M5、マルチGPU構成)と用途タグを選ぶだけで、 ローカルで快適に動かせるLLM候補を上位5件まで提示します。VRAMフィット・用途別性能・FP8ネイティブ対応・量子化レベルを総合スコア化。

ローカルLLM レコメンダー(2026-04-29 スナップショット)

自分のGPUと用途を入れると、本記事の調査範囲+家庭ローカルLLMコミュニティで2026年4月時点に定着しているモデルから、上位候補を絞り込みます。 VRAM見積はモデル重みのみ。実運用ではKVキャッシュで +1〜4GB 程度の余裕を見てください。

用途(複数選択可)
オプション
データ確定日: 2026-04-29 / VRAM見積はQ4_K_M(または該当モデルのFP8)でのモデル重み。 KVキャッシュ・OS常駐分で +1〜4GB の余裕を確保してください。創作用コミュニティモデルは詳細オプションを選んだ場合のみ、 補助的な候補として提示します。利用前に各モデルのライセンス、利用規約、安全性を確認してください。

このツールの設計思想

2026年のローカルLLM選定は「VRAM容量 × MoEアーキテクチャ × 量子化フォーマット」の三位一体で決まります。 パラメータ数や演算性能だけ見ても、実際にGPU上で動くかは判断できません。本ツールは 「2026年4月版・家庭用RTX GPUで動かすローカルLLM完全ガイド」 の調査内容と、家庭ローカルLLMコミュニティで定着している実勢を組み合わせ、以下の優先順位でスコアリングしています。

  1. VRAMフィット:選択GPUの実用VRAMに、推奨量子化でのモデル重みが余裕で収まるか(KVキャッシュ用に +3GB の余白を見て comfortable / tight を判定)
  2. 用途別の強さ:選択した用途タグごとに sota / strong / ok / weak の4段階で重み付け
  3. ハードウェア最適化整合:Blackwell(RTX 50シリーズ)でFP8ネイティブ運用可能なモデルには速度ボーナス
  4. 余白ボーナス:モデル重みがVRAMの35%以下なら、Q6_K で運用しKVキャッシュに豊富にVRAMを割けるためボーナス

用途タグの選び方

  • 汎用チャット:日常会話・要約・翻訳。迷ったら最初にONにする。
  • コーディング:Tab補完、エージェント実装支援。Qwen3.6-35B-A3B のようなThinking Mode持ちが有利。
  • 日本語特化:日本特有の文脈・敬語・固有名詞を重視。LLM-jp-4 や Qwen3 Swallow が優先される。
  • 長文・RAG:128K〜262Kコンテキスト。Qwen3.5-9B(262K)や Gemma 4 26B-A4B(256K)が有利。
  • エージェント・推論:Tool use、複雑な論理推論。Hermes 4、Qwen3.6、Llama 4 Scout が候補に来やすい。
  • 速度重視:リアルタイム音声対話のバックエンドや、低レイテンシ要件。Nemotron Cascade 2 が強い。

オプションの意味

マルチモーダル必須をONにすると、Qwen2.5-VL シリーズなど画像・PDF・図表を読めるVLMだけが候補に絞られます。 スクリーンショット解析、OCR、GUIエージェントを作るなら必須。

創作用コミュニティモデルを含めるは、デフォルトでは出力に含まれない創作対話・RP向けコミュニティ・ファインチューンを候補に追加します。 業務利用ではライセンス、利用規約、社内ポリシー、安全性を必ず確認してください。

このツールが扱わないこと

  • クラウド推論サービスとの比較:Claude / GPT / Gemini など、APIで使うクローズドモデルは対象外です。
  • 適時アップデート:2026年4月29日のスナップショットで固定。新モデル登場や価格変動には追随しません。
  • ファインチューニング・量子化作業:本ツールは「動くモデル候補」の提示まで。実際のセットアップは Ollama / LM Studio / TensorRT-LLM の各公式ドキュメントを参照してください。

関連記事・詳細解説

本ツールのデータと推奨ロジックの背景は、以下の記事に詳しく書いています。

更新方針

本ツールは 2026-04-29 時点のスナップショットで運用します。新たな候補モデルの追加や VRAM 見積の改訂は、 記事本体(ローカルLLM完全ガイド)の更新と合わせて行います。 誤りやモデルの抜け漏れにお気づきの場合は お問い合わせ からご連絡ください。