ローカルLLMの損益分岐 — サブスク定額で考える3つの分岐点

ローカルLLMの損益分岐を「API料金 vs GPU代」で語ると話がズレる。個人や小規模チームの現実的な使い方は定額サブスクであって、token 従量ではないからだ。だから分岐点は「月いくらAPIを叩くか」ではなく、サブスク定額のどこに不満が出るかで決まる。

先に結論を言うと、「全部ローカルに置き換える」は今回の実測では非推奨だ。J-WorkBench の品質軸（実務正確性・35%）はクラウドが明確に上で、規程RAGや契約照合では Codex 98 点に対しローカル14B（qwen2.5:14b）が 85 点と差が開く。ローカルが効くのは料金の話ではなく、サブスクの構造的な制約に当たる3パターンに限られる。

前提となる概算コスト

13万円

中古GPU相場

RTX 3090(24GB)級の目安

350W

推論時の消費電力

GPU概算

31円/kWh

電気代単価

家庭用の目安

3,000円/月

標準サブスク

Plus / Pro / Gemini有料級

出典: bench/config.mjs の COST（概算・要再計算）

電気代は「350W × 1日2時間 × 30日 ≒ 21kWh/月 → 約650円/月」程度。つまりローカル運用の月次ランニングは電気代だけなら千円未満で、効いてくるのは初期のGPU 13万円という固定費だ。標準サブスク3,000円/月に対し、GPU 13万円は単純割り戻しで約43か月。元を取る前提でローカルに移るのは、よほど特殊な事情がない限り割に合わない。

損益分岐は「金額」ではなく「3つの不満」で決まる

ローカルが定額サブを上回るのは、料金表ではなくサブスクの構造的な制約に当たったときだ。J-WorkBench はこれを3パターンに整理している。

サブスク定額（クラウド）

ローカルLLM

① 機密文書

規約上は配慮されても、社外送信自体がNGな組織がある

データが手元から出ない。これは金額に換算できない価値

② 利用上限(cap)

Plus/Proは時間・回数に上限。重量利用だと頭打ち

上限なし。電気代の範囲で回し続けられる

③ 複数人共有

人数分の席（月額×人数）が積み上がる

1台のGPUを社内で共有。人が増えるほど割安に近づく

ローカルが効く3パターン（SPEC §7）。逆に言えば、これ以外はクラウドが素直に有利。

ただし3パターンに当てはまっても、タスクの中身で向き不向きが分かれる。J-WorkBench のカテゴリ別品質（Claude独立採点）を見ると、議事録・メール・長文ではローカル14Bがクラウドと互角まで詰めている一方、規程・契約の条文推論や汚い表/CSVではローカルが大きく負ける。つまり「ローカルに回してよい仕事」と「クラウドに残す仕事」は事前に切り分けられる。

カテゴリ	クラウド最良	qwen2.5:14b	判断
議事録	91	92	互角→ローカル可
メール	100	100	互角→ローカル可
長文	100	100	互角→ローカル可
規程RAG	99	77	クラウドに残す
契約照合	100	81	クラウドに残す
表/CSV	98	56	クラウドに残す

数値は score01×100。長文は「fixture が本文に答えを書きすぎ」という既知の限界があり、全モデルが満点だった点は割り引いて読む。

パターン別の損益感

① 機密で外に出せない — これは損益分岐の問題ではなく前提条件だ。送信できない時点でクラウドは選択肢から外れ、ローカルが唯一解になる。コストより「出せるか/出せないか」で決まる。狙い目は議事録・メール・長文要約のようにローカルでも互角に戦えるタスク。逆に機密データであっても規程・契約の条文推論や複雑な表の集計は、ローカルの誤答リスクが高いことを織り込んでおく。

② サブスクのcapを超える重量ユーザー — Claude Max のような上位プラン（概算 30,000円/月）でも上限はある。常時フル稼働させる使い方なら、13万円のGPUは約4〜5か月分の上位サブ相当で、長く回すほどローカルが効く。ただし正確性はクラウドに劣るので、量をこなす前処理・下書き生成をローカルに寄せ、最終確認や条文判断はクラウドに残す併用が現実的だ。

③ 複数人で1GPUを共有 — 5人で標準サブスクなら 3,000円 × 5 = 15,000円/月。GPU 13万円は約9か月で相殺。vLLM等で同時利用できれば、共有はローカルの数字が最も立ちやすいパターンだ。ただし共有先の用途が規程照合や表の集計に偏るなら、安さより誤答のコストが上回りうる点は同じ。

ローカルLLMの損益分岐 — サブスク定額で考える3つの分岐点

前提となる概算コスト

損益分岐は「金額」ではなく「3つの不満」で決まる

パターン別の損益感

次に読む

関連して読む

自分のPCで J-WorkBench を回す — ローカルLLM実務ベンチの再現手順

ローカルLLMはクラウドの何割を肩代わりできるか — J-WorkBench クラウド代替率

AGENTS.md完全ガイド — Codex・Cursor・Clineで共通のエージェント指示を書く