ローカルLLMの損益分岐 — サブスク定額で考える3つの分岐点
ローカルLLMがクラウドより得になるのはいつか。token従量ではなく定額サブを前提に、GPU中古相場・電気代・サブスク月額の概算から、ローカルが効く3パターン(機密/上限超え/共有)を比較します(数値は概算)。
- local-llm
- cost
- ollama
- claude-code
- codex-cli
- 情報確認
- 更新性
- 定期更新
- 読了目安
- 約4分
仕様・料金・提供範囲が変わりやすいテーマは、公開日・更新日・情報確認日を分けて管理します。 導入前には必ず記事末尾の一次情報と公式ドキュメントで最新状況を確認してください。
ローカルLLMの損益分岐を「API料金 vs GPU代」で語ると話がズレる。個人や小規模チームの現実的な使い方は定額サブスクであって、token 従量ではないからだ。だから分岐点は「月いくらAPIを叩くか」ではなく、サブスク定額のどこに不満が出るかで決まる。
先に結論を言うと、「全部ローカルに置き換える」は今回の実測では非推奨だ。J-WorkBench の品質軸(実務正確性・35%)はクラウドが明確に上で、規程RAGや契約照合では Codex 98 点に対しローカル14B(qwen2.5:14b)が 85 点と差が開く。ローカルが効くのは料金の話ではなく、サブスクの構造的な制約に当たる3パターンに限られる。
前提となる概算コスト
電気代は「350W × 1日2時間 × 30日 ≒ 21kWh/月 → 約650円/月」程度。つまりローカル運用の月次ランニングは電気代だけなら千円未満で、効いてくるのは初期のGPU 13万円という固定費だ。標準サブスク3,000円/月に対し、GPU 13万円は単純割り戻しで約43か月。元を取る前提でローカルに移るのは、よほど特殊な事情がない限り割に合わない。
損益分岐は「金額」ではなく「3つの不満」で決まる
ローカルが定額サブを上回るのは、料金表ではなくサブスクの構造的な制約に当たったときだ。J-WorkBench はこれを3パターンに整理している。
ただし3パターンに当てはまっても、タスクの中身で向き不向きが分かれる。J-WorkBench のカテゴリ別品質(Claude独立採点)を見ると、議事録・メール・長文ではローカル14Bがクラウドと互角まで詰めている一方、規程・契約の条文推論や汚い表/CSVではローカルが大きく負ける。つまり「ローカルに回してよい仕事」と「クラウドに残す仕事」は事前に切り分けられる。
| カテゴリ | クラウド最良 | qwen2.5:14b | 判断 |
|---|---|---|---|
| 議事録 | 91 | 92 | 互角→ローカル可 |
| メール | 100 | 100 | 互角→ローカル可 |
| 長文 | 100 | 100 | 互角→ローカル可 |
| 規程RAG | 99 | 77 | クラウドに残す |
| 契約照合 | 100 | 81 | クラウドに残す |
| 表/CSV | 98 | 56 | クラウドに残す |
数値は score01×100。長文は「fixture が本文に答えを書きすぎ」という既知の限界があり、全モデルが満点だった点は割り引いて読む。
パターン別の損益感
① 機密で外に出せない — これは損益分岐の問題ではなく前提条件だ。送信できない時点でクラウドは選択肢から外れ、ローカルが唯一解になる。コストより「出せるか/出せないか」で決まる。狙い目は議事録・メール・長文要約のようにローカルでも互角に戦えるタスク。逆に機密データであっても規程・契約の条文推論や複雑な表の集計は、ローカルの誤答リスクが高いことを織り込んでおく。
② サブスクのcapを超える重量ユーザー — Claude Max のような上位プラン(概算 30,000円/月)でも上限はある。常時フル稼働させる使い方なら、13万円のGPUは約4〜5か月分の上位サブ相当で、長く回すほどローカルが効く。ただし正確性はクラウドに劣るので、量をこなす前処理・下書き生成をローカルに寄せ、最終確認や条文判断はクラウドに残す併用が現実的だ。
③ 複数人で1GPUを共有 — 5人で標準サブスクなら 3,000円 × 5 = 15,000円/月。GPU 13万円は約9か月で相殺。vLLM等で同時利用できれば、共有はローカルの数字が最も立ちやすいパターンだ。ただし共有先の用途が規程照合や表の集計に偏るなら、安さより誤答のコストが上回りうる点は同じ。
次に読む
関連して読む
ローカルLLMはクラウドの何割を肩代わりできるか — J-WorkBench クラウド代替率
日本語の実務7カテゴリで、手元PC(RTX 3090)のローカルLLMがサブスク版クラウドの何割を代替できるかを5軸で測ったベンチ J-WorkBench の実測結果。代替率66〜87%の正直な内訳、互角と苦戦の境界、向く/向かないケースを整理します。
自分のPCで J-WorkBench を回す — ローカルLLM実務ベンチの再現手順
日本語実務ベンチ J-WorkBench を自分のPCで再現する手順。Ollamaでモデルをpullし、npm run bench で7カテゴリを採点、結果からサイト用データを生成するまでを通しで解説します。サブスクCLIのフラグは要検証。
ローカルLLMが日本語実務でやらかす失敗集 — 実測7例ギャラリー
J-WorkBench の生トランスクリプトから、ローカルLLMが日本語の実務でやらかした失敗を7例そのまま並べた見本帳。JSON崩壊・根拠なし断言・敬語崩壊・表の二重計上・コード未修正、そしてローカルがクラウド3社に勝った逆転例まで、脚色なしの出力で示します。