本文へスキップ
Edition · Tokyo
比較・選定 · 定期更新

ローカルLLMの損益分岐 — サブスク定額で考える3つの分岐点

ローカルLLMがクラウドより得になるのはいつか。token従量ではなく定額サブを前提に、GPU中古相場・電気代・サブスク月額の概算から、ローカルが効く3パターン(機密/上限超え/共有)を比較します(数値は概算)。

codeagent.jp編集部 情報確認 約4分
Tags
情報確認
更新性
定期更新
読了目安
約4分
更新管理

仕様・料金・提供範囲が変わりやすいテーマは、公開日・更新日・情報確認日を分けて管理します。 導入前には必ず記事末尾の一次情報と公式ドキュメントで最新状況を確認してください。

ローカルLLMの損益分岐を「API料金 vs GPU代」で語ると話がズレる。個人や小規模チームの現実的な使い方は定額サブスクであって、token 従量ではないからだ。だから分岐点は「月いくらAPIを叩くか」ではなく、サブスク定額のどこに不満が出るかで決まる。

先に結論を言うと、「全部ローカルに置き換える」は今回の実測では非推奨だ。J-WorkBench の品質軸(実務正確性・35%)はクラウドが明確に上で、規程RAGや契約照合では Codex 98 点に対しローカル14B(qwen2.5:14b)が 85 点と差が開く。ローカルが効くのは料金の話ではなく、サブスクの構造的な制約に当たる3パターンに限られる。

前提となる概算コスト

13万円
中古GPU相場
RTX 3090(24GB)級の目安
350W
推論時の消費電力
GPU概算
31円/kWh
電気代単価
家庭用の目安
3,000円/月
標準サブスク
Plus / Pro / Gemini有料級
出典: bench/config.mjs の COST(概算・要再計算)

電気代は「350W × 1日2時間 × 30日 ≒ 21kWh/月 → 約650円/月」程度。つまりローカル運用の月次ランニングは電気代だけなら千円未満で、効いてくるのは初期のGPU 13万円という固定費だ。標準サブスク3,000円/月に対し、GPU 13万円は単純割り戻しで約43か月。元を取る前提でローカルに移るのは、よほど特殊な事情がない限り割に合わない。

損益分岐は「金額」ではなく「3つの不満」で決まる

ローカルが定額サブを上回るのは、料金表ではなくサブスクの構造的な制約に当たったときだ。J-WorkBench はこれを3パターンに整理している。

サブスク定額(クラウド)
ローカルLLM
① 機密文書
規約上は配慮されても、社外送信自体がNGな組織がある
データが手元から出ない。これは金額に換算できない価値
② 利用上限(cap)
Plus/Proは時間・回数に上限。重量利用だと頭打ち
上限なし。電気代の範囲で回し続けられる
③ 複数人共有
人数分の席(月額×人数)が積み上がる
1台のGPUを社内で共有。人が増えるほど割安に近づく
ローカルが効く3パターン(SPEC §7)。逆に言えば、これ以外はクラウドが素直に有利。

ただし3パターンに当てはまっても、タスクの中身で向き不向きが分かれる。J-WorkBench のカテゴリ別品質(Claude独立採点)を見ると、議事録・メール・長文ではローカル14Bがクラウドと互角まで詰めている一方、規程・契約の条文推論や汚い表/CSVではローカルが大きく負ける。つまり「ローカルに回してよい仕事」と「クラウドに残す仕事」は事前に切り分けられる。

カテゴリクラウド最良qwen2.5:14b判断
議事録9192互角→ローカル可
メール100100互角→ローカル可
長文100100互角→ローカル可
規程RAG9977クラウドに残す
契約照合10081クラウドに残す
表/CSV9856クラウドに残す

数値は score01×100。長文は「fixture が本文に答えを書きすぎ」という既知の限界があり、全モデルが満点だった点は割り引いて読む。

パターン別の損益感

① 機密で外に出せない — これは損益分岐の問題ではなく前提条件だ。送信できない時点でクラウドは選択肢から外れ、ローカルが唯一解になる。コストより「出せるか/出せないか」で決まる。狙い目は議事録・メール・長文要約のようにローカルでも互角に戦えるタスク。逆に機密データであっても規程・契約の条文推論や複雑な表の集計は、ローカルの誤答リスクが高いことを織り込んでおく。

② サブスクのcapを超える重量ユーザー — Claude Max のような上位プラン(概算 30,000円/月)でも上限はある。常時フル稼働させる使い方なら、13万円のGPUは約4〜5か月分の上位サブ相当で、長く回すほどローカルが効く。ただし正確性はクラウドに劣るので、量をこなす前処理・下書き生成をローカルに寄せ、最終確認や条文判断はクラウドに残す併用が現実的だ。

③ 複数人で1GPUを共有 — 5人で標準サブスクなら 3,000円 × 5 = 15,000円/月。GPU 13万円は約9か月で相殺。vLLM等で同時利用できれば、共有はローカルの数字が最も立ちやすいパターンだ。ただし共有先の用途が規程照合や表の集計に偏るなら、安さより誤答のコストが上回りうる点は同じ。

次に読む

About the author
codeagent.jp編集部

Claude Code / Codex / MCP を個人開発サイト運用と公開MCPサーバー開発で試し、一次情報・検証ログ・失敗例をもとに整理します。

関連して読む