ハーネスエンジニアリング入門: LLMの周りを"配線する"設計
2026年に第3の柱として浮上したハーネスエンジニアリングを、馬具メタファーから3層比較、エージェント・ループ、Claude Code/Cursor/Codexの設計差まで図解で整理します。
- harness-engineering
- ai-agent
- claude-code
- context-engineering
- prompt-engineering
- agents-md
- 情報確認
- 参考リンク
- 5件
- 更新性
- 長く使える
- 読了目安
- 約16分
仕様・料金・提供範囲が変わりやすいテーマは、公開日・更新日・情報確認日を分けて管理します。 導入前には必ず記事末尾の一次情報と公式ドキュメントで最新状況を確認してください。
「ハーネスエンジニアリング」という言葉が2026年に入って一気に広まった。プロンプト工学→コンテキスト工学に続く、AIエージェント開発の第3の柱として扱われ始めている。とはいえ「ハーネス?馬具?何それ?」という人がまだ大半だ。実は、あなたが普段使っている Claude Code も Cursor も Codex CLI も、その正体は全部「ハーネス」である。本記事は、ハーネスとは何か・なぜ今これが重要か・自分の作業のどこに既に潜んでいるかを、図解中心で一気通貫に整理する。
1. ハーネス、まず言葉から
英語の “harness” は 馬具のこと。馬そのものは強力でも、車を引かせるには「胴体に巻く帯」「手綱」「車との連結金具」がなければ仕事にならない。AI業界の用法もまったく同じで、LLM を仕事させるための周辺装置の総体を harness と呼ぶ。
つまりハーネスエンジニアリングとは、「LLM を中心に置いて、周りの装置をどう設計するかの工学」だ。プロンプトの言い回しを磨くのとも、文脈に入れる情報を選ぶのとも、別の階層の話になる。
2. なぜ2026年に急浮上したのか ― 3層の進化
AIエンジニアリングの主役は3年で2回交代している。プロンプト工学(2022-2024) → コンテキスト工学(2025) → ハーネス工学(2026)。ハーネスが今ホットなのは、前の2層が成熟して残った変数が周辺装置に集中したからだ。
- 2022-2024プロンプト工学何を聞くか。Few-shot、Chain-of-Thought、ロール設計など、単発の指示文を磨き上げる時代。
- 2025コンテキスト工学何を見せるか。RAG・履歴圧縮・CLAUDE.md / AGENTS.md など、文脈ウィンドウに何を詰めるかが主戦場に。Karpathy が「prompt engineering より context engineering」と発言。
- 2026ハーネス工学どう動かすか。ツール、メモリ、ループ、サーキットブレーカー、観測、承認ゲートまで含めた周辺装置の設計に主導権が移った。
転換点になったのは、OpenAI Codex チームの一節として広く引用されている言葉だ。
— OpenAI Codex チーム / 2026年初頭Agents aren’t hard; the harness is hard.(エージェントは難しくない。ハーネスが難しい)
モデル自体は十分賢くなった。だが「賢いモデル + ひどいハーネス」は「ふつうのモデル + 良いハーネス」に負ける。これが2026年の合言葉になっている。
3. ハーネスの中身 ― 9〜11の構成要素
複数の解説記事を突き合わせると、ほぼ全員が同じ部品リストに収束する。「システムプロンプト・ツール・メモリ・コンテキスト管理・ループ・パース・状態・エラー処理・ガードレール・検証・サブエージェント」の11個。それぞれを軽く見ておこう。
4. 3層の違いを並べて見る
「結局プロンプト工学・コンテキスト工学・ハーネス工学は何が違うのか」が一番混乱しやすい。以下の対比表が一番速い。
5. 効くという証拠 ― 実測ベンチで何が起きたか
抽象論ではなく、2025-2026年に報告された具体的な数値だけを並べる。
— HumanLayer 創業者 / 2026It’s not a model problem. It’s a configuration problem.(モデルの問題ではない。設定の問題だ)
「強モデル+悪ハーネス < 並モデル+良ハーネス」。これがコミュニティで合意されつつある経験則だ。
6. 現実のハーネスを3つ並べる ― Claude Code / Codex CLI / Cursor
ハーネスの設計思想は製品ごとに違う。同じ Claude Opus 4.7 を使っていても、Cursor で動かすか Claude Code で動かすかで挙動も得意分野も別物になる。
7. 「自分はあまり使ってない気がする」 ― いや、実は使っている
冒頭の問題提起への答えがここに来る。Claude Code を起動した瞬間、あなたはハーネスを起動している。普段「設定」だと思って触っているもののほとんどが、教科書的にはハーネス工学の構成要素だ。
8. 自分のハーネスを意識的に組む ― 最小チェックリスト
最後に、いまの自分のセットアップを「ハーネス工学の目」で見直す観点を5つだけ置いておく。
- 1System Prompt層を階層化したかグローバル(~/.claude/CLAUDE.md)・プロジェクト(./CLAUDE.md)・サブパス(.claude/rules/*.md)の3層に分け、@インポートで読ませる。
- 2ツールを"削った"かVercelは80%削って成功率が80→100%。多すぎるツールはモデルを迷わせる。MCPサーバや内蔵ツールを過剰に有効化していないか棚卸し。
- 3メモリを"育てて"いるかauto memory / MEMORY.md を放置していないか。失敗・成功どちらも書き残して反復ミスを潰す。
- 4サーキットブレーカーがあるかタイムアウト、再帰深さ、コスト上限、destructive操作の承認ゲート。無限ループとトークンバーンの保険。
- 5検証ループが回っているかnpm run check / テスト / LLM-as-judge / ultrareview。"出力した"と"正しい"の間の橋。
9. まとめ
ハーネスエンジニアリングは、突然湧いた新概念ではない。もともと「設定」「Tips」「ベストプラクティス」と呼ばれていたものに、明確な名前と理論的位置づけが与えられただけだ。だがその効果は具体的で、同じモデルでもハーネス次第で 6 倍、絶対値で 80 → 100% のレンジで性能が動く。
普段 Claude Code / Cursor / Codex CLI のどれかを触っている時点で、あなたは既にハーネスのユーザーだ。次のステップは、それを”設定”ではなく”自分が設計している周辺装置”として見直すこと。 CLAUDE.md を一行足すたびに、ツールを一つ削るたびに、hooks を一つ書くたびに、自分のハーネスは少しずつ強くなっている。
「モデルではなく、モデルの周りを設計する」 ― これが2026年のエージェント開発のいちばん短い要約だ。
関連記事
- Claude Code公式ベストプラクティス日本語ガイド — 本稿のハーネス観を Claude Code の具体設定に落とす
- AGENTS.md / CLAUDE.md / メモリ運用プレイブック — ハーネスの中核になる指示ファイルの設計
- CLAUDE.md ジェネレーター + 採点 — 自分のハーネスの起点になる CLAUDE.md を生成・採点できる無料ツール
一次情報・参考リンク
- Agent Harness Engineering — Addy Osmani https://addyosmani.com/blog/agent-harness-engineering/
- The Anatomy of an Agent Harness — Avi Chawla https://blog.dailydoseofds.com/p/the-anatomy-of-an-agent-harness
- What Is an Agent Harness? The Architecture Behind Claude Code, Codex, and Cursor https://www.mindstudio.ai/blog/what-is-agent-harness-architecture-explained
- The Third Evolution: Why Harness Engineering Replaced Prompting in 2026 https://www.epsilla.com/blogs/harness-engineering-evolution-prompt-context-autonomous-agents
- What Is an Agent Harness? The Infrastructure That Makes AI Agents Actually Work https://www.firecrawl.dev/blog/what-is-an-agent-harness
関連して読む
- · 参考リンク 5件
AIエージェント開発2026: Vibe Coding後半破綻と設計原則
Vibe Codingの後半破綻、CLAUDE.md、モノレポ、Cursor 3、GPT-5.3-Codexを軸に、2026年の開発設計を整理します。
- · 参考リンク 5件
SEOからAOへ: AIエージェント時代のウェブ最適化
AIエージェントが読者になる時代に向けて、SEOとAO/AAOの違い、llms.txt、AGENTS.md、MCP、測定方法を整理します。
Claude Code/Codexで失敗する5つの理由と回避策
AI駆動開発がうまくいかない個人開発者向けに、失敗の典型5パターンと、AGENTS.md・タスク分割・検証設計での回避策を整理します。