Issue No.088

一次情報、公開実装、自作ツールでAIエージェントを検証する

codeagent.jp

AIエージェントを、
実務で使える形まで検証する。

Claude Code、Codex、MCP、AEO、llms.txt を、一次情報・公開実装・自作ツール・検証ログで整理する技術メディアです。

AIコーディング適性診断 ↗ 無料AEO診断を使う ↗ AEO検証ラボ ↗ AIトレンドを追う ↗ AIエージェント記事を読む ↗

一次情報、エージェント実行、公開ツール、記事化をつなぐcodeagentの検証ループ図 — Verification loop

一次情報、Codex / Claude Code / MCP、AEOツール、記事化までを同じ検証線上で扱います。

e-Gov法令MCP ↗

AI Trend Desk

話題を、理解と共有に変える。

AIニュースを速報で終わらせず、一次情報、論点、実務への影響、次に試すことへ分解します。図解つき記事として残すための入口です。

AIトレンド観測ページへ ↗

Fact

一次情報を確認
Map

論点を分ける
Use

自分の用途に落とす
Share

図解つきで共有

目的別に読む

AEO Research Lab

AI検索に読まれるかを、ツールと実装で確かめる。

AEOチェッカーでの診断、一次データの調査レポート、公開実装、codeagent.jp 自身の改善ログを1本の導線にまとめ、 AI検索に読まれる条件を実例から確かめられるようにしています。

今号のグラフ

Claude Opus 4.7徹底調査: 何が進化し、どこに注意すべきか

Claude Opus 4.7の新機能・破壊的変更・コスト構造・Claude Code品質問題ポストモーテムまで、移行前に知るべきポイントを実務目線で整理します。

記事を読む ↗

公表値で見るOpus 4.7の得意領域

SWE-bench Verified 87.6%

実GitHubイシュー解決

Terminal-Bench 2.0 69.4%

ターミナル操作と自律ワークフロー

Finance Agent v1.1 64.4%

金融モデリング・専門財務推論

SWE-bench Pro 64.3%

複数ファイル・多言語のコード修正

Anthropic公表ベンチ。評価条件が異なるため得意領域の把握用。

Feature · Claude Mythos

ミトスを国会答弁から読む

主要記事へ ↗

Latest dispatches

All articles ↗

From the stacks

Browse archive ↗

AIエージェントを、
実務で使える形まで検証する。

話題を、理解と共有に変える。

目的別に読む

AEO Research Lab

Claude Opus 4.7徹底調査: 何が進化し、どこに注意すべきか

ミトスを国会答弁から読む

Latest dispatches

その条文は「現在」のものです｜e-Gov法令API v2の時点指定(asof)と通称検索を実測

「下請法」で法令検索すると0件になる｜通称と現行法令名のズレをMCPで埋める

Claude Opus 5の実力：Fable級を半額で使えるのか

AntigravityとGemini 3.6 Flashでサイト更新からブラウザテストまで回す

From the stacks

AIエージェントを、実務で使える形まで検証する。

話題を、理解と共有に変える。

目的別に読む

AEO Research Lab

Claude Opus 4.7徹底調査: 何が進化し、どこに注意すべきか

ミトスを国会答弁から読む

Latest dispatches

その条文は「現在」のものです｜e-Gov法令API v2の時点指定(asof)と通称検索を実測

「下請法」で法令検索すると0件になる｜通称と現行法令名のズレをMCPで埋める

Claude Opus 5の実力：Fable級を半額で使えるのか

AntigravityとGemini 3.6 Flashでサイト更新からブラウザテストまで回す

From the stacks

AIエージェントを、
実務で使える形まで検証する。