本文へスキップ
Edition · Tokyo
Issue No.065
codeagent.jp

AIエージェントを、
実務で使える形まで検証する。

Claude Code、Codex、MCP、AEO、llms.txt を、 一次情報・公開実装・自作ツール・検証ログで整理する技術メディアです。

一次情報、エージェント実行、公開ツール、記事化をつなぐcodeagentの検証ループ図
Verification loop

一次情報、Codex / Claude Code / MCP、AEOツール、記事化までを同じ検証線上で扱います。

e-Gov法令MCP ↗
AI Trend Desk

話題を、理解と共有に変える。

AIニュースを速報で終わらせず、一次情報、論点、実務への影響、次に試すことへ分解します。 図解つき記事として残すための入口です。

AIトレンド観測ページへ ↗
  1. Fact
    一次情報を確認
  2. Map
    論点を分ける
  3. Use
    自分の用途に落とす
  4. Share
    図解つきで共有

AEO Research Lab

AI検索に読まれるかを、ツールと実装で確かめる。

AEOチェッカーでの診断、一次データの調査レポート、公開実装、codeagent.jp 自身の改善ログを1本の導線にまとめ、 AI検索に読まれる条件を実例から確かめられるようにしています。

今号のグラフ

Claude Opus 4.7徹底調査: 何が進化し、どこに注意すべきか

Claude Opus 4.7の新機能・破壊的変更・コスト構造・Claude Code品質問題ポストモーテムまで、移行前に知るべきポイントを実務目線で整理します。

記事を読む ↗
公表値で見るOpus 4.7の得意領域
SWE-bench Verified 87.6%
実GitHubイシュー解決
Terminal-Bench 2.0 69.4%
ターミナル操作と自律ワークフロー
Finance Agent v1.1 64.4%
金融モデリング・専門財務推論
SWE-bench Pro 64.3%
複数ファイル・多言語のコード修正
Anthropic公表ベンチ。評価条件が異なるため得意領域の把握用。

Latest dispatches

All articles ↗

From the stacks

Browse archive ↗