テクノロジー注目度 68

AIエージェント開発の進化年表：概念からマネージド化、ハーネスエンジニアリングへ

※本記事の要約および解説はAIが自動生成しており、誤りが含まれる可能性があります。事実確認は元ニュースをご参照ください。

本記事は、生成AIのエージェント領域における主要な技術的・概念的な変遷を2017年から2026年にかけて時系列で整理した包括的な年表です。エージェント開発に関わるエンジニア向けに、「いつ」「誰が」「どのような種別」で特定の概念やフレームワークが生まれたかを追跡しています。

初期の「研究先行期」（2020〜2023前半）には、RAG（Retrieval-Augmented Generation）やReAct（Reasoning and Acting）、Toolformerといった原典論文が集中し、LangChainのような実装フレームワークが登場しました。この時期にLilian Weng氏によりエージェントの標準的な枠組みが言語化されました。

次に「標準化期」（2023半ば〜2024）では、Function CallingやMCP（Messaging Communication Protocol）といったプロトコルレベルでの語彙と仕組みが確立し、SWE-benchなどのベンチマークが評価の基準を標準化しました。この流れで、Anthropic社はClaude 3.5 Sonnetの登場により、エージェントコーディングの実用化における大きな転換点を迎えました。

さらに「体系化期」（2024末〜2025）では、公式SDKや方法論が充実し、マルチエージェントに関する議論とContext Engineering（コンテキスト設計）の結晶化が進みました。特にOpenAIはAgents SDKを公開し、Anthropic社は『Building Effective Agents』でワークフローとエージェントの違いを明確に推奨しました。

最終的な「マネージド化・大衆化・ハーネスエンジニアリング期」（2025末〜2026）においては、「harness engineering（ハーネス工学）」が独立した専門領域として確立されました。OpenClawの爆発的普及やManaged Agentsの登場に加え、Meta-Harness／AutoHarnessといった自動生成・最適化技術が登場し、能力の階層化（Mythos級など）と評価軸の品質側への移行（FrontierCode）が並行して進むという、高度に専門化された開発フェーズに入っていることが示されています。

背景

本記事は、急速に進化する生成AIエージェント分野の技術的変遷を俯瞰するための年表です。LLM（大規模言語モデル）が単なるテキスト生成ツールから、外部ツールを使いこなす自律的な「エージェント」へと役割を変えた過程を追うことで、現在の業界における主要な設計思想や標準化の流れを理解できます。

重要用語解説

RAG: Retrieval-Augmented Generationの略。LLMが持つ知識の限界を克服するため、外部データベースから関連情報を検索し、それを基に回答を生成する技術。情報の根拠付けと最新化を実現します。
harness engineering: AIエージェントが実環境でタスクを実行するための「枠組み」や「制御機構」を設計・最適化する工学分野。単なるプロンプトではなく、実行プロセス全体を管理することを指します。
MCP（Messaging Communication Protocol）: Anthropic社などが提唱した、複数のAIエージェントやコンポーネントが連携するための通信規約（プロトコル）。異なるシステム間での相互運用性を高めるための標準化の動きです。

今後の影響

この年表は、今後のAI開発における「設計判断」の歴史的経緯を示すため、単なる技術トレンドではなく、業界の構造的な進化を理解する上で極めて重要です。特に『harness engineering』が独立した領域として確立されたことは、エージェントの実装が複雑化し、より高度なシステム設計能力が求められることを示唆しています。

Information Sources:

https://qiita.com/yokoto/items/e110fea5892c56946826