テクノロジー注目度 66

AIエージェントの多段ワークフローをYAMLで宣言的に制御する新エンジン『flowsmith』の設計思想

※本記事の要約および解説はAIが自動生成しており、誤りが含まれる可能性があります。事実確認は元ニュースをご参照ください。

本記事は、実務におけるAIエージェントを用いた多段階作業（調査・生成・レビュー・報告など）の運用課題と、それに対する解決策として開発されたワークフローエンジン「flowsmith」の設計判断を詳細に解説している。筆者は、従来のAIエージェントが抱える以下の3つの根本的な問題点を指摘している。

1. セッション切れによる作業の中断（途中で失敗すると全てやり直しになる）。

2. LLMによる自己申告の信頼性の低さ（「できました」という結論が常に正しいとは限らない）。

3. 処理コストの不明瞭さ（トークン消費量や計算資源の使用状況が把握しにくい）。

これらの問題は単なるプロンプト工夫では解決できず、実行基盤の設計レベルでのアプローチが必要であると述べる。

そこでflowsmithは、「予測可能性」を最優先とし、「制御は宣言に、知能はステップの中に」という原則に基づいている。ワークフローの経路決定や合否判定（ルーティング）はすべて人間がYAMLファイルで機械的に宣言し、エンジンが厳密に実行する。LLMのサブエージェントは、各ステップ内での具体的な作業（コード読解、表作成など）のみを担当する。

特に重要な設計判断として、「合否をLLMに決めさせない」点を挙げている。レビュー担当者には構造化された判定結果（verdicts）のみを返させ、総合的な「合格/不合格」の結論は出さない。エンジンが`pass_when: no_high_fail`のような機械的ルールに基づき合否を決定する。さらに、LLMに頼る前に、ファイル存在チェックや行数比較といった「機械で判定できるもの」を先に走らせてフィルタリングを行う。

また、「状態はすべてディスクに置く」ことで、セッションが途切れても`state.json`などのログにより進捗状況（どのステップの何行目まで完了したか）を正確に記録し、続きから再開可能にする。行き詰まった場合も推測で進まず「seized」（焼き付き）状態となり、人間による介入と裁定を求める仕組みを採用している。

実証実験では、レガシー調査フロー（15ステップ）をJPetStore 6に対して実行し、新規セッションでの完走や、途中で中断・再開、さらには機械ゲートによる差し戻しが実際に機能することを確認した。この検証を通じて、情報の「内容」だけでなく「フレーミング」（文脈の明示化）がエージェントの動作を決定する上で極めて重要であるという教訓を得た。

背景

AIエージェントを用いた複雑な業務フロー（ワークフロー）は、単一のプロンプトでは処理限界に達しやすく、セッション管理や信頼性の確保が課題でした。本記事は、これらの実務的な欠陥を克服するため、従来のLLMの「知能」に頼るのではなく、「機械的で厳密な制御構造」を導入した新しいワークフローエンジンの設計思想を提示しています。

重要用語解説

AIエージェント: 大規模言語モデル（LLM）を活用し、自律的に複数のステップを踏んで目標を達成しようとするシステム。複雑なタスク処理の主体となる。
YAML: Yet Another Markup Languageの略で、人間が読みやすく機械が解析しやすいデータ構造記述形式。本記事ではワークフローの経路やルールを宣言的に定義するために使用されている。
多段ワークフロー: 単一の指示ではなく、複数のステップ（調査→生成→レビューなど）を経て段階的に作業を進めるプロセス。実務的な複雑な業務処理に用いられる概念である。

今後の影響

本設計思想は、AIエージェントを「ブラックボックス的な知能」として扱うのではなく、「厳密な手順を踏む機械システム」として再定義する点で画期的です。これにより、企業が求める高い信頼性（再現性、監査可能性）を持つ業務自動化の実現に大きく貢献し、産業利用におけるAI導入の標準的な設計指針となる可能性があります。

Information Sources:

https://zenn.dev/kikaikaya/articles/flowsmith-declarative-ai-workflow