Google、AWS・Azureのデータソースを統合する「Agent Data Cloud」を発表:AIエージェントのための包括的データレイクハウス
Googleは、ラスベガスで開催される「Google Cloud Next 2026」において、AIエージェントが利用する包括的なデータレイクハウス「Agentic Data Cloud」を発表しました。これは、Google Cloudだけでなく、AWSやMicrosoft Azureといった競合クラウドのデータベースやSaaSなど、あらゆるデータソースをAIネイティブな形で統合することを目的としています。
本ソリューションは、企業がAIエージェントを構築する際に必須となる、業務データへの信頼性の高いアクセスを提供します。具体的には、「ユニバーサルコンテキストエンジン」を通じてAIエージェントに正確なビジネスコンテキストを提供し、AIエージェントファーストな体験を実務者や開発者に実現します。これにより、データ操作や開発者がAIエージェントのオーケストレータとしての役割を果たすことが可能になります。
データレイクハウスの機能面では、データサイロ化の解消を目指し、AIネイティブかつクロスクラウドに対応したデータレイクを提供します。特に、ナレッジカタログ機能が強化され、Google Cloud上のPDFや画像にSmart Storageによるアノテーションやタグ付けが可能になります。また、非構造化データに対してGeminiを用いてエンティティやリレーションシップの抽出が行えます。さらに、LookerのLookMLとBigQuery Measuresを統合し、企業内での単一のセマンティック基盤を管理します。
技術的な側面として、本クラウドはデータコピーを伴わずに、オープンなテーブルフォーマットであるApache Iceberg形式でデータ参照を可能にします。Google CloudのCross-Cloud Interconnectを統合することで、AWSやAzure上のデータに低レイテンシでアクセスし、Amazon S3上のDatabricks Unity CatalogやAWS Glue Data Catalog、Snowflake Polarisなどのデータも直接読み込むことが可能です(いずれもプレビュー機能)。これにより、データ資産全体をシームレスに接続し、AIエージェントの精度向上とデータ活用を加速させることが期待されています。
背景
AIエージェントの普及に伴い、企業が持つデータは複数のクラウドやシステムに分散し、「データサイロ化」が深刻な課題となっています。AIエージェントが高度な業務を遂行するためには、これらの分散したデータソースすべてにアクセスし、統一されたビジネスコンテキストを理解することが不可欠です。本発表は、このデータ統合とアクセス性の課題を解決するためのものです。
重要用語解説
- データレイクハウス: 多様な形式のデータを一箇所に集め、データウェアハウスのように構造化して分析・利用できる大規模データ保管庫。AI活用に必須の基盤技術。
- AIエージェント: 特定のタスクや目標を達成するために、自律的に判断し、複数のステップを踏んで行動するAIシステム。業務自動化の核となる技術。
- Apache Iceberg: データレイクにおけるオープンなテーブルフォーマットの一つ。データをコピーすることなく、複数のシステムやクラウド間で高速かつ信頼性高く参照・操作することを可能にする技術。
今後の影響
本サービスは、企業が抱えるデータガバナンスとデータ統合の課題を根本的に解決し、AIエージェントの実用化を大きく加速させます。競合クラウドのデータへの直接アクセスを可能にすることで、データ活用におけるベンダーロックインのリスクを低減させ、データ主権の確保に貢献すると予想されます。今後のデータ連携の標準化を牽引する可能性があります。