NVIDIAとGoogle Cloudが協業:エージェントAIと物理AIの次世代インフラを構築
NVIDIAとGoogle Cloudは10年以上にわたり協業し、高性能ライブラリからエンタープライズクラウドサービスに至るまでのフルスタックAIプラットフォームを共同開発してきました。この提携は、エージェントAIや物理AIを研究室レベルから実運用(プロダクション)へと移行させることを可能にしています。
今週ラスベガスで開催されたGoogle Cloud Nextでは、このパートナーシップが新たなマイルストーンを迎え、エージェントAIと物理AIの次なるフロンティアを支えるGoogle Cloud AIハイパーコンピューターの強化が発表されました。主な進展として、NVIDIA Vera Rubinを搭載したA5Xベアメタルインスタンス、NVIDIA BlackwellおよびBlackwell Ultra GPU上で動作するGoogle Geminiのプレビュー、NVIDIA Blackwell GPUを搭載した機密VM(Confidential VMs)、そしてNVIDIA NemotronオープンモデルとNeMoフレームワークを活用したGemini Enterprise Agent Platform上のエージェントAIなどが含まれます。
インフラ面では、A5XはNVIDIA Vera Rubin NVL72ラックスケールシステムを搭載し、これによってトークンあたりの推論コストを最大10分の1に、メガワットあたりのトークン処理スループットを最大10倍に削減します。このシステムは、最大8万基のNVIDIA Rubin GPUを単一サイトクラスターに、最大96万基をマルチサイトクラスターにスケールさせることができ、大規模なAIワークロードに対応します。
セキュリティ面では、Google GeminiモデルがNVIDIA Blackwell上でGoogle Distributed Cloudのプレビューで利用可能となり、機密データが置かれている場所でモデルを動かすことが可能になりました。また、Confidential G4 VMsは、プロンプトやファインチューニングデータが暗号化され、不正アクセスから保護される環境を提供します。
さらに、オープンモデルとエージェントAIの分野では、NVIDIA Nemotron 3 SuperがGemini Enterprise Agent Platformで利用可能となり、開発者が推論・計画・行動を行うエージェントAIシステムを構築しやすくなっています。また、産業・物理AIの分野では、CadenceやSiemensなどのソリューションがNVIDIA AIインフラ上で利用可能となり、ロボティクスシミュレーション(NVIDIA Isaac Sim)やデジタルツインの構築が加速し、設計から工場最適化までをAIが支援する未来が実現しています。このプラットフォームは、SnapやOpenAIなどの大手企業やスタートアップが実際に利用し、AIのプロトタイピングから実運用への移行を加速させています。
背景
AIの進化に伴い、大規模な計算資源と高度なプラットフォームが求められています。特に「エージェントAI」や「物理AI」は、単なるデータ処理を超え、自律的に計画・行動するシステムを指します。本ニュースは、この次世代AIの実現に必要な、計算資源(GPU)とソフトウェア(フレームワーク、モデル)を統合したインフラストラクチャの最新動向を報じています。
重要用語解説
- エージェントAI: 自律的に目標を設定し、計画を立て、行動を実行するAIシステム。単なる応答生成ではなく、複雑なワークフローを管理する能力を持つ。
- 物理AI: 現実世界の物理的なシステム(ロボット、工場設備など)にAIを適用する分野。デジタルツインやシミュレーションを通じて制御を行う。
- フルスタックAIプラットフォーム: AIのデータ処理、モデル開発、トレーニング、推論、そして実運用(エッジデバイスなど)に至るまで、全ての技術レイヤーを網羅した統合的な開発・実行環境。
今後の影響
本プラットフォームの提供により、AIの適用範囲が研究室から産業現場、物理的な世界へと劇的に拡大します。企業は、高性能かつセキュアな環境で、より複雑で自律的なAIシステム(ロボット、自動化プロセス)を構築できるようになり、製造業や自動化産業に大きな変革をもたらすと予想されます。これはAI産業全体の成長を加速させる基盤となります。