テクノロジー注目度 72

NVIDIAの高性能LLM「Nemotron 3 Ultra」がAmazon SageMaker JumpStartで利用可能に

※本記事の要約および解説はAIが自動生成しており、誤りが含まれる可能性があります。事実確認は元ニュースをご参照ください。

本記事は、NVIDIAが開発した大規模言語モデル（LLM）「Nemotron 3 Ultra」が、Amazon SageMaker JumpStartを通じて利用可能になったことを報じています。このモデルは、特に長期にわたる自律エージェント（autonomous agents）の推論やオーケストレーション（orchestration）に特化して設計されたオープンモデルです。

Nemotron 3 Ultraの主な特徴は、その高性能なアーキテクチャと効率性にあります。モデルは「ハイブリッドTransformer-Mamba Mixture-of-Experts (MoE)」アーキテクチャを採用しており、合計5,500億（550B）のパラメータを持ちながらも、アクティブなパラメータは550億（55B）に抑えられています。これにより、同等の品質を持つ密な（dense）モデルと比較して、計算コストを大幅に削減しつつ、最先端の知能を提供します。

このモデルは、最大100万（1M）トークンという非常に長いコンテキスト長をサポートし、エージェントが計画立案、ツール呼び出し、自己修正ループを数百ターンにわたって維持するような、多段階の推論ワークロードに最適化されています。その結果、従来のモデルと比較して、推論速度が5倍高速化し、複雑なエージェントタスクのコストを最大30%削減できるとされています。

利用方法として、ユーザーはAWSアカウントと適切な権限を持つことで、SageMaker JumpStartからワンクリックでNemotron 3 Ultraをデプロイできます。これにより、インフラ管理やサービングフレームワークの複雑な設定が不要となります。ただし、デプロイされたエンドポイントは稼働中に料金が発生するため、利用後は必ず削除することが強く推奨されています。

背景

大規模言語モデル（LLM）の進化に伴い、単なる質問応答を超え、複数のステップを踏んで自律的にタスクを遂行する「エージェントAI」の需要が高まっています。Nemotron 3 Ultraは、このエージェントAIの課題（長期的な推論維持とコスト効率）を解決するために設計された最新のモデルです。

重要用語解説

大規模言語モデル（LLM）: 大量のテキストデータで学習されたAIモデル。人間のような自然な言語理解、生成、タスク実行を可能にする基盤技術。
Mixture-of-Experts (MoE): モデルのパラメータを複数の専門家（Expert）に分割し、必要なタスクに応じて必要な専門家のみを活性化させる構造。計算効率と性能の両立を可能にする。
エージェントAI: 単発の応答に留まらず、計画立案、外部ツール利用、自己修正など、複数のステップを経て自律的に目標を達成しようとするAIシステム。

今後の影響

Nemotron 3 Ultraの提供は、企業が複雑な業務プロセス（例：コーディング、深層研究、多段階のビジネス自動化）をAIで実現する際の障壁を大きく下げます。これにより、AIを活用した業務自動化の速度と規模が加速し、産業全体の生産性向上に貢献することが期待されます。

Information Sources:

https://aws.amazon.com/blogs/machine-learning/nvidia-nemotron-3-ultra-now-available-on-amazon-sagemaker-jumpstart/