NVIDIAは2026年3月16日(月)、フィジカルAIシステムの大規模トレーニングにおけるコスト、時間、複雑さを軽減するオープンリファレンスアーキテクチャ「NVIDIA Physical AI Data Factory Blueprint」を「GTC 2026」で発表した。
このブループリントは、トレーニングデータの生成、拡張、評価を統合および自動化し、視覚AIエージェント、ロボティクス、自動運転車向けフィジカルAIモデルの開発を加速する。
開発者はオープンなNVIDIA Cosmos世界基盤モデルと主要なコーディングエージェントを活用し、限られたトレーニングデータを大規模で多様なデータセットに変換できる。
統合されたデータ生産エンジン
Physical AI Data Factory Blueprintは、モジュール型の自動化ワークフローを通じて、チームを生データからモデル対応のトレーニングセットへと導く単一のリファレンスアーキテクチャとして機能する。
主要な機能は以下の通り。
NVIDIA Cosmos Curator:大規模な実世界データセットおよび合成データセットを処理・改良・アノテーション
Cosmos Transfer:キュレーションされたデータを指数関数的に拡張・多様化し、実データとシミュレーション入力を増やすことで、レアケースやロングテールシナリオを含む幅広い環境・照明条件をカバー
NVIDIA Cosmos Evaluator(Cosmos Reason搭載):生成データを自動的に採点・検証・フィルタリングし、物理的な正確性とトレーニング適性を確保(GitHubで公開)
NVIDIAのOmniverseおよびシミュレーションテクノロジ担当バイスプレジデントであるレブ・レバレディアン氏は、「フィジカルAIはAI革命の次のフロンティアで、その成功は大量のデータを生み出す能力にかかっている。NVIDIAはクラウドリーダーと協力して、コンピューティングを次世代の自律システムやロボットに必要な高品質データへと変換する、新しいタイプのエージェント型エンジンを提供する。この新時代では、コンピューティングこそがデータだ」と述べている。
大規模なエージェント駆動オーケストレーション
多くのロボティクス開発者は、大規模なデータ生成に必要な複雑なAIインフラを立ち上げ、管理するための体制が整っていない。
オープンソースオーケストレーションフレームワークであるNVIDIA OSMOは、コンピューティング環境全体でこれらのワークフローを統合、管理し、手動タスクを削減することで、開発者がモデルの構築に集中できるようにする。
OSMOは現在、Claude Code、OpenAI Codex、Cursorなどの主要コーディングエージェントと統合されており、エージェントがリソースをプロアクティブに管理し、ボトルネックを解消し、大規模なモデルデリバリーを加速するAIネイティブな運用を実現する。
グローバルなフィジカルAIエコシステムの強化
クラウドサービスプロバイダーは、開発者が大規模なフィジカルAIを構築、展開するために必要な、アクセラレーテッドAIインフラ、機械学習運用、オーケストレーションサービスを提供する上で重要な役割を果たす。
Microsoft Azureは、Physical AI Data Factory BlueprintをオープンなフィジカルAIツールチェーンに統合し、GitHubで公開した。このブループリントは、Azure IoT Operations、Microsoft Fabric、Real-Time Intelligence、Microsoft Foundryなどのazureのサービスとの連携を提供し、フィジカルAIシステムのトレーニングと検証を迅速かつ大規模に行うためのエンタープライズグレードのエージェント駆動型ワークフローを実現する。
FieldAI、Hexagon Robotics、Linker Vision、Teradyne Roboticsは、認識、モビリティ、強化学習パイプライン全体でのデータ生成、拡張、評価の加速と拡大に向けて、AzureフィジカルAIツールチェーンを最初にテストする企業に含まれている。
NebiusはOSMOを自社のAIクラウドに統合し、開発者がブループリントを活用してニーズに合わせた本番環境対応のデータパイプラインを展開できるようにした。NebiusのインフラはNVIDIA RTX PRO 6000 Blackwell Server Edition GPUと超高速なオブジェクトストレージ、ネイティブデータの管理とラベリング、サーバーレス実行、ビルトインのマネージド推論を組み合わせ、フィジカルAIスタックをエンドツーエンドで支える。
初期ユーザーのMilestone Systems、Voxel51、RoboForceは、Nebiusインフラ上でブループリントを活用して、動画解析AIエージェント、自動運転車、そして産業用ヒューマノイドロボット向けのモデル開発を高速化している。
活用事例
NVIDIAは、Physical AI Data Factory Blueprintを活用してNVIDIA Alpamayoのトレーニングと評価を行っている。
NVIDIA Alpamayoは、ロングテール自動運転向けの、世界初のオープンなリーズニングベースの視覚言語行動モデル群である。
Skild AIは汎用ロボット基盤モデルの推進にこのブループリントを適用し、Uberは自動運転車開発を加速させるために活用している。
今後の展開
NVIDIA Physical AI Data Factory Blueprintは、4月にGitHubで公開される予定である。
NVIDIA創業者兼CEOのジェンスン・フアンによるGTC基調講演のリプレイ、およびセッションも視聴可能となっている。