
NVIDIA は2025年3月18日、GPUとディープラーニングの世界的なイベント「GTC 2025」で、ヒューマノイド・ロボットの開発を支援する基盤技術の概要を発表した。これには汎用型ヒューマノイドの思考とスキルの開発を支援する、世界初のフル・カスタマイズ可能なオープンな基盤モデル「NVIDIA Isaac GR00T N1」(アイザック・ジーアールゼロゼロティー:通称グルート)が含まれている。
また、その他の技術には、シミュレーション・フレームワークや合成データを生成する「NVIDIA Isaac GR00T Blueprint」、Google DeepMindとDisney Researchと共同で開発中のロボット開発のために構築されたオープンソースの物理エンジン「Newton」が含まれることも発表した。
■NVIDIA Isaac GR00T N1: An Open Foundation Model for Humanoid Robots
世界的な労働力不足の課題対策へ「GR00T N1」
3月18日から利用可能となった「GR00T N1」は、NVIDIAが事前トレーニングを行い、ロボット開発者向けにリリースする予定のフル・カスタマイズ可能なモデルファミリー。これにより、5,000万人以上と推定されている世界的な労働力不足の課題対策になるとしている。
NVIDIAの創業者/CEOのジェンスン・フアン (Jensen Huang)氏は次のように述べた。
NVIDIA、フアン氏
汎用ロボティクスの時代が到来しました。「NVIDIA Isaac G00T N1」、新たなデータ生成、ロボット学習フレームワークにより、世界中のロボティクス開発者は、AI時代の次のフロンティアを切り開くでしょう
GR00T N1の「System 1」と「System 2」
「GR00T N1」基盤モデルは、人間の認知の原理に着想を得た、デュアルシステム・アーキテクチャを特徴としている。「System 1」は、人間の反射的、直感を反映した素早い思考の行動モデル。「System 2」は、じっくりと考え、理路整然とした意思決定を行うためのモデル。
■How Robots Learn to Be Robots: Training, Simulation, and Real World Deployment
視覚言語モデルを活用したSystem 2は、環境と受信した指示に基づいて思考し、行動をプランニングする。その後System 1が、これらのプランを正確で連続的なロボット動作に変換する。System 1は、人間によるデモンストレーション・データと「NVIDIA Omniverse」 プラットフォームによって生成された膨大な量の合成データでトレーニングされている。
「GR00T N1」は、つかむ、片方または両方のアームでモノを動かす、モノを片方のアームから別のアームに移動させるといった共通のタスクを標準的に装備している。長いコンテクストと一般的なスキルの組み合わせを必要とする複数のステップを実行することができる。これらの機能は、マテリアル・ハンドリングや、包装、検査などのさまざまなユース ケースに適応できる。
開発者と研究者は、特定のヒューマノイド・ロボットまたはタスク向けに実データあるいは合成データを使って「GRO00T N1」を事後に追加トレーニングすることができる。
GTCの基調講演でフアン氏は、「GR00T N1」を基盤に構築された事後トレーニング済みのポリシーを使用する 1X Technologiesのヒューマノイド ロボットが、家庭用の整頓タスクを自律的に行うデモを行なった。このロボットの自律機能は、1Xと NVIDIAのコラボレーションにより行ったAIトレーニングの成果だとした。
1X Technologies の CEO である Bernt Børnich 氏は次のように述べている。
1X、Børnich 氏
ヒューマノイドの未来は、適応力と学習にかかっています。 GR00T N1 モデルは、ロボットの思考とスキルに大きな飛躍をもたらします。最小限の事後トレーニング データで、NEO Gamma 上に完全に展開することができました。これにより、ツールではなく仲間として、意味のある数多くの手法で人を支援することができるロボットを作るという私たちのミッションが前進します
「GR00T N1」に早期アクセスしている世界中の主要なヒューマノイドの開発企業として、Agility Robotics、Boston Dynamics、Mentee Robotics、NEURA Robotics があげられている。
NVIDIA、Google DeepMind、Disney Research が物理学にフォーカス
NVIDIA は Google DeepMind と Disney Research とのコラボレーションにより、より高い精度で複雑なタスクを処理する方法をロボットに学習させる新しいオープンソース物理エンジンである Newton の開発について発表した。
NVIDIA Warp フレームワーク上に構築された Newton は、ロボット学習に最適化されており、Google DeepMind の MuJoCo や NVIDIA Isaac Lab などのシミュレーション フレームワークと互換性を持つ。さらに、この3社は、Newtonが Disneyの物理エンジンを活用できるようにする計画だ。
Google DeepMind と NVIDIA は共同で MuJoCo-Warp を開発している。これにより、ロボティクスの機械学習ワークロードが 70倍以上に高速化することが予想され、Google DeepMind の MJX オープンソース ライブラリと Newton を通じて開発者が利用できるようになる。
Disney Research は Newton を使用して、ロボティクスのキャラクター・プラットフォームを進化させる最初の企業の1つ。これにより、GTCの基調講演でフアンが紹介した、スターウォーズに触発された、表情豊かなBDXドロイドのような次世代のエンターテイメント・ロボットを実現させるとしている。
■BDXドロイド登場は2時間29分くらい
Walt Disney Imagineering Research & Development の Kyle Laughlin 氏は次のように述べている。
Disney、Laughlin 氏
BDX ドロイドは始まりに過ぎません。私たちは、これまで世界になかった方法でより多くのキャラクターに命を吹き込むことを約束します。Disney Research、NVIDIA、Google DeepMind のコラボレーションは、そのビジョンのカギとなる部分です。これにより、これまで以上に表現力があり、魅力的な新世代のロボット キャラクターを作り出し、Disney にしかできない方法でゲストとつながることができます
NVIDIA と Disney Research は、Intrinsic とともに、ロボティクス・データ・ワークフローのための OpenUSD パイプラインとベストプラクティスを構築するためにさらなるコラボレーションを発表した。
膨大なデータでロボティクスのトレーニングを推進
ロボット開発には、大規模で多様で高品質なデータセットが重要で、現在、データ取得に多額の時間と費用がかかっているのが実状だ。合成操作モーション生成のための「NVIDIA Isaac GR00T Blueprint」がこの課題の解決に役立つ、としている。
「Omniverse」および「Cosmos Transfer」の世界基盤モデル上に構築されたこのブループリントにより、開発者は少量の人間のデモンストレーションから操作タスク向けに指数関数的に大量の合成モーションデータを生成する。
このブループリントで利用可能な最初の要素を使用して、6,500時間、9か月分の人間によるデモデータに匹敵する78万もの合成された軌跡を、NVIDIAはわずか11時間で生成した。その後、この合成データを実データと組み合わせて、NVIDIAはGR00T N1のパフォーマンスを実データのみ使用したときと比較して40%向上させた。
開発者コミュニティに価値あるトレーニングデータをさらに提供するために、NVIDIAはより大規模なオープンソースのフィジカルAIデータセットの一部としてGR00T N1データセットをリリースする。このデータセットも「GTC」で発表されている。
NVIDIA GR00Tの提供について
NVIDIA GR00T N1トレーニングデータとタスク評価シナリオが Hugging Face と GitHub からダウンロードできるようになった。合成操作モーション生成のための「NVIDIA Isaac GR00T Blueprint」は、build.nvidia.com での双方向デモとしても利用可能。GitHub からもダウンロードできる。
同じく GTC で発表された NVIDIA DGX Spark パーソナル AI スーパーコンピューターは開発者にすぐに使えるシステムを提供し、膨大なカスタム プログラミングを行わずとも、新しいロボット、タスク、環境向けに GR00T N1 の機能を拡張する。
なお、Newton 物理エンジンは今年後半にリリース予定。
Google DeepMindが生成AI「Gemini」をヒューマノイドで活用 会話・三目並べ・文字パズルの動画を公開 Apptronikと連携
ついにベールを脱いだGoogleの生成AI×ロボット「Gemini Robotics」が重視する3つのポイントを解説
NVIDIA 量子コンピューティングのイベント「Quantum Day」をGTC2025で開催 フアンCEOが量子の未来を語る
この記事を読んだ人におすすめ
-
東京ロボティクスが新型「Torobo」のモデルデータを「NVIDIA Isaac Sim」と「Google DeepMind MuJoCo」対応形式で公開
-
NVIDIA CEOの基調講演 トヨタや安川電機、セブン&アイなどの導入事例を紹介 ロボットやAIで日本企業と連携を強調 AI Summit Japan
-
NVIDIAのイベントで生成AI対応「ugo +edge AI」を展示 ロボットに生成AIをどう活用する? ugoの松井CEOに聞く
-
NVIDIA 量子コンピューティングのイベント「Quantum Day」をGTC2025で開催 フアンCEOが量子の未来を語る
-
ラピュタロボティクスの自在型自動倉庫「ラピュタ ASRS」がNVIDIA Jetsonで高速化 2023年の自動倉庫市場は87億米ドル
-
NVIDIA ヒューマノイド開発支援の最新情報 「Boston DynamicsやFigureなどの大手ロボット企業が導入」
-
アクセンチュアとNVIDIAが生成AIの普及で連携強化を発表 「AI Refinery」でカスタムAIエージェント構築、産業用AI、ソブリンAIの提案を推進
-
NVIDIA 次世代ヒューマノイド開発支援プロジェクトについて聞く 「GR00T」の3つのワークフローを発表
-
NVIDIAがデジタルツイン基盤「Omniverse」をロボティクス、自律走行車、ビジョンAIなどに拡張する生成AIモデルと「ブループリント」を発表
-
NVIDIA ヒューマノイドや自動運転などフィジカルAI開発を支援する世界基盤モデル「Cosmos」をCESで発表