NVIDIA「ロボティクスのChatGPT」宣言!フィジカルAI向け新技術をCESで発表

NVIDIA「ロボティクスのChatGPT」宣言!フィジカルAI向け新技術をCESで発表

NVIDIAは、ラスベガスで開催中のCESにおいて、フィジカルAI向けの新たなオープンモデル、フレームワーク、AIインフラを発表した。Boston Dynamics、Caterpillar、Franka Robotics、Humanoid、LG Electronics、NEURA Roboticsなど、グローバルパートナー各社による汎用ロボットも披露された。

新技術がロボット開発ライフサイクル全体を高速化

今回発表された新技術は、ロボット開発ライフサイクル全体にわたるワークフローを高速化し、多様なタスクを迅速に学習できる汎用スペシャリストロボットの構築を可能にする。NVIDIAの創業者でCEOのジェンスン・フアン氏は「ロボティクスにとってのChatGPTの瞬間が到来した」と述べ、フィジカルAIにおけるブレークスルーが全く新しい応用分野を切り開いていると強調した。

NVIDIAのJetsonロボティクスプロセッサ、CUDA、Omniverse、そしてオープンフィジカルAIモデルからなるフルスタックが、グローバルなパートナーエコシステムによるAI駆動型ロボティクスの実現を支援する。

学習とリーズニング向け新オープンモデル群

NVIDIAは、開発者が多大なリソースを要する事前学習を回避し、次世代AIロボットや自律マシンの開発へ集中できるよう、Hugging Faceで提供される新しいオープンモデル群を構築した。

主なモデルとして、NVIDIA Cosmos Transfer 2.5およびNVIDIA Cosmos Predict 2.5が発表された。これらはフィジカルAI向けシミュレーションにおける物理ベースの合成データ生成とロボットポリシー評価を可能にする、オープンで完全にカスタマイズ可能な世界モデルだ。

NVIDIA Cosmos Reason 2は、オープンなリーズニング視覚言語モデルで、インテリジェントマシンが人間のように物理世界を見て、理解し、行動することを可能にする。NVIDIA Isaac GR00T N1.6は、オープンなリーズニング視覚言語行動モデルであり、ヒューマノイドロボット向けに構築されている。全身制御を可能にし、NVIDIA Cosmos Reasonを活用してより優れたリーズニングと文脈理解を実現する。

Franka Robotics、NEURA Robotics、Humanoidでは、GR00T対応ワークフローを活用し、ロボットの新しい動作のシミュレーション、トレーニング、検証を行っている。Salesforceでは、Agentforce、Cosmos Reason、NVIDIAの動画検索および要約用Blueprintを組み合わせて、自社ロボットが撮影した映像データを分析し、インシデント解決時間をこれまでの半分に短縮している。

医療分野では、LEM SurgicalがNVIDIA Isaac for HealthcareとCosmos Transferを活用し、NVIDIA Jetson AGX ThorとHoloscanを搭載したDynamis手術ロボットの自律アームをトレーニングしている。XRLabsでは、エクソスコープをはじめとする外科用スコープにThorとIsaac for Healthcareを活用し、外科医にリアルタイムAI分析によるガイダンス機能をもたらしている。

ロボット開発向け新フレームワーク

ロボットのトレーニングと評価にはスケーラブルなシミュレーションが不可欠だが、現在のワークフローは断片化され、管理が困難なままだ。NVIDIAは、GitHubで新たなオープンソースフレームワークを公開した。

NVIDIA Isaac Lab-Arenaは、GitHubで公開されているオープンソースフレームワークであり、シミュレーション環境における大規模なロボットポリシー評価とベンチマークのための協調システムを提供する。評価層とタスク層はLightwheelとの緊密な連携の下で設計されている。Isaac Lab-ArenaはLiberoやRobocasaといった業界をリードするベンチマークと接続し、テストを標準化することで、物理ハードウェアへの展開前にロボットスキルが堅牢かつ信頼性が高いことを保証する。

NVIDIA OSMOは、クラウドネイティブなオーケストレーションフレームワークであり、ロボット開発を単一の使いやすいコマンドセンターに統合する。OSMOは、開発者がワークステーションから複数のクラウドインスタンスに至るまで、異なるコンピューティング環境全体で合成データ生成、モデルトレーニング、そしてソフトウェアインザループのテストなどのワークフローを定義、実行することを可能にし、開発サイクルを加速する。

OSMOは、Hexagon Roboticsなどのロボット開発者によって活用され、Microsoft Azure Robotics Acceleratorツールチェーンに統合されている。

Hugging Faceとの協力でオープンソース開発を加速

ロボティクスは現在、Hugging Faceにおいて最も急速に成長している分野であり、活発なオープンソースコミュニティの中で、NVIDIAのオープンモデルとデータセットがトップのダウンロード数を占めている。

このコミュニティを強化するため、NVIDIAはHugging Faceと協力し、オープンソースのIsaacおよびGR00Tテクノロジを主要なオープンソースロボティクスフレームワークであるLeRobotに統合している。これにより、統合されたソフトウェアおよびハードウェアツールへの効率的なアクセスを提供し、エンドツーエンドの開発を加速する。このコラボレーションにより、NVIDIAを活用する200万人のロボット開発者とHugging Faceの1,300万人のAI開発者からなるグローバルコミュニティが結びつく。

GR00T N1.6とIsaac Lab-ArenaがLeRobotライブラリで利用可能になり、ファインチューニングや評価が簡単にできるようになる。Hugging Faceのオープンソースヒューマノイド Reachy 2はNVIDIA Jetson Thorロボティクスコンピューターとの完全な相互運用が可能で、開発者はGR00T N1.6を含むあらゆるVLAを実行できる。

Hugging Faceのオープンソース卓上ロボット Reachy Miniは、NVIDIA DGX Sparkと完全な相互運用が可能となり、NVIDIAの大規模言語モデルやローカルで動作する音声およびコンピュータービジョン向けオープンモデルを活用したカスタム体験を構築する。

Blackwell搭載Jetson T4000モジュールを提供開始

NVIDIA Jetson Orinユーザーにコスト効率に優れた高性能アップグレードパスを提供する新しいNVIDIA Jetson T4000モジュールは、NVIDIA Blackwellアーキテクチャを自律型マシンおよび汎用ロボティクスにもたらす。1,000個購入時の単価は1,999ドルとなる。1,200 FP4 TFLOPSと64GBメモリを備え、前世代の4倍の性能を発揮し、省電力が求められる自律システムに最適な70W内に構成可能だ。

今月後半に提供開始予定のNVIDIA IGX Thorでは、産業用エッジ領域にロボティクスを拡張し、エンタープライズソフトウェアのサポートと機能安全に対応した高性能AIコンピューティングを提供。Archerは IGX Thorを使用してAIを航空分野に導入し、航空機の安全性、空域統合、自律動作対応システムにおける重要な機能を前進させている。

AAEON、Advantech、ADLINK、Aetina、AVerMedia、Connect Tech、EverFocus、ForeCR、Lanner、RealTimes、Syslogic、Vecow、YUANなどのパートナーは、エッジAI、ロボティクス、組み込みアプリケーション向けにThor搭載システムを提供している。

さらに、CaterpillarがNVIDIAとの協業を拡大し、建設および鉱業分野の設備や作業現場に高度なAIと自律性を導入する。CaterpillarのCEOであるJoe Creed氏は、1月7日(水)の基調講演において、NVIDIAのロボティクスおよびエッジAI担当バイスプレジデントであるディープゥ・タラ氏と共に詳細を発表する予定だ。

《ロボスタ編集部》

関連タグ

ロボスタ編集部

ロボスタ編集部

ロボスタ編集部では、ロボット業界の最新ニュースや最新レポートなどをお届けします。是非ご注目ください。

ニュースレター配信中!無料会員登録をしていただくと、定期的に配信されるニュースレターを受け取ることができます。また会員限定の記事を閲覧することも可能になります。

編集部おすすめの記事

特集