NVIDIAが発表したロボティクス・自動運転の「フィジカルAI」や「AIエージェント」向けの最新AIモデルが話題に

NVIDIAは、エンタープライズAIエージェントおよび、ロボティクス・自動運転などのフィジカルAI分野向けに、2つの最新AIモデル「Nemotron」と「Cosmos Reason」を発表した。
「Nemotron」は、精度と効率性に優れた企業向けAIエージェントの構築を可能にし、「Cosmos Reason」はロボットやAIエージェントが記憶や物理社会を理解し、次に取るべき行動を推論できる視覚言語モデルとして活用される。



複雑な業務をこなす企業向けAI「Nemotron」

Nemotronは、複数の工程が必要な業務を、一連の流れとして理解して自動で進行できる。多段階かつ複雑なタスク、例えば「調査」「まとめ」「提案」などのプロセスを処理するための高度な推論能力を備える。単なる情報収集だけでなく、背景を理解した上で迅速に最適な推論を出す「思考の速さ」が強みとしている。

効率的な文章や指示の生成を実現するハイブリッドアーキテクチャや量子化技術を採用しており、性能と省資源化を両立している。ZoomやCrowdStrikeなどの企業も採用しているという。
新モデル「Nemotron Nano 2」と「Llama Nemotron Super 1.5」は、それぞれのサイズカテゴリで最高精度を誇り、深い思考と迅速な応答を実現する、という。

Nemotronモデルが同じ時間内で、また同じコンピューティング予算で最高のリーズ二ング精度を実現し、1ドルあたり最高の精度を実現していることを示している


現実世界を理解する視覚言語モデル「Cosmos Reason」

Cosmos Reasonは、70億パラメータを持つ、視覚と言語を融合した視覚言語モデル。ロボットやAIエージェントが記憶や物理社会の法則を理解して、次に取るべき行動を推論できる。物理法則や物体の永続性、時間と空間の関係性を理解し、ロボットや視覚AIが人間のように状況を判断し行動できるよう設計されている。これにより、ロボティクスの意思決定、映像分析、トレーニングデータの評価など、多様な用途で高い性能を発揮する。



大手企業による採用事例

これらのモデルは、CrowdStrike、Uber、Zoom、Magna、NetAppなどの業界大手に採用されている。サイバーセキュリティ、通信、自動運転、物流、製造など幅広い分野で業務効率化に寄与する。例えばZoomはNemotronを用いたAIアシスタントで複雑なタスク管理を実現し、UberはCosmos Reasonを活用して自動運転車の挙動分析や映像データの要約を行っている。


クラウドサービスでの利用拡大

「Nemotron」と「Cosmos Reason」は、NVIDIAのNIMマイクロサービスとして提供され、Amazon Bedrock、Azure AI Foundry、Google Vertex AIなど主要クラウドプラットフォームでも利用可能になる予定。これにより、企業は安全かつ効率的に高度なAIエージェントを導入し、業務の自動化・高度化を推進できる。

SNSでは、NVIDIAの最近の一連の発表を受けて「NVIDIAはロボットの“考える力”を本気で変える気だろうか・・注目すべき」「物理世界を理解するAIなんて、SFが現実になる日も近い」「Omniverseと組み合わせたら無限の可能性を感じる」「フィジカルAIの一歩先を行く存在。CESでNVIDIAのCEOによる”ドクター・ストレンジ発言”にも納得」などの意見が交わされた。

「Nemotron」と「Cosmos Reason」は、「AIエージェント」および「ロボット」や「モビリティ」など、フィジカルAI分野での知能を飛躍的に向上させ、産業界におけるAI活用の新たな可能性を切り拓く存在となる可能性を持っている。

ABOUT THE AUTHOR / 

ロボスタ編集部
アバター画像

ロボスタ編集部では、ロボット業界の最新ニュースや最新レポートなどをお届けします。是非ご注目ください。

PR

連載・コラム

チャンネル登録