ボストン・ダイナミクスとトヨタ(TRI)、ヒューマノイド向け大規模行動モデルの開発状況を動画で公開

ボストン・ダイナミクス(Boston Dynamics)は、ヒューマノイド「Atlas」向けの大規模行動モデル(LBM)の開発進捗状況の一部をYouTube動画「Getting a Leg up with End-to-end Neural Networks | Boston Dynamics」で公開した。
この技術は、トヨタ自動車の研究機関、トヨタ・リサーチ・インスティテュート(TRI)とボストン・ダイナミクスのAI研究チームが共同研究しているもの。
ボストン・ダイナミクスとTRIは一般用途のヒューマノイド(人型)ロボットの開発加速を目的とした共同研究契約を2024年10月16日に発表している。
ボストン・ダイナミクスは「Atlasが長期的な操作タスクを実行できるよう、エンドツーエンドの言語条件付きポリシーを構築しています」とコメントしている。
■動画
エンドツーエンド(End-to-End)とは
AIロボット分野での「エンドツーエンド(End-to-End)」というワードは、入力から出力までを一つの統合されたモデルやシステムで直接処理すること。
従来のロボット制御では、「認識(カメラで物体を検出する)」「理解(検出した物体の位置や意味を解析)」「計画(どう動くかのルートやアクションを計算)」「制御(モーターを動かす)」という工程で行われていた。
一方「エンドツーエンド」は、画像や音声などのデータを入力して直接、「行動(モーターのトルク値や移動指令など)」を出力する。中間のプロセスを設けずに学習・実行する方式。
ロボットでは、「カメラ画像を入力」して「ロボットアームの関節角度」を生成する、「マイク音声を入力」して「ロボットの返答動作」を直接決めるなどが例となる。
「人間が細かくルールや中間処理を設計しなくても強化学習で最適化できる」「大規模データでトレーニングすれば、高度な行動が獲得できる」などのメリットがある。
ロボスタでヒューマノイド関連のオンラインセミナーを開催(無料ご招待)
ロボスタでは9月のオンラインセミナーでヒューマノイドに関連するセミナーを2つ開催します。
ヒューマノイドや巨大ロボ最前線
ひとつは、ヒト型ロボットや巨大ロボット、4脚モビリティなどのロボット制御システム「V-Sido」を開発したアスラテックの吉崎氏がゲストの【オンラインセミナー】「動く・乗る・魅せる!巨大ロボの最前線」ロボット制御システムV-Sido開発者の吉崎航氏が描く AI時代のロボット制御の未来 です(2025年9月8日(月)開催、詳しくはこちら)。
ヒューマノイド研究の最前線、進化と課題、日本の現在位置
そしてもうひとつは、日本から世界へ向けて、ヒューマノイドを含むロボットのファウンデーションモデル(基盤モデル)の実現を目指す「AIロボット協会(AIRoA)」の尾形理事長がゲストの「ヒューマノイドの進化と課題、日本の現在位置 ~ヒューマノイド研究の最前線、AIロボット協会・尾形理事長に聞く」(2025年9月11日(木)開催、詳しくはこちら)です。どちらも無料ご招待キャンペーン中です。ぜひご参加下さい。
Figureのヒューマノイド、BMWの工場で作業する最新動画を公開
ヒューマノイドロボットが物流現場で働く未来像? Figureがパッケージを認識・選別する動画を公開 OpenAIやMicrosoft、NVIDIAなどが出資
2体のヒューマノイドが協働する動画をFigure社が公開 OpenAIやMicrosoft、NVIDIAなどが出資
ヒューマノイド関連記事