最新のヒューマノイドがタオルを畳む動画を公開 この動画の見どころとポイント、技術的にすごい点を詳しく解説

Figureは、最新のヒューマノイド「FIGURE 02」が、複数枚のタオルを順次畳んでいく動画「Scaling Helix – Laundry」をYouTubeで公開した。Figureは、Microsoft、OpenAI Startup Fund、NVIDIA、ジェフ・ベゾス氏などから最大約2,250億円程度の資金調達をしている注目のスタートアップ企業。
この動画のポイントを、Figure社の解説を参考にしながら読み解いていこう。
ロボットがタオルを畳むのは難しい
実はロボットがタオルを畳むという作業は、見ため以上に難易度が高い作業とされている。
ロボットは特定の色や形のものを認識して掴んだり組み立てたりする動作は学習が比較的しやすいが、タオルは柔らかくて形状が定まっていない・変わりやすいため、連続的に変形するタオルの状況を常に正確に認識し、人間が無意識に行っている高度な判断をリアルタイムで再現する必要がある。
タオルはつかんだ瞬間から形が崩れ、新しいシワが発生、厚みや伸縮もその都度、変化する。ロボット(AI)は常にリアルタイムで形状を理解し、畳むための手順を判断し続けることが重要になる。ロボット(AI)はこの状況を、カメラやセンサーを駆使して理解し続けるが、光と影、しわなど、カタチや向きなどを惑わす要素がたくさんある。
■Scaling Helix – Laundry
■単一のニューラルネットワークで動作
この動画は、Figure社のヒューマノイド向けAIモデル「Helix」が、完全自律でタオルを畳む様子を撮影したもの。単一のニューラルネットワーク「Vision-Language-Actionモデル」を使って、「見る・理解する・動かす」すべてを処理しているとされている。同社によればこれは世界初の試みだという。
人間が自然におこなっている「タオルの隅をつかんで折る」「シワを伸ばす」などの動作をHelixは再現している。
更に注目すべき点は、このAIモデルが、タオルを畳むために専用にトレーニングされたAIモデルではなく、今まで同社が公開してきた「物流向けのAIモデルを転用」していることだ。物流向けのAIモデルからのタオルを畳む動作への変更したのは、トレーニングデータのみ(追加学習)であり、モデルの基本設計やハイパーパラメータには手を加えていないという。
同社の発表を含めた技術的な詳細が知りたい読者は、以下を参照してください。
物流ロボットがわずかな追加学習でタオル畳みをマスター
「Helix」は、もともと物流用途(荷物の向き変換)のために設計された一般的な 「Vision-Language-Action(VLA)モデル」。この動画は、その同じAIモデルをタオルを畳む作業(洗濯物たたみ)に応用した例。
「Figure Vision Language Action(VLA)モデル」は、物流現場での完全自律型パッケージの再配置を1時間にわたって実証した後、まったく異なる課題「洗濯物たたみ」に挑戦した。
「洗濯物たたみ」は人間にとっては単純な作業に見えるが、ヒューマノイドロボットにとっては極めて難易度の高い巧緻な操作タスクである。タオルは変形しやすく、形状が常に変化し、予測不能な曲がりやシワ、絡まりが生じやすい。
固定された形状を記憶することはできず、正確な把持すべきポイントも一つに定まらない。指先のわずかな滑りでも素材が寄ったり落ちたりするため、成功には正確な視覚認識だけでなく、指先の細やかな協調制御が不可欠である。
今回の成果は、複数の指を持つヒューマノイドロボットが「エンド・ツー・エンド」のニューラルネットワークを用いて「洗濯物たたみ」を完全自律で行った初の事例だ。
物流タスクで用いられたHelixの同一アーキテクチャを、モデルや学習のハイパーパラメータを一切変更せずにそのまま適用し、データセットのみを追加した点が特徴だ。
さらにHelixは「洗濯物たたみ」のほかに、目線を合わせる、視線を誘導する、学習した手のジェスチャーを使って人と自然なマルチモーダルな対話を行う能力も獲得している。
動画ではHelixが混ざったタオルの山から選び取り、開始時の配置に応じて折り方を調整し、複数枚を誤って掴んだ場合は余分なものを戻すなどの動作を示している。指先で縁をなぞり、角をつまみ、絡まったタオルをほどくなどの巧みな操作も行い、折りたたみを完成させている。
重要なのは、Helixがこれらの操作を物体レベルの明示的な認識に頼らずに実現している点である。タオルのような高変形性物体に対しては、物体認識の構築は脆弱で信頼性に欠けるため、Helixは視覚と言語の入力から滑らかで精密な運動制御までを「エンド・ツー・エンド」で処理している。
この成果は、同一の汎用アーキテクチャと物理プラットフォームが、産業用物流から家庭内の家事作業へとシームレスに応用可能であることを示している。今後、実世界のデータ収集を拡大することで、Helixの巧緻性や速度、汎化能力はさらに多様なタスクで向上すると期待されている。
Helixの開発チームは、汎用ヒューマノイド知能の最前線を切り拓くために人材を募集しているとのこと。
ロボスタでヒューマノイド関連のオンラインセミナーを開催(無料ご招待)
ロボスタでは9月のオンラインセミナーでヒューマノイドに関連するセミナーを2つ開催します。
ヒューマノイドや巨大ロボ最前線
ひとつは、ヒト型ロボットや巨大ロボット、4脚モビリティなどのロボット制御システム「V-Sido」を開発したアスラテックの吉崎氏がゲストの【オンラインセミナー】「動く・乗る・魅せる!巨大ロボの最前線」ロボット制御システムV-Sido開発者の吉崎航氏が描く AI時代のロボット制御の未来 です(2025年9月8日(月)開催、詳しくはこちら)。
ヒューマノイド研究の最前線、進化と課題、日本の現在位置
そしてもうひとつは、日本から世界へ向けて、ヒューマノイドを含むロボットのファウンデーションモデル(基盤モデル)の実現を目指す「AIロボット協会(AIRoA)」の尾形理事長がゲストの「ヒューマノイドの進化と課題、日本の現在位置 ~ヒューマノイド研究の最前線、AIロボット協会・尾形理事長に聞く」(2025年9月11日(木)開催、詳しくはこちら)です。どちらも無料ご招待キャンペーン中です。ぜひご参加下さい。
Figureのヒューマノイド、BMWの工場で作業する最新動画を公開
ヒューマノイドロボットが物流現場で働く未来像? Figureがパッケージを認識・選別する動画を公開 OpenAIやMicrosoft、NVIDIAなどが出資
2体のヒューマノイドが協働する動画をFigure社が公開 OpenAIやMicrosoft、NVIDIAなどが出資
ヒューマノイド関連記事
この記事を読んだ人におすすめ
-
2体のヒューマノイドが協働する動画をFigure社が公開 OpenAIやMicrosoft、NVIDIAなどが出資
-
ヒューマノイドロボットが物流現場で働く未来像? Figureがパッケージを認識・選別する動画を公開 OpenAIやMicrosoft、NVIDIAなどが出資
-
Figureのヒューマノイド、BMWの工場で作業する最新動画を公開
-
Figureのヒューマノイドが物流現場で作業する動画を公開 有識者や視聴者の意見と感想まとめ
-
話題のヒューマノイドが歩き回る!犬型ロボや警備ロボ、搬送ロボなどが集結 GMO AIRが社内向けロボット体験会を開催
-
【速報】話題のヒューマノイド「Unitree G1」軽快なダンス動画を公開!
-
話題のヒューマノイド「Unitree G1」ダンス動画の第2弾を公開 音楽を続けろ、ダンスを止めるな!
-
家庭用ヒューマノイド新型モデルの動画を1Xが公開 珈琲を入れ、掃除機をかける様子も 公式サイトが日本語対応
-
NVIDIA ヒューマノイド開発支援の最新情報 「Boston DynamicsやFigureなどの大手ロボット企業が導入」
-
触覚を持ったヒューマノイドの動画をSanctuary AIが公開 視覚で手を伸ばし触覚でつかむ 手探り「ブラインドピッキング」も披露
ABOUT THE AUTHOR /
神崎 洋治
神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。