Google DeepMindは3月13日に、動画「Gemini Robotics: Bringing AI to the physical world」をYouTubeで公開。Googleの最新の生成AI「Gemini 2.0」をロボット分野で活用する「Gemini Robotics」を発表。ヒューマノイドでのGemini活用事例を動画で紹介している。
Google DeepMindはロボットベンチャーのApptronik社と提携して、「Gemini 2.0」を使用した次世代のヒューマノイド・ロボットを開発している。動画では「Apollo」が使用されている。
「Gemini」は、Google DeepMindが開発を主導している生成AIで、テキスト、画像、音声、コード、動画などの多様なデータを統合的に処理できる「マルチモーダルAI」として設計されているのが特徴。
また、Apptronik社は、汎用人型ロボットの開発を専門とするアメリカのスタートアップ企業だ。
■Gemini Robotics: Developing the next generation of humanoid robots with Apptronik
動画の内容
動画の冒頭は、昔からあるシンプルなゲーム「マルバツ」(三目並べ)。人間がうった手に対して、ロボットが負けないように考えて防衛する手をうつ。

次のシーンでは、アルファベットが並んだパズル。ここにあるアルファベットから「単語のスペル」を作ってみましょう。
ロボット「カラフルな文字タイルがテーブルの上に見えます」
人「では、トランプのデッキにあるものを1つ、スペルで教えてくれますか?」
ロボット「OK。「エース(Ace)」はどうですか? タイルを動かしてスペルを作れます」


最後の動画は、ピクニックにでも行くのでしょうか。ランチバッグに食べ物を入れてもらうようにロボットに依頼しています。

ロボット「もちろん。トレイルミックスを詰めました。」
人「ねえ、オレンジも詰めてくれる?」
ロボット「もちろん!オレンジをランチバッグに入れますね」
人「どうもありがとう!」
※トレイルミックス:ナッツやドライフルーツ、チョコレートなどを混ぜ合わせたスナック
ロボティクス技術と連携してGeminiをフィジカルワールドへ
Google DeepMindがGeminiをロボティクスでGeminiを活用する詳細については、deepmind.google/robotics で解説されている(英語)。
つづく
「ついにベールを脱いだGoogleの生成AI×ロボット「Gemini Robotics」が重視する3つのポイントを解説」
Lumosがヒューマノイドと触覚センサーの動画公開 丘を走り、壊れものを掴む、打ち上げ花火を手持ちでぶっぱなす様子も
ボストン・ダイナミクスのヒューマノイド「電動アトラス」自動車製造工場で働くためトレーニング中!ラボ内部の動画を公開
家庭用から宇宙まで!? インドのMuksがヒューマノイドを近々リリースすると発表
UBTECH、複数台のヒューマノイドがEVメーカー「Zeekr」のスマート工場で働く動画を公開 Zeekrは2025年に日本市場へ参入予定
Unitreeのヒューマノイド、今度はスピンキックを披露!「720°スピンキック、衝撃を聞け!」
触覚を持ったヒューマノイドの動画をSanctuary AIが公開 視覚で手を伸ばし触覚でつかむ 手探り「ブラインドピッキング」も披露
NVIDIA ヒューマノイド開発支援の最新情報 「Boston DynamicsやFigureなどの大手ロボット企業が導入」
ヒューマノイドロボットが物流現場で働く未来像? Figureがパッケージを認識・選別する動画を公開 OpenAIやMicrosoft、NVIDIAなどが出資
ヒューマノイド関連記事(ロボスタ)







