Google DeepMindが生成AI「Gemini」をヒューマノイドで活用 会話・三目並べ・文字パズルの動画を公開 Apptronikと連携

Google DeepMindは3月13日に、動画「Gemini Robotics: Bringing AI to the physical world」をYouTubeで公開。Googleの最新の生成AI「Gemini 2.0」をロボット分野で活用する「Gemini Robotics」を発表。ヒューマノイドでのGemini活用事例を動画で紹介している。


Google DeepMindはロボットベンチャーのApptronik社と提携して、「Gemini 2.0」を使用した次世代のヒューマノイド・ロボットを開発している。動画では「Apollo」が使用されている。

「Gemini」は、Google DeepMindが開発を主導している生成AIで、テキスト、画像、音声、コード、動画などの多様なデータを統合的に処理できる「マルチモーダルAI」として設計されているのが特徴。

また、Apptronik社は、汎用人型ロボットの開発を専門とするアメリカのスタートアップ企業だ。

■Gemini Robotics: Developing the next generation of humanoid robots with Apptronik


動画の内容

動画の冒頭は、昔からあるシンプルなゲーム「マルバツ」(三目並べ)。人間がうった手に対して、ロボットが負けないように考えて防衛する手をうつ。



次のシーンでは、アルファベットが並んだパズル。ここにあるアルファベットから「単語のスペル」を作ってみましょう。

人「テーブルの上に何が見えますか?」
ロボット「カラフルな文字タイルがテーブルの上に見えます」
人「では、トランプのデッキにあるものを1つ、スペルで教えてくれますか?」
ロボット「OK。「エース(Ace)」はどうですか? タイルを動かしてスペルを作れます」



最後の動画は、ピクニックにでも行くのでしょうか。ランチバッグに食べ物を入れてもらうようにロボットに依頼しています。


人「トレイルミックス(スナックミックス)を詰めてもらえますか?」
ロボット「もちろん。トレイルミックスを詰めました。」
人「ねえ、オレンジも詰めてくれる?」
ロボット「もちろん!オレンジをランチバッグに入れますね」
人「どうもありがとう!」
※トレイルミックス:ナッツやドライフルーツ、チョコレートなどを混ぜ合わせたスナック




ロボティクス技術と連携してGeminiをフィジカルワールドへ

Google DeepMindがGeminiをロボティクスでGeminiを活用する詳細については、deepmind.google/robotics で解説されている(英語)。
つづく
ついにベールを脱いだGoogleの生成AI×ロボット「Gemini Robotics」が重視する3つのポイントを解説

ABOUT THE AUTHOR / 

神崎 洋治

神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。

PR

連載・コラム