Googleは2026年4月14日(火)、ロボット向けの身体化推論モデル「Gemini Robotics-ER 1.6」を発表。同モデルはGemini APIおよびGoogle AI Studio経由で開発者向けに提供が開始された。

身体化推論の強化と空間認識の精度向上
Gemini Robotics-ER 1.6は、前世代の「Gemini Robotics-ER 1.5」および「Gemini 3.0 Flash」と比較して、空間推論・物理推論の能力を大幅に向上させたモデルである。

主な強化点は、指差し(ポインティング)、カウント、タスク完了検知(サクセスディテクション)の3領域だ。
ポインティング機能では、画像内の複数オブジェクトを正確に識別・カウントする能力が向上した。
例えば、ハンマー2本、はさみ1本、ペイントブラシ1本、プライヤー6本を正確に識別できる一方、画像内に存在しないオブジェクトを誤って指示することもない。前世代のGemini Robotics-ER 1.5では、ハンマーやペイントブラシの数を誤認識し、存在しない一輪車を幻覚(ハルシネーション)として生成するケースが確認されていた。

また、複数カメラ視点を統合するマルチビュー推論も強化された。ロボットには頭上カメラや手首搭載カメラなど複数の視点が存在するが、同モデルはこれらの映像を統合し、遮蔽物や動的環境下でもタスクの完了状態を正確に判断できる。

Boston Dynamicsとの協業で実現した「計器読み取り」機能
今回の新機能として特に注目されるのが「計器読み取り(Instrument Reading)」だ。この機能はBoston Dynamicsとの緊密な協業を通じて発見・開発されたユースケースである。

産業施設には温度計、圧力計、化学品サイトグラスなど、常時監視が必要な計器類が多数存在する。
Boston Dynamicsのロボット製品「Spot」がこれらの計器を巡回して画像を撮影し、Gemini Robotics-ER 1.6がその画像を解析・読み取る仕組みだ。
計器読み取りには複雑な視覚推論が必要となる。
針の位置、液面レベル、目盛りの間隔、単位テキストの読み取り、さらには複数の針が異なる桁を示すケースへの対応など、多岐にわたる要素を統合的に処理しなければならない。
同モデルはエージェンティックビジョン(視覚推論とコード実行の組み合わせ)を活用し、画像のズームイン、ポインティング、コード実行による比率計算を段階的に行うことで高精度な読み取りを実現している。


Boston DynamicsのSpot担当バイスプレジデント兼ゼネラルマネージャーのMarco da Silva氏は「計器読み取りなどの機能と、より信頼性の高いタスク推論により、Spotは現実世界の課題を完全に自律的に認識・理解・対応できるようになる」と述べている。
安全性でも前世代を上回る性能を達成
安全性の面でも、Gemini Robotics-ER 1.6は歴代最高水準を達成している。実際の負傷報告に基づくテキストおよび動画シナリオでの危険認識精度において、ベースラインのGemini 3.0 Flashと比較してテキストで+6%、動画で+10%の向上を記録した。
また、物理的安全制約への準拠能力も大幅に改善されており、「液体を扱わない」「20kgを超えるオブジェクトを持ち上げない」といった制約条件に基づいた安全な意思決定が可能となっている。

同社は開発者向けにColab(サンプルコード集)を公開しており、モデルの設定方法や身体化推論タスクへのプロンプト例を提供している。
また、特定用途での機能不足を感じる開発者に対しては、10~50枚のラベル付き画像を提出することで、今後のリリースに向けた機能改善への協力を呼びかけている。
ロボスタ・オンラインセミナー情報
「AIエージェント × ヒューマノイド 生成AI時代の「Pepper+」徹底解説」
ロボスタではオンラインセミナーを定期的に開催しています。
4月後半はソフトバンクロボティクスが登壇し、「AIエージェント × ヒューマノイド 生成AI時代の「Pepper+」徹底解説」を開催します。

ソフトバンクロボティクスは「Pepper」を2014年に発表、2015年に発売開始、世界初の量産型ヒューマノイドとしてギネス世界記録にも認定されました。身長約120cmの親しみやすいデザインを活かし、会話やダンス、歌といったエンターテインメント用途に加え、観光、介護、教育、小売、イベント、オフィス受付など幅広い分野で社会実装が進められてきました。
このPepperの進化版モデルであり、AIエージェント機能を中核に据えた新世代のロボットプラットフォーム「Pepper+」を2026年に発表しています。生成AIやAIエージェントを活用したヒューマノイドの社会実装の知見を紹介します。
セミナーの詳細とお申し込みはこちら。
人とロボットが共生するこれからの住環境 MWが語る 住宅×フィジカルAI×ロボティクス最前線
5月には株式会社MWの成田修造氏を迎え、「人とロボットが共生するこれからの住環境 MWが語る 住宅×フィジカルAI×ロボティクス最前線」を開催します。
フィジカルAIやヒューマノイドが話題になる中、「ロボットやAIが溶け込む住宅とは何か」という、近い未来に起こる住環境の変革について解説していただきます。

フィジカルAIやロボットが住宅環境にどのような進化を与えるのか。斬新な発想とデザイン、AIやロボットの活用法やビジネスモデルを紹介します。
セミナーの詳細とお申し込みはこちら。
アイリスグループのロボット事業拡大戦略 ~AIロボット市場の勝ち筋を探る
5月26日(火)には「実装」と「販売」の両輪でAIロボット市場を開拓している、アイリスオーヤマを筆頭としたアイリスグループによる「アイリスグループのロボット事業拡大戦略 ~AIロボット市場の勝ち筋を探る」を開催。

同グループの実績は、清掃ロボットを中心に導入企業7,000社以上、累計出荷台数は22,000台以上にのぼり、急成長を遂げています。
セミナーでは、アイリスオーヤマの大山社長が登壇、ロボット事業戦略についてご講演頂きます。続いて、東京大学大学院情報システム工学研究室(JSK)出身で、元Googleのロボットエンジニアであり、同社傘下のシンクロボの小倉社長より製品スペック等の詳細をご説明頂きます。
セミナーの詳細とお申し込みはこちら







