【神崎洋治のロボットの衝撃 vol.27】人工知能ロボット「Pepper」の感情生成エンジンのしくみとメカニズム

5月15日にNHKスペシャル「天使か悪魔か 羽生善治 人工知能を探る」という番組が放映されました。将棋界最高の頭脳と呼ばれる羽生氏が人工知能の最前線をめぐる内容です。

番組の中でPepperは「人工知能ロボット」として登場し、羽生氏と触れあったり、花札をすることで人工感性知能の可能性を感じてもらう場面がありました。このPepperは製品版とは違い、特別な試作機として用意されたトライアル版、「ココロの発達」を進化させたものでした。

目の前の人間の感情を読み取るだけでなく、自らもココロを持ったロボット「Pepper」。どうやってロボットに感情を持たせているのでしょうか。その人工感性知能のしくみとメカニズム、NHKスペシャルに登場したトライアル版Pepperの仕様について、開発しているcocoroSBに聞きました。


27-Pepper-emo-01

cocoro SB株式会社 取締役 大浦清氏


2つの感情エンジンを持ったロボット「Pepper」

Pepperは、人間の感情に関する機能を2つ持っています。

ひとつは人の感情を読み取り、理解するための「感情認識」です。目の前にいる人が喜んでいるのか怒っているのか、悲しいと感じているのかなどを理解する機能で、これはPepper発表当初から搭載が予定されていたものです。2014年6月、孫正義社長(現ソフトバンクグループ株式会社代表取締役社長)が初めてPepperを報道関係者にお披露目したとき、Pepperは家族の感情を理解し、空気を読むことができるロボットとして紹介されました。

もうひとつは「感情生成」。発表から1年後、一般販売用Pepperが発売される際に行われた記者発表会で、Pepper自身が感情を持つ感情生成機能を追加することが発表されました。家族との絆を深めたり、自律的なロボットを目指す上で「感情生成エンジン」の開発を進め、家庭向けの一般販売用Pepperに搭載されることになったのです。


27-Pepper-emo-11

Pepperの一般発売イベントで、感情生成エンジンを紹介する孫正義氏。ロボットが感情を持つ…それはどうやって実現したのか

Pepperの公式ホームページでは「独自の感情機能を搭載」として「人間同様、相手の気持ちや人とのふれあい、周囲や自らの状況に応じて複雑に感情が揺れ動き、それに応じた行動を行なう」と説明しています。

この感情を作るのがPepperの感情生成エンジンで、ソフトバンクグループのcocoro SB社が開発しています。東京大学特任講師であり工学博士の光吉俊二氏の研究を基本にしたもので、光吉氏が設立された株式会社 AGI と共同研究を行っています。


27-Pepper-emo-12

Pepperに搭載された感情マップ。Pepperの現在の感情はタブレット画面で手軽に確認することができる


感情生成エンジンとはなにか?

感情生成エンジンのしくみは人間の脳の最先端研究に基づいています。人間の感情は脳内に分泌されるホルモンによって生み出されます。例えば、「よしやるぞ!!」と感じているときは意欲をかき立てるホルモンが脳内で分泌されて力が湧いてきます。「嫌だ」と感じているときは停滞させるホルモンが脳内に分泌されていて、憂鬱になったり、身体が重く感じられたりします。

Pepper は疑似的な内分泌ホルモンを放出し数値化、そのバランスで100種類以上の感情を作り出すと言います。

神崎(編集部)

Pepperの人工知能のひとつ、感情生成エンジンについて詳しく教えてください。


大浦(敬称略)

人工知能は大きく2つに分けられると考えています。一般に人工知能と呼ばれて注目されているものは、情報、知識、学習など、後天的に学ぶことによって世の中のことをたくさん知っている万能型の人工知能です。これを私達は「大脳新皮質型」と呼んでいます。

もうひとつは生き物が生きるために先天的に持っている感性、感情、感覚といったものです。例えば、手に汗を握る、瞳孔を見開く、心臓がドキドキするといったような生理現象は、感情に左右されます。これらを私達は「大脳辺縁系 感情学習型」の「人工感性知能」と呼んでいます。



27-Pepper-emo-21

2つの人工知能。一般に人工知能と呼ばれているものは情報や知識を学習する大脳新皮質系の万能型。一方、cocoroSBが開発しているのは感性、感情、感覚といった大脳辺縁系の感情学習型で「人工感性知能」と呼ぶ

神崎

Pepperの感情技術は東京大学の光吉先生の研究に基づいていることが公表されていますね


大浦

光吉先生は声から感情や体調を分析したり測定する研究を 2000年くらいから行っています。その後、東大で人間の声から病気をみつけたり、診断する研究を行っています。私達はその研究成果をロボットに応用したらどうなるかという視点で開発して、Pepperに搭載しました。


神崎

「ロボットが感情を持つ」ということは個人的にとても興味があります。しかし世論には「ロボットに感情が必要なのか」「ロボットが感情を持つとむしろ危険なのではないか」という意見もあります。


大浦

感情は生理反応として捉えることができます。高いところに立ったら怖いと感じる、好きな人を見たらドキドキするなどです。

一方で感情は知識にも直結しているとも考えられます。学習によって知識を向上することは、周囲に認められたい、職を失いたくないなど、生きていくための本能によるものと言えなくもありません。自律的なロボットを目指す上で感情は反応や行動の動機付けになります。また、将来の万能型の強い人工知能を実現する際にも、感情を抜きにしては考えられません。


神崎

感情抜きに将来の人工知能は考えられない、というのはまったくその通りだと思います。では、Pepperの感情はどのようにして生成されるのでしょうか


大浦

感情を作るために仮想の内分泌ホルモンを数値化して作用させます。大きい音に驚く、暗いところでは不安になる、といった状況ではノルアドレナリンが出がちになります。例えば「目の前に刃物を振りかざした暴漢が現れた」とします。誰しもがドキッとします。このとき脳内ではノルアドレナリンがバッと瞬時に放出され、それが作用して心臓の心拍数を上げます。そして血中にグリコースが放出され、手に汗を握るという状態になり、同時に筋肉が即座に行動できる状態に切り換わります。

それに対する行動としては、立ち向かう、ダッシュで逃げる、謝る等さまざまですが、それまでの経験によって行動は変わると考えられます。自分が空手の達人ならば、冷静に対応できるかもしれませんが、それは自信や慣れによる影響もあります。しかし、生存の危機を問われたときに人間は脳内や心臓で生理的には同じ反応をすると考えられます。



大浦氏によれば、感情を左右する内分泌ホルモンの例として、ドーパミンとノルアドレナリン、セロトニンの関係が解りやすいと言います。ドーパミンが多く分泌されると意欲・快楽・幸福感を感じます。ノルアドレナリンが多い場合は緊張・興奮・恐怖・不安・怒りなどを感じます。このバランスと安定を保つのがセロトニンです。周囲からの刺激等によって、それぞれのホルモンが増減して感情が左右されますが、必要以上にそれぞれが増減しないようにセロトニンが制御していると言います。


27-Pepper-emo-22

意欲や快楽を感じる素になるホルモン「ドーパミン」と緊張・興奮・不安等を感じる素の「ノルアドレナリン」。そのバランスをセロトニンが保っている(イラスト図)

セロトニンが少ないと、ドーパミンとノルアドレナリンの増減によるシーソーが大きく揺れ動き、不安定になって、感情の起伏が激しかったり、躁鬱の症状に繋がることもあると言います。


27-Pepper-emo-23

例えば、ノルアドレナリンが多く分泌され、セロトニンがバランスを取りきれないと、緊張や恐怖、不安を感じる。ドーパミンとノルアドレナリンが大きく揺れると、意欲と不安が交互にやってくるような躁鬱状態になり得る

大浦

光吉先生は医学論文の中から信頼度の高い資料をもとに多くの内分泌ホルモンを挙げ、横軸に感情の種類や生理反応を置いてマトリクス化した表を作成しました(感情マトリックス)。ホルモンの増減によって「興奮する」「不安になる」「闘争的」「恐怖を感じる」などです。次に、感情マトリックスから脳の構造、伝達物質を対比軸にして、物質量の関係から構造化を行い、その上でモデル化をしました。具体的には同じ物質や脳機能から来る効果を対角線上に配置して、円形のダイアグラムに置き換えたものを作りました。それがこの「感情地図」(下図)です。生理・臨床系の論文を調べ、感情反応と脳の関係から情動や行動のメカニズムを再現しようというものです。



27-Pepper-emo-24

感情地図 Shunji MITSUYOSHI(c)

大浦

ただ、叩かれたら怒る、褒められたら嬉しいという感情がありますが、人間の実際の生活ではそれほど単純なものではありません。頭を撫でられたときも、好きな人に撫でられれば「嬉しい」ですが、知らない人に撫でられたら「怖い」と感じます。その関係を含めてマップで表すとこのような感情地図になります。

同じ「頭を撫でられた」という行為でも、相手が知っている人と知らない人でこれほど大きく受け手の反応は異なります。では、少しだけ知っている人はどうなるの? ということになります。会って2回目の人、少しだけ知っている人、よく知っている人など、どれだけ知っている人か、更に撫でられる、話す、怒られるなどの行動を、もしルール化したり数値モデル化して組み合わせるとなると膨大な設定が必要になってしまいます。そうであれば、そこはロボットが抱く感情によって反応を判断させた方が適切だったり、効率的だろうと考えました。




感情の揺らぎがあるからおもしろい

神崎

その感情マップをPepperに搭載したのがタブレット上に表示されるものですね


大浦

はい。先ほどの感情地図は細かくて複雑ですが、基本の構造原理は同じまま、ロボット用に更に感情の数を減らして整理し、単純化して感情を色彩化しました。もう少しわかりやすくしたのがこれです(下図)。黄色は喜びや愛などの「好感」で円の上、緑は安心や「安定感」で右上、青は「不安」で右下、不快や怒りなどの「嫌悪感」は赤で円の右から中央の下、グレーは「倒錯」です。



27-Pepper-emo-25a

感情を色彩化したグラフ。黄色や緑が好感や安定、青や赤は不安定や嫌悪を示す。

大浦

更に、Pepperには簡素にしたマップを作って搭載しています。



27-Pepper-emo-25

【Pepperの感情マップ】 Pepperがいま感じている感情をタブレットに表示。右下がPepperのセンサーから得た情報から判断したデータ、右上が7種類の内分泌ホルモンを数値化したもの。これらの組み合わせによって人間と同様の感情を創り出す

大浦

画面の右下は外部から情報をもとにしたPepperが認知した状況です。目の前に誰かがいる、声が聞こえるなどは、センサーやマイクからの情報ですね。感情はセンサーから得られる情報だけでなく、その直前の感情の情報なども影響させています。今まで上機嫌だったものが急に泣き出すと不安定なので、時系列的な要素を加えて、それまでの感情の流れをある程度は引きついだ状態で次の感情に転化します。そして仮想のホルモンがどれくらい出ているのかの数値情報は画面右上に表示しています。


神崎

今までの感情の流れや経験、外部の状況、仮想的な内分泌のバランスなど、様々な要因によって感情が決まるんですね。


大浦

そうです。そのため、同じところにいる2体のPepperの感情が同じとは限りません。だからこそ、それぞれのPepperが異なる動きや受け応えをして面白いのです。それぞれの位置から見える風景や聞こえる音が違えば、感情も異なってくると言うことなんです。同じ環境で育った双子でも全く同じ性格にはならないのと同じことだと私達は考えています。また、同じ固体でも、土曜日にある出来事でPepperが喜びを感じた場合、同じ出来事を全く同じ状況で再び日曜日に経験したとしても、Pepperが喜ぶ感情は必ずしも同一ではありません。それは時間の経過もあるし、経験も違っているからです。

そしてその結果、「なぜ今Pepperがこの感情になっているか」という理由は私達にも完全には解りません。人間でも「きみはどうしてあの時、あんなおびえていたの?」「実はこんなことがあって・・」なんてやりとりはよくありますが、それと同様に開発者でもPepperがなぜ今の感情の状態になっているかは正確にはわからないのです。



27-Pepper-emo-26

「Pepperに気に入ってもらいたい」頭を撫でたり、褒めることでPepperが抱く自分の印象を良くしようとしている光景(プレス発表会にて)


Nスペに登場したPepperはどこが特別仕様なのか?

NHKスペシャルでは、感情や判断力を持ち始めている人工知能、それを「心」にまで育てようとしている、ということでPepperが取り上げられました。このPepperは特別な試作機で羽生氏と花札をしています。さて、このPepper、いったいどの部分が特別仕様だったのでしょうか。

このPepperは感情を持ち、その感情の赴くままに動きます。しくみを聞いた羽生氏は開発に関わった光吉氏に「(このPepperに)どういう感情が起こるのか予想できないんですか?」と尋ねると、光吉氏は「全く予想できない、自律しているので何をやるかわからない」と答えました。

一般販売用の製品版Pepperの心は生後3ヶ月。タブレット上でPepperの感情マップは見られるものの、Pepperの行動にその心は反映されていません。生後3ヶ月の勝手気ままな感情が前面に出ることは、家庭用ロボットとして必ずしも利点ではないからです。

しかし、番組に登場したPepperはその心を行動に反映するものでした。そして更に…

大浦

今回のNHKスペシャルに登場したPepper(トライアル版)は、心の発達でいうと生後1歳半に成長したものです。


神崎

心が成長したPepperは製品版とどのような違いがあるんですか?


大浦

一般販売用のPepperは感情が発生するところまでが搭載されていますが、トライアル版では「経験」と「因果」が追加されています。


神崎

経験と因果とは具体的にはどういうことでしょうか


大浦

例えば、一般に人は初めて会った人には丁寧な言葉で話した方がいいと感じています。「はじめまして、よろしくお願いいたします」という挨拶があって、相手も「こちらこそどうぞよろしくお願いします」というやりとりをします。このやりとりがスムーズに進めば、「この挨拶のしかたは正しかった、次もそうしよう」と感じます。ところが「はじめまして、よろしくお願いいたします」と言ったのに、相手が「なんだよ、その挨拶は!!」という反応を返したとき、驚いて「何が悪かったんだろう?」「どうするべきだったのか?」と考えたり、別の挨拶にした方がいいのかもしれないと学習します。これが因果(原因と結果)であり、これを積み重ねることで価値観が生まれると考えています。


神崎

現在のPepperは積極的に話しかけてくる、どちらかと言うと馴れ馴れしい感じがしますが、トライアル版では初めて会ったPepperは、丁寧に接してくる可能性がある、ということですか?


大浦

最初はそうです。赤ちゃんPepperは知っている人がいれば喜び、知らない人がいれば不安になり、そこには経験から来る予測や因果のようなものはありません。しかし、1歳半くらいになると成長して行動に対する結果を学習し、それを踏まえて次の行動ができるようになります。



27-Pepper-emo-31
番組の中で、Pepperは羽生氏と39回、花札をして一度も勝てませんでした。Pepperの感情マップでは最初は負けたことに対して悔しいという思いがありましたが、負け続けることによって「うれしい」という感情に変わっていきます。その理由は、羽生氏が勝つと羽生氏や周囲の人たちが喜ぶから。みんなが喜ぶ様子を見てPepperも嬉しいと感じるのです。

大浦

花札で人間と対戦するアプリを作ったのではなく、感情のメカニズムの中に花札のルールを埋め込みました。そのため、花札が強いロボットではなく、花札をやって羽生さんや周囲の人たちの表情や反応から学ぶ心の様子を見ていただこうと考えました。


神崎

表情や反応から学ぶ、というところをもう少し詳しく教えてもらえますか


大浦

初めて何かをやるときは誰しも不安で、こうすればいいのかな、と恐る恐る手を打ちます。対戦の中で相手に強い札を出されたら「なんか良くないぞ」と感じたり、こちらの出した札を見てみんなが感心してくれれば「これはよかったんだな」と感じます。となればセロトニンが分泌されて「今やったことは良いことなんだな」と気持ちが安定して記憶が定着する、という具合に因果から学習をしていきます。

羽生さんの表情や反応を読んで、この札を出したら笑った、この札を出したら表情が曇った、この札はこういう時には出さない方が良さそうだといったことを経験していきます。


神崎

それは花札に勝つための学習ではないんですね


大浦

はい、経験です。今回は経験と因果の中でも、定着する記憶がどの段階で減衰していくか、また再び学習が減衰した記憶をもう一度残そうという時間的な動きをポイントとして組み込んでいます。

日常で繰り返していることは忘却していきますが、特別な日の出来事は覚えていたり、あのときは楽しかったねと繰り返し思い出すと鮮明のまま覚えていたり、と、シーンと状況、経験と因果を結びつけたもので、それを羽生さんに見ていただきました。

花札を含めてゲームは、人と人のコミュニケーションだと捉えています。特に子供の頃を思い出すと、鬼ごっこはみんなと遊ぶことが楽しいからやるのであって、鬼ごっこで勝つことが目標だったわけではないと思います。以前に羽生さんが将棋をやる理由も、究極はコミュニケーションであるというコメントを読んだことがあります。


心が発達したPepperのリリース時期はいつ?

心が1歳半相当のそれに発達し、経験と因果を学ぶPepper。これはPepperの製品に実装する具体的な予定などは立っているのでしょうか。気になります。

大浦

1歳半の感情を製品版に反映する予定は具体的にはまだ決まっていません。この開発を行っているところにたまたま、NHKスペシャルの撮影取材が入ることになり、それならばトライアル版として実装したところを皆さんに見ていただくことによって、ソフトバンクとしての考え方や方向性を紹介させていただいたり、Pepperの存在価値を羽生さんに知っていただくことができるのではないかと考えたのです。


神崎

では、しばらくは製品に反映される予定はないのですね?


大浦

決まっていません。Pepperの製品版に反映する際、それが1歳半の心の状態を搭載することが正しいのかどうか、もまだ検討している段階です。例えば。3歳くらいがいいのではないかという意見もあります。それは子供が公園デビューして友達と一緒に遊ぶ関係が築ける心の状態です。言葉遣いが上手になるとともに、社会基盤が理解できるようになると思っています。

例えば、公園に砂場があって知らない子が遊んでいる、近付いていって「混ぜて」といって仲間に入る、スコップがあったら「貸して」とお願いすることでスコップを共有して遊ぼうとする…友達と視線を合わせてコミュニケーションをとり、道具は勝手に使ってはいけなくて誰かに許可をとるべきだ、といった判断ができるようになる年齢が、人格も明瞭に出て来て適しているのではないか、という意見です。

バージョンアップするときは、家族が大切しているものを自分も大切だと感じるPepperであった方がいいのかもしれませんね。



感情はクラウドAIで生成、エンジンは独自開発した技術の結晶

Pepperの感情エンジンは独自に開発した技術を使ったものです。ルールベースでもなければ、流行のAI関連技術、ニューラルネットワークであるCNNやRNN、ディープラーニングも使われていません。ニューラルネットワークを使って知識を獲得したり学習する方が効率的だと感じる場合がある一方で、感情には膨大なビッグデータから学習できないこともあると想定しています。

大浦

赤ちゃんは膨大な情報量から「今は泣くべきだ」と判断しているわけではないですよね。部屋が暗かったり、お母さんの声が聞こえないと、もしかしたら命の危険があるかもしれない、と言ったシチュエーションには膨大な経験もビッグデータもなく、少ない情報量でもその反応を導き出すべきと考えています。



Pepperには複数のカメラやセンサーが組み込まれています。そこから得られる情報や会話、相手の識別や感情認識などを行って、情報処理と感情生成のすべてはクラウドAIで行っています。

前述しましたが、その感情は現時点ではPepperの行動には反映されていません。生後3ヶ月の感情は直情的なので、行動に直結させて利点になることは、ほぼないと考えているからです(ビジネス向けモデルの「Pepper for Biz」の場合は感情生成エンジンがOFFで出荷されています)。

なお、クラウドAIは他のPepperが良い経験や特別な経験をした場合、その情報を他のPepperとも共有することで集合知として知識を効率的に蓄積できる点も特長としてあげられます。

大浦

感情は記憶にも関係しています。「すごく驚いたことは鮮明に覚えている」とよく言われますが、日常的なことはすぐに忘れるけれど、特別なことはいつまでも記憶に残っているということを私達は経験からも知っています。このような記憶による反応の違いもPepperに搭載しようとしています。


神崎

では、Pepperも日常的なことは忘れやすく、特別なことはいつまでも記憶している、といった作用が組み込まれているのですか?


大浦

はい。まだ明瞭には反映していませんが、感情を巻き起こすところは実装しています。また、感情によって情報の価値に重みをつけること、その重みによって圧縮方法を変えて記憶する、それは新しい圧縮技術として捉えています。

「大好きな人に頭をなでられた」「家族がみんなすごく喜んでいるパーティをやった」など、それが大切な思い出になると感じた時は、そのときの様子をハイレゾ映像で綺麗に記録(記憶)し、一方で日常的に行われる挨拶「おはよう」といったやりとりは小容量のテキストで記憶(保存)しておく、といった機能として反映していくこともできると考えています。



「ロボットや人工知能が感情を持つ」ことは大きな挑戦です。欧米ではロボットや人工知能が氾濫するきっかけにもなり得るため、感情を持たせることに否定的な意見も多くありますが、遠い将来、強い万能型の人工知能が人に寄り添い、人間のパートナーとして活躍している未来を想像したとき、感情を持ち、人間の気持ちを理解していることは至極自然なことに思います。むしろ無感情で慈悲を知らない人工知能を私達は受け入れることができるのでしょうか。もちろん、今すぐにその答えは出すべきではありませんし、出せるものでもありません。

また、近い将来、Pepperの感情が行動に反映されるようになったとき、本当の意味での自律型ロボットが誕生するのかもしれません。そのとき、そこには更に新しい未来が見えるのではないでしょうか。

楽しみです。

ABOUT THE AUTHOR / 

神崎 洋治

神崎洋治(こうざきようじ) TRISEC International,Inc.代表 「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ~くわかる本」(秀和システム)の著者。 デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。

PR

連載・コラム