コラムニュースロボットの衝撃石黒浩研究室 AI音声アシスタントコミュニケーションロボットロボット Commu Sota ヴイストン株式会社大阪大学日本科学未来館

ロボットとの途切れない会話をどう実現するか? 音声認識不足を補う「複数体で連携して人と話すロボット」石黒共生HRIプロジェクト

2020年8月11日 By 神崎洋治

ロボスタ読者の皆さんは、複数体のロボットを相手に会話をした経験があるでしょうか。

現状ではまだ、ロボットとの会話に対して良い印象を持っている人は多くはないだろう。むしろ、経験した人の中には「会話が続かない」「同じ回答ばかり返される」「話しかけても無視された」など、ネガティブな意見も多く見られ、技術的にも音声認識や会話技術はまだ発展途上であることは明らかだ。
一方、将来的にロボットが社会に溶け込んでいくためには、ロボットの会話技術の向上は必要不可欠。それは、人間が質問した内容に対してロボットが正確に回答を返す、という実質的な回答精度の向上だけでなく、人間がロボットとの会話を違和感なく行えるようにしたり、人がロボットとの会話が快適だと感じられるいろいろな仕掛けの研究も大切となってくる。

そのひとつの手法が複数体のロボットによる会話。

複数のロボットが会話に参加したり、ロボット同士が会話している中で、人はどう感じるのか (動画「JST ERATO ISHIGURO Symbiotic Human-Robot Interaction Project」より)

以前、会話ロボットについて誰かを取材したときに「1対1で話しているときは、このロボットは話が全然通じないな、と思ったものだけど、同じロボット3台の中に自分が入って会話したとき、絶対的なアウェイ感がして、ロボットの会話に自分が合わせないといけない、とさえ感じた」というコメントを聞いたのを覚えている。人間同士と全く同じ会話レベルをロボットとの会話に求めることが正解なのか、ロボットとの会話にもニューノーマルが必要なのか、筆者もそんなことを考えることがある。

複数体で連携して人と話すロボット、大阪大学の吉川准教授の講演

8月6日に「JST ERATO 石黒共生ヒューマンロボットインタラクションプロジェクト」の研究の経過報告や成果発表のためのシンポジウムがオンラインで開催された。
その中で、大阪大学の基礎今学研究科の准教授、吉川雄一郎氏は「複数体で連携して人と話すロボット」についての発表を行なった。

吉川氏はこのプロジェクトではロボットと人との「実用的な会話」を研究している。そのひとつ「対話を途切れさせない」という点で複数体のロボット活用に着目している。複数体のロボットによる会話の研究自体は以前から継続して行われてきたもので、古くは2015年に公開されたヴイストン社との共同研究で、SotaとCommUによるものが知られている。

■ 動画 CommU（コミュー）とSota（ソータ）のプロモーションビデオ

途切れない対話の実現

吉川氏は「ロボットが人と適切に会話するには、質問の内容やその背後にある意図を正確に認識して応えを返す必要があるが、現在のロボットの認識能力の精度は十分とは言えない。ただ、人間同士であってもひと言で意図を認識し合って会話しているわけでなく、誤解をしながらも会話を進めていって理解し合うもの。そこで”認識は不完全である”ということを前提に”途切れない対話を実現するにはどうしたらよいか”ということに焦点を当てた」という。

会話ロボット複数体の利点

また、複数体のロボットとの会話は「人が発言しなくても対話が提供できる」「一体よりも強い説得力がある」といった利点もある。
複数体に同じ意見を持たせることで説得力が増すこともあるし、異なる意見を持たせることで、人の意見を引き出しやすい利点もあるかもしれない。

無視された感が低い、人が話さなくても会話が進む

「ロボットが音声を認識していない」にもかからわず、複数体のロボットでは音声認識をしているかのような対話感が実際に得られるのか、そのような検証実験が行われた。実験の結果として、1体よりも2体のロボットと会話することで無視された感が低く、会話がしやすい、と感じることがわかった。

例えば、このようなケース。

ロボット1「ラーメンは好きですか?」
人「好きです」
ロボット2「日曜日は何をしていますか?」

この会話の流れを1体のロボットで行った時は、人は自分の回答をロボットが無視したと感じたり、ロボットは言葉を認識していない、会話そのものが破綻していると感じるが、2体が別々に質問したことで、人は「ロボットたちが”日曜日は何をしていますか”という質問を聞きたくなったんだな」と好意的に解釈するケースが多い、としている。

ロボットの会話の認識率が高いと感じた

同様の実験は日本科学未来館で「ロボット実験室」として、一般来場者を対象に実施された(2016年7～10月)。その結果、約3か月間で10,103人が体験し、そのうち89%にあたる9,962人の来場者が最後まで体験してくれたという(5分間の長い会話にもかかわらず)。また、小中学生を対象にした実験結果では1体より3体のロボットと会話したほうが「ロボットの認識率が高いと体感した」と評価した。

「どれくらいの割合で音声認識できていたと感じましたか」という問いに対して、1体のロボットは50%程度という回答だったが、複数体の場合は約85%という回答が得られ、同じ会話内容でも複数体のロボットの方が、人は会話がスムーズに行われていると感じている確率が高いことがわかった。

ドコモと高齢者施設でも実験

NTTドコモとの共同実験を高齢者施設でも行った。「子供の頃の話」や「旅行の話」などを高齢者に対してロボットが聞きたがる、という会話促進の実験。施設利用者の高齢者にとっても、複数体のロボットとの会話では良い結果が得られた。施設のスタッフは高齢者の方が「普段より積極的に会話していた」とポジティブに評価した。

高齢者の場合は、会話に消極的だったり、話し始めるのに時間がかかったりすることがあるが、人が話さない場合でもロボット同士が勝手に会話することで話は途切れないし、人も好きなタイミングで会話に参加すればよい、という利点もある。

音声認識を向上させたり、質問の回答精度を上げることはもちろん大切だが、それと併行して、複数体のロボットを使うなどして、あいまいな応答でも違和感なく会話を継続することは、重要な応答技術のひとつとして必要になっていくだろう。

■ 参考複数台のロボットによる報道発表

2015年1月20日に日本科学未来館にて開催された、「CommU（コミュー）」、「Sota（ソータ）」の報道発表

ABOUT THE AUTHOR /

神崎洋治

神崎洋治（こうざきようじ） TRISEC International,Inc.代表「Pepperの衝撃! パーソナルロボットが変える社会とビジネス」(日経BP社)や「人工知能がよ～くわかる本」(秀和システム)の著者。デジタルカメラ、ロボット、AI、インターネット、セキュリティなどに詳しいテクニカルライター兼コンサルタント。教員免許所有。PC周辺機器メーカーで商品企画、広告、販促、イベント等の責任者を担当。インターネット黎明期に独立してシリコンバレーに渡米。アスキー特派員として海外のベンチャー企業や新製品、各種イベントを取材。日経パソコンや日経ベストPC、月刊アスキー等で連載を執筆したほか、新聞等にも数多く寄稿。IT関連の著書多数(アマゾンの著者ページ)。